Item archiveteam_archivebot_go_20240601185149_b3f8fda7

Filename	Size
1bis19.de-inf-20240601-171349-4nqcg-00001.warc.gz	5394609658	download job
1bis19.de-inf-20240601-171349-4nqcg-00001.warc.os.cdx.gz	428506	download
archiveteam_archivebot_go_20240601185149_b3f8fda7.cdx.gz	421386	download
archiveteam_archivebot_go_20240601185149_b3f8fda7.cdx.idx	423	download
archiveteam_archivebot_go_20240601185149_b3f8fda7_files.xml	0	download
archiveteam_archivebot_go_20240601185149_b3f8fda7_meta.sqlite	159744	download
archiveteam_archivebot_go_20240601185149_b3f8fda7_meta.xml	1045	download
bitsavers.org-inf-20240524-133925-4rbbx-00293.warc.gz	5460396424	download job
bitsavers.org-inf-20240524-133925-4rbbx-00293.warc.os.cdx.gz	1722	download
catalog-legacy.osaarchivum.org-inf-20240519-093136-3c0u6-00225.warc.gz	5734494094	download job
catalog-legacy.osaarchivum.org-inf-20240519-093136-3c0u6-00225.warc.os.cdx.gz	214984	download
data.worldpop.org-inf-20240515-011446-esx2x-00433.warc.gz	5752250788	download job
data.worldpop.org-inf-20240515-011446-esx2x-00433.warc.os.cdx.gz	3539	download
dspace.nplg.gov.ge-inf-20240518-160308-crlmb-00666.warc.gz	5387204484	download job
dspace.nplg.gov.ge-inf-20240518-160308-crlmb-00666.warc.os.cdx.gz	101129	download
dspace.nplg.gov.ge-inf-20240518-160308-crlmb-00667.warc.gz	5377049593	download job
dspace.nplg.gov.ge-inf-20240518-160308-crlmb-00667.warc.os.cdx.gz	114255	download
europepmc.org-inf-20240212-215511-8x1ov-03392.warc.gz	5369342890	download job
europepmc.org-inf-20240212-215511-8x1ov-03392.warc.os.cdx.gz	190305	download
fee.org-inf-20240430-133014-1vzyr-00090.warc.gz	5368731129	download job
fee.org-inf-20240430-133014-1vzyr-00090.warc.os.cdx.gz	1060661	download
git-old.silicon.moe-inf-20240601-183455-a9gzz-aborted-00000.warc.gz	545168731	download job
git-old.silicon.moe-inf-20240601-183455-a9gzz-aborted-00000.warc.os.cdx.gz	120356	download
git-old.silicon.moe-inf-20240601-183455-a9gzz-aborted-wpull.log.gz	86256	download
git-old.silicon.moe-inf-20240601-183455-a9gzz-aborted.json	243	download job
lists.endsoftwarepatents.org-inf-20230425-035520-douri-00231.warc.gz	5383141383	download job
lists.endsoftwarepatents.org-inf-20230425-035520-douri-00231.warc.os.cdx.gz	2572287	download
media.sourceruns.org-inf-20240601-184853-87w14-00000.warc.gz	5980	download job
media.sourceruns.org-inf-20240601-184853-87w14-00000.warc.os.cdx.gz	277	download
media.sourceruns.org-inf-20240601-184853-87w14-meta.warc.gz	3526	download job
media.sourceruns.org-inf-20240601-184853-87w14-meta.warc.os.cdx.gz	47	download
media.sourceruns.org-inf-20240601-184853-87w14.json	251	download job
poetaster.org-inf-20240601-181322-3t9yw-00000.warc.gz	542338833	download job
poetaster.org-inf-20240601-181322-3t9yw-00000.warc.os.cdx.gz	276514	download
poetaster.org-inf-20240601-181322-3t9yw-meta.warc.gz	180486	download job
poetaster.org-inf-20240601-181322-3t9yw-meta.warc.os.cdx.gz	47	download
poetaster.org-inf-20240601-181322-3t9yw.json	241	download job
tigerprints.clemson.edu-inf-20240531-031631-4eucb-00075.warc.gz	5373522335	download job
tigerprints.clemson.edu-inf-20240531-031631-4eucb-00075.warc.os.cdx.gz	17455	download
tigerprints.clemson.edu-inf-20240531-031631-4eucb-00076.warc.gz	5397013271	download job
tigerprints.clemson.edu-inf-20240531-031631-4eucb-00076.warc.os.cdx.gz	20059	download
transfer.archivete.am-shallow-20240601-183147-9qexv-00000.warc.gz	27320	download job
transfer.archivete.am-shallow-20240601-183147-9qexv-00000.warc.os.cdx.gz	261	download
transfer.archivete.am-shallow-20240601-183147-9qexv-meta.warc.gz	3561	download job
transfer.archivete.am-shallow-20240601-183147-9qexv-meta.warc.os.cdx.gz	47	download
transfer.archivete.am-shallow-20240601-183147-9qexv.json	299	download job
transfer.archivete.am-shallow-20240601-183946-7vq36-00000.warc.gz	35593	download job
transfer.archivete.am-shallow-20240601-183946-7vq36-00000.warc.os.cdx.gz	264	download
transfer.archivete.am-shallow-20240601-183946-7vq36-meta.warc.gz	3546	download job
transfer.archivete.am-shallow-20240601-183946-7vq36-meta.warc.os.cdx.gz	47	download
transfer.archivete.am-shallow-20240601-183946-7vq36.json	299	download job
transfer.archivete.am-shallow-20240601-183954-cmvq9-00000.warc.gz	7783	download job
transfer.archivete.am-shallow-20240601-183954-cmvq9-00000.warc.os.cdx.gz	264	download
transfer.archivete.am-shallow-20240601-183954-cmvq9-meta.warc.gz	3534	download job
transfer.archivete.am-shallow-20240601-183954-cmvq9-meta.warc.os.cdx.gz	47	download
transfer.archivete.am-shallow-20240601-183954-cmvq9.json	307	download job
ubuntu.de-inf-20240601-183644-doinz-00000.warc.gz	28810188	download job
ubuntu.de-inf-20240601-183644-doinz-00000.warc.os.cdx.gz	13135	download
ubuntu.de-inf-20240601-183644-doinz-meta.warc.gz	10738	download job
ubuntu.de-inf-20240601-183644-doinz-meta.warc.os.cdx.gz	47	download
ubuntu.de-inf-20240601-183644-doinz.json	237	download job
upic.buzzinglight.com-inf-20240601-183428-95bqr-00000.warc.gz	7325789	download job
upic.buzzinglight.com-inf-20240601-183428-95bqr-00000.warc.os.cdx.gz	5524	download
upic.buzzinglight.com-inf-20240601-183428-95bqr-meta.warc.gz	6273	download job
upic.buzzinglight.com-inf-20240601-183428-95bqr-meta.warc.os.cdx.gz	47	download
upic.buzzinglight.com-inf-20240601-183428-95bqr.json	252	download job
urls-transfer.archivete.am-2024-05-31_repo.mongodb.org.txt-shallow-20240531-221208-cinrn-00099.warc.gz	5389460252	download job
urls-transfer.archivete.am-2024-05-31_repo.mongodb.org.txt-shallow-20240531-221208-cinrn-00099.warc.os.cdx.gz	29566	download
urls-transfer.archivete.am-2024-05-31_repo.mongodb.org.txt-shallow-20240531-221208-cinrn-00100.warc.gz	5402574523	download job
urls-transfer.archivete.am-2024-05-31_repo.mongodb.org.txt-shallow-20240531-221208-cinrn-00100.warc.os.cdx.gz	9628	download
urls-transfer.archivete.am-apemoonline.org_dismissed_errors.txt-shallow-20240601-181954-706cf-00000.warc.gz	25623285	download job
urls-transfer.archivete.am-apemoonline.org_dismissed_errors.txt-shallow-20240601-181954-706cf-00000.warc.os.cdx.gz	54385	download
urls-transfer.archivete.am-apemoonline.org_dismissed_errors.txt-shallow-20240601-181954-706cf-meta.warc.gz	33629	download job
urls-transfer.archivete.am-apemoonline.org_dismissed_errors.txt-shallow-20240601-181954-706cf-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-apemoonline.org_dismissed_errors.txt-shallow-20240601-181954-706cf-urls.txt	25059	download
urls-transfer.archivete.am-apemoonline.org_dismissed_errors.txt-shallow-20240601-181954-706cf.json	368	download job
urls-transfer.archivete.am-coupons.indoormedia.com_skipped_offsite_urls.txt-shallow-20240601-183422-19ks8-00000.warc.gz	29185628	download job
urls-transfer.archivete.am-coupons.indoormedia.com_skipped_offsite_urls.txt-shallow-20240601-183422-19ks8-00000.warc.os.cdx.gz	96312	download
urls-transfer.archivete.am-coupons.indoormedia.com_skipped_offsite_urls.txt-shallow-20240601-183422-19ks8-meta.warc.gz	52859	download job
urls-transfer.archivete.am-coupons.indoormedia.com_skipped_offsite_urls.txt-shallow-20240601-183422-19ks8-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-coupons.indoormedia.com_skipped_offsite_urls.txt-shallow-20240601-183422-19ks8-urls.txt	37651	download
urls-transfer.archivete.am-coupons.indoormedia.com_skipped_offsite_urls.txt-shallow-20240601-183422-19ks8.json	394	download job
wgrd.com-inf-20240507-204447-beib9-00209.warc.gz	5368778275	download job
wgrd.com-inf-20240507-204447-beib9-00209.warc.os.cdx.gz	1619406	download
www.israelnetz.com-inf-20240530-143107-6voby-00019.warc.gz	1114616430	download job
www.israelnetz.com-inf-20240530-143107-6voby-00019.warc.os.cdx.gz	207236	download
www.israelnetz.com-inf-20240530-143107-6voby-meta.warc.gz	41127243	download job
www.israelnetz.com-inf-20240530-143107-6voby-meta.warc.os.cdx.gz	47	download
www.israelnetz.com-inf-20240530-143107-6voby.json	246	download job
www.nwzonline.de-inf-20240430-212702-4ue3l-00041.warc.gz	5737448312	download job
www.nwzonline.de-inf-20240430-212702-4ue3l-00041.warc.os.cdx.gz	3808965	download
www.polskieradio.pl-inf-20231221-075717-djrf2-01807.warc.gz	6032081444	download job
www.polskieradio.pl-inf-20231221-075717-djrf2-01807.warc.os.cdx.gz	1757	download
www.stoppt-die-e-card.de-inf-20240601-082315-29qfh-00038.warc.gz	5588030258	download job
www.stoppt-die-e-card.de-inf-20240601-082315-29qfh-00038.warc.os.cdx.gz	72565	download
www.uarts.edu-inf-20240601-132126-822vf-00002.warc.gz	5777815739	download job
www.uarts.edu-inf-20240601-132126-822vf-00002.warc.os.cdx.gz	10009	download
www.uarts.edu-inf-20240601-132126-822vf-00003.warc.gz	5750688630	download job
www.uarts.edu-inf-20240601-132126-822vf-00003.warc.os.cdx.gz	11536	download
www.ubuntu.de-inf-20240601-183644-bxmum-00000.warc.gz	402411387	download job
www.ubuntu.de-inf-20240601-183644-bxmum-00000.warc.os.cdx.gz	213878	download
www.ubuntu.de-inf-20240601-183644-bxmum-meta.warc.gz	152867	download job
www.ubuntu.de-inf-20240601-183644-bxmum-meta.warc.os.cdx.gz	47	download
www.ubuntu.de-inf-20240601-183644-bxmum.json	241	download job
www.verylittlehelps.com-inf-20240601-071151-czcnz-00000.warc.gz	4843963367	download job
www.verylittlehelps.com-inf-20240601-071151-czcnz-00000.warc.os.cdx.gz	6076131	download
www.verylittlehelps.com-inf-20240601-071151-czcnz-meta.warc.gz	3916247	download job
www.verylittlehelps.com-inf-20240601-071151-czcnz-meta.warc.os.cdx.gz	47	download
www.verylittlehelps.com-inf-20240601-071151-czcnz.json	263	download job