Item archiveteam_archivebot_go_20240611201617_1163ddb5

Filename	Size
africacenter.org-inf-20240611-121207-eg9ij-00001.warc.gz	5481941566	download job
africacenter.org-inf-20240611-121207-eg9ij-00001.warc.os.cdx.gz	703081	download
ai.eecs.umich.edu-inf-20240611-174838-aarwi-00000.warc.gz	5514767151	download job
ai.eecs.umich.edu-inf-20240611-174838-aarwi-00000.warc.os.cdx.gz	1586696	download
archiveteam_archivebot_go_20240611201617_1163ddb5.cdx.gz	72073456	download
archiveteam_archivebot_go_20240611201617_1163ddb5.cdx.idx	92364	download
archiveteam_archivebot_go_20240611201617_1163ddb5_files.xml	0	download
archiveteam_archivebot_go_20240611201617_1163ddb5_meta.sqlite	114688	download
archiveteam_archivebot_go_20240611201617_1163ddb5_meta.xml	881	download
catalog-legacy.osaarchivum.org-inf-20240519-093136-3c0u6-00264.warc.gz	5368712990	download job
catalog-legacy.osaarchivum.org-inf-20240519-093136-3c0u6-00264.warc.os.cdx.gz	27687376	download
community.spreadsheet.com-inf-20240611-185132-eyrqv-00000.warc.gz	1141346404	download job
community.spreadsheet.com-inf-20240611-185132-eyrqv-00000.warc.os.cdx.gz	1198015	download
community.spreadsheet.com-inf-20240611-185132-eyrqv-meta.warc.gz	744178	download job
community.spreadsheet.com-inf-20240611-185132-eyrqv-meta.warc.os.cdx.gz	47	download
community.spreadsheet.com-inf-20240611-185132-eyrqv.json	253	download job
data.worldpop.org-inf-20240515-011446-esx2x-00870.warc.gz	7302827047	download job
data.worldpop.org-inf-20240515-011446-esx2x-00870.warc.os.cdx.gz	345	download
defence.pk-inf-20240521-071122-belq2-00029.warc.gz	5368724906	download job
defence.pk-inf-20240521-071122-belq2-00029.warc.os.cdx.gz	4485966	download
developers.google.com-inf-20240601-165639-1ut8g-00133.warc.gz	7070423227	download job
developers.google.com-inf-20240601-165639-1ut8g-00133.warc.os.cdx.gz	4065548	download
dig.chouti.cc-inf-20240601-194931-7diyi-00034.warc.gz	5368794293	download job
dig.chouti.cc-inf-20240601-194931-7diyi-00034.warc.os.cdx.gz	2481828	download
displate.com-inf-20240417-101313-as2hg-00271.warc.gz	5368783077	download job
displate.com-inf-20240417-101313-as2hg-00271.warc.os.cdx.gz	9881837	download
geworld.ge-inf-20240609-063231-694r4-00028.warc.gz	5616140025	download job
geworld.ge-inf-20240609-063231-694r4-00028.warc.os.cdx.gz	62297	download
geworld.ge-inf-20240609-063231-694r4-00029.warc.gz	6624675055	download job
geworld.ge-inf-20240609-063231-694r4-00029.warc.os.cdx.gz	22023	download
new.whoprofits.org-inf-20240611-201457-botsg-00000.warc.gz	6480	download job
new.whoprofits.org-inf-20240611-201457-botsg-00000.warc.os.cdx.gz	296	download
new.whoprofits.org-inf-20240611-201457-botsg-meta.warc.gz	3562	download job
new.whoprofits.org-inf-20240611-201457-botsg-meta.warc.os.cdx.gz	47	download
new.whoprofits.org-inf-20240611-201457-botsg.json	246	download job
news.kununu.com-inf-20240611-093953-f2qzo-meta.warc.gz	5925159	download job
news.kununu.com-inf-20240611-093953-f2qzo-meta.warc.os.cdx.gz	47	download
news.kununu.com-inf-20240611-093953-f2qzo.json	243	download job
pharmawiki.ch-inf-20240611-195535-dj61y-00000.warc.gz	564997	download job
pharmawiki.ch-inf-20240611-195535-dj61y-00000.warc.os.cdx.gz	2086	download
pharmawiki.ch-inf-20240611-195535-dj61y-meta.warc.gz	4929	download job
pharmawiki.ch-inf-20240611-195535-dj61y-meta.warc.os.cdx.gz	47	download
pharmawiki.ch-inf-20240611-195535-dj61y.json	241	download job
staging-fti.gcloud.fti-group.com-inf-20240604-172835-843z8-00009.warc.gz	5368760044	download job
staging-fti.gcloud.fti-group.com-inf-20240604-172835-843z8-00009.warc.os.cdx.gz	3545767	download
urls-transfer.archivete.am-factory.pixiv.net_special.txt-inf-20240611-200610-aglna-00000.warc.gz	210318009	download job
urls-transfer.archivete.am-factory.pixiv.net_special.txt-inf-20240611-200610-aglna-00000.warc.os.cdx.gz	120173	download
urls-transfer.archivete.am-factory.pixiv.net_special.txt-inf-20240611-200610-aglna-meta.warc.gz	66208	download job
urls-transfer.archivete.am-factory.pixiv.net_special.txt-inf-20240611-200610-aglna-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-factory.pixiv.net_special.txt-inf-20240611-200610-aglna-urls.txt	705	download
urls-transfer.archivete.am-factory.pixiv.net_special.txt-inf-20240611-200610-aglna.json	350	download job
urls-transfer.archivete.am-nam-geofund.archival-services.gov.ge_geofond_geofond_item_detailed_part_13.txt-shallow-20240611-163217-aseaw-00002.warc.gz	5368815810	download job
urls-transfer.archivete.am-nam-geofund.archival-services.gov.ge_geofond_geofond_item_detailed_part_13.txt-shallow-20240611-163217-aseaw-00002.warc.os.cdx.gz	381494	download
www.cs.cmu.edu-inf-20240609-135415-7wa5x-00025.warc.gz	5368895699	download job
www.cs.cmu.edu-inf-20240609-135415-7wa5x-00025.warc.os.cdx.gz	987666	download
www.facebook.com-inf-20240611-193741-6r4fm-00000.warc.gz	48092752	download job
www.facebook.com-inf-20240611-193741-6r4fm-00000.warc.os.cdx.gz	209008	download
www.facebook.com-inf-20240611-193741-6r4fm-meta.warc.gz	140429	download job
www.facebook.com-inf-20240611-193741-6r4fm-meta.warc.os.cdx.gz	47	download
www.facebook.com-inf-20240611-193741-6r4fm.json	267	download job
www.infolibertaire.net-inf-20240528-153803-2mfkg-00218.warc.gz	5381220655	download job
www.infolibertaire.net-inf-20240528-153803-2mfkg-00218.warc.os.cdx.gz	1561	download
www.infolibertaire.net-inf-20240528-153803-2mfkg-00219.warc.gz	5491729972	download job
www.infolibertaire.net-inf-20240528-153803-2mfkg-00219.warc.os.cdx.gz	121987	download
www.longwarjournal.org-inf-20240609-062810-8j3oj-00026.warc.gz	5503347774	download job
www.longwarjournal.org-inf-20240609-062810-8j3oj-00026.warc.os.cdx.gz	1031571	download
www.nwzonline.de-inf-20240430-212702-4ue3l-00072.warc.gz	5368765936	download job
www.nwzonline.de-inf-20240430-212702-4ue3l-00072.warc.os.cdx.gz	4310661	download
www.politikstube.com-inf-20240611-194820-b0dch-00000.warc.gz	7627772	download job
www.politikstube.com-inf-20240611-194820-b0dch-00000.warc.os.cdx.gz	34969	download
www.politikstube.com-inf-20240611-194820-b0dch-meta.warc.gz	20553	download job
www.politikstube.com-inf-20240611-194820-b0dch-meta.warc.os.cdx.gz	47	download
www.politikstube.com-inf-20240611-194820-b0dch.json	248	download job
www.pro-medienmagazin.de-inf-20240611-092130-1k0bl-00002.warc.gz	5394446311	download job
www.pro-medienmagazin.de-inf-20240611-092130-1k0bl-00002.warc.os.cdx.gz	3505207	download
www.salzburg24.at-shallow-20240611-194719-9h9ns-00000.warc.gz	2722907	download job
www.salzburg24.at-shallow-20240611-194719-9h9ns-00000.warc.os.cdx.gz	7996	download
www.salzburg24.at-shallow-20240611-194719-9h9ns-meta.warc.gz	9299	download job
www.salzburg24.at-shallow-20240611-194719-9h9ns-meta.warc.os.cdx.gz	47	download
www.salzburg24.at-shallow-20240611-194719-9h9ns.json	319	download job
www.sb-innovation.de-inf-20240609-024024-a70qj-00003.warc.gz	5372944826	download job
www.sb-innovation.de-inf-20240609-024024-a70qj-00003.warc.os.cdx.gz	7554176	download
www.wirtschaft.at-shallow-20240611-194620-7tb59-00000.warc.gz	1048791	download job
www.wirtschaft.at-shallow-20240611-194620-7tb59-00000.warc.os.cdx.gz	7065	download
www.wirtschaft.at-shallow-20240611-194620-7tb59-meta.warc.gz	8180	download job
www.wirtschaft.at-shallow-20240611-194620-7tb59-meta.warc.os.cdx.gz	47	download
www.wirtschaft.at-shallow-20240611-194620-7tb59.json	258	download job