Item archiveteam_archivebot_go_20240604132913_2b4c2f86

Filename	Size
a16z.com-inf-20240603-202412-e0su3-00007.warc.gz	5369289509	download job
a16z.com-inf-20240603-202412-e0su3-00007.warc.os.cdx.gz	2871695	download
amerika21.de-inf-20240514-173356-a47gq-00011.warc.gz	5374480197	download job
amerika21.de-inf-20240514-173356-a47gq-00011.warc.os.cdx.gz	2291696	download
archiveteam_archivebot_go_20240604132913_2b4c2f86.cdx.gz	44389894	download
archiveteam_archivebot_go_20240604132913_2b4c2f86.cdx.idx	46322	download
archiveteam_archivebot_go_20240604132913_2b4c2f86_files.xml	0	download
archiveteam_archivebot_go_20240604132913_2b4c2f86_meta.sqlite	98304	download
archiveteam_archivebot_go_20240604132913_2b4c2f86_meta.xml	881	download
blog.redribbon.co-inf-20240604-104114-17z6o-00000.warc.gz	5368976929	download job
blog.redribbon.co-inf-20240604-104114-17z6o-00000.warc.os.cdx.gz	3588761	download
data.worldpop.org-inf-20240515-011446-esx2x-00523.warc.gz	8280355890	download job
data.worldpop.org-inf-20240515-011446-esx2x-00523.warc.os.cdx.gz	365	download
data.worldpop.org-inf-20240515-011446-esx2x-00524.warc.gz	6920128461	download job
data.worldpop.org-inf-20240515-011446-esx2x-00524.warc.os.cdx.gz	437	download
defence.pk-inf-20240521-071122-belq2-00020.warc.gz	5370701031	download job
defence.pk-inf-20240521-071122-belq2-00020.warc.os.cdx.gz	9672172	download
dlc.org.za-inf-20240604-123706-e48xc-00000.warc.gz	362540455	download job
dlc.org.za-inf-20240604-123706-e48xc-00000.warc.os.cdx.gz	180928	download
dlc.org.za-inf-20240604-123706-e48xc-meta.warc.gz	118470	download job
dlc.org.za-inf-20240604-123706-e48xc-meta.warc.os.cdx.gz	47	download
dlc.org.za-inf-20240604-123706-e48xc.json	234	download job
ebiblio.feedbooks.com-inf-20240329-043352-8p6cj-00244.warc.gz	5368715990	download job
ebiblio.feedbooks.com-inf-20240329-043352-8p6cj-00244.warc.os.cdx.gz	8193358	download
effonline.org-inf-20240604-125856-zsbun-00000.warc.gz	79686	download job
effonline.org-inf-20240604-125856-zsbun-00000.warc.os.cdx.gz	1470	download
effonline.org-inf-20240604-125856-zsbun-meta.warc.gz	4355	download job
effonline.org-inf-20240604-125856-zsbun-meta.warc.os.cdx.gz	47	download
effonline.org-inf-20240604-125856-zsbun.json	237	download job
europepmc.org-inf-20240212-215511-8x1ov-03446.warc.gz	5371412638	download job
europepmc.org-inf-20240212-215511-8x1ov-03446.warc.os.cdx.gz	192012	download
forums.massassi.net-inf-20240601-001349-7wv2k-00029.warc.gz	5483205541	download job
forums.massassi.net-inf-20240601-001349-7wv2k-00029.warc.os.cdx.gz	1250030	download
forums.radioreference.com-inf-20240509-135047-rbd5j-00046.warc.gz	5422868473	download job
forums.radioreference.com-inf-20240509-135047-rbd5j-00046.warc.os.cdx.gz	2428566	download
impffrei.work-inf-20240526-154958-bh5cq-00009.warc.gz	5368711277	download job
impffrei.work-inf-20240526-154958-bh5cq-00009.warc.os.cdx.gz	2313623	download
masternexttalent.nl-inf-20240604-113521-9vbfl-00000.warc.gz	441473323	download job
masternexttalent.nl-inf-20240604-113521-9vbfl-00000.warc.os.cdx.gz	585706	download
masternexttalent.nl-inf-20240604-113521-9vbfl-meta.warc.gz	570368	download job
masternexttalent.nl-inf-20240604-113521-9vbfl-meta.warc.os.cdx.gz	47	download
masternexttalent.nl-inf-20240604-113521-9vbfl.json	247	download job
nixgut.wordpress.com-inf-20240603-162211-8xq02-00014.warc.gz	5399577095	download job
nixgut.wordpress.com-inf-20240603-162211-8xq02-00014.warc.os.cdx.gz	828400	download
republic.archival-services.gov.ge-inf-20240603-162500-3eite-00013.warc.gz	5370630812	download job
republic.archival-services.gov.ge-inf-20240603-162500-3eite-00013.warc.os.cdx.gz	381009	download
trace.tennessee.edu-inf-20240603-000256-98lr9-00034.warc.gz	5692293629	download job
trace.tennessee.edu-inf-20240603-000256-98lr9-00034.warc.os.cdx.gz	303576	download
uknowledge.uky.edu-inf-20240604-015337-f3w4h-00018.warc.gz	5411917457	download job
uknowledge.uky.edu-inf-20240604-015337-f3w4h-00018.warc.os.cdx.gz	242074	download
urls-transfer.archivete.am-nam-geofund.archival-services.gov.ge_geofond_geofond_item_detailed_part_02.txt-shallow-20240603-183643-em0ki-00005.warc.gz	3618692560	download job
urls-transfer.archivete.am-nam-geofund.archival-services.gov.ge_geofond_geofond_item_detailed_part_02.txt-shallow-20240603-183643-em0ki-00005.warc.os.cdx.gz	237990	download
urls-transfer.archivete.am-nam-geofund.archival-services.gov.ge_geofond_geofond_item_detailed_part_02.txt-shallow-20240603-183643-em0ki-meta.warc.gz	1013474	download job
urls-transfer.archivete.am-nam-geofund.archival-services.gov.ge_geofond_geofond_item_detailed_part_02.txt-shallow-20240603-183643-em0ki-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-nam-geofund.archival-services.gov.ge_geofond_geofond_item_detailed_part_02.txt-shallow-20240603-183643-em0ki-urls.txt	3787728	download
urls-transfer.archivete.am-nam-geofund.archival-services.gov.ge_geofond_geofond_item_detailed_part_02.txt-shallow-20240603-183643-em0ki.json	452	download job
villavu.com-inf-20240505-002228-9rig5-00021.warc.gz	5369891592	download job
villavu.com-inf-20240505-002228-9rig5-00021.warc.os.cdx.gz	5380052	download
www.aisnakeoil.com-inf-20240604-005116-6swq7-00000.warc.gz	5369615573	download job
www.aisnakeoil.com-inf-20240604-005116-6swq7-00000.warc.os.cdx.gz	1471561	download
www.anc1912.org.za-inf-20240604-123620-adf9d-00000.warc.gz	30771	download job
www.anc1912.org.za-inf-20240604-123620-adf9d-00000.warc.os.cdx.gz	384	download
www.anc1912.org.za-inf-20240604-123620-adf9d-meta.warc.gz	3434	download job
www.anc1912.org.za-inf-20240604-123620-adf9d-meta.warc.os.cdx.gz	47	download
www.anc1912.org.za-inf-20240604-123620-adf9d.json	242	download job
www.fti-group.com-shallow-20240604-131820-42a63-00000.warc.gz	5037389	download job
www.fti-group.com-shallow-20240604-131820-42a63-00000.warc.os.cdx.gz	10113	download
www.fti-group.com-shallow-20240604-131820-42a63-meta.warc.gz	9703	download job
www.fti-group.com-shallow-20240604-131820-42a63-meta.warc.os.cdx.gz	47	download
www.fti-group.com-shallow-20240604-131820-42a63.json	261	download job
www.infolibertaire.net-inf-20240528-153803-2mfkg-00060.warc.gz	5369532205	download job
www.infolibertaire.net-inf-20240528-153803-2mfkg-00060.warc.os.cdx.gz	1647020	download
www.mixesdb.com-inf-20240603-014940-tfwdm-00006.warc.gz	5368821420	download job
www.mixesdb.com-inf-20240603-014940-tfwdm-00006.warc.os.cdx.gz	1500317	download