Item archiveteam_archivebot_go_20240420210804_4d89f1bd

Filename	Size
archiveteam_archivebot_go_20240420210804_4d89f1bd.cdx.gz	95344	download
archiveteam_archivebot_go_20240420210804_4d89f1bd.cdx.idx	66	download
archiveteam_archivebot_go_20240420210804_4d89f1bd_files.xml	0	download
archiveteam_archivebot_go_20240420210804_4d89f1bd_meta.sqlite	28672	download
archiveteam_archivebot_go_20240420210804_4d89f1bd_meta.xml	1045	download
coffeeshopmenus.org-inf-20240420-210107-7tse6-aborted-00000.warc.gz	203404932	download job
coffeeshopmenus.org-inf-20240420-210107-7tse6-aborted-00000.warc.os.cdx.gz	98302	download
coffeeshopmenus.org-inf-20240420-210107-7tse6-aborted-wpull.log.gz	65493	download
coffeeshopmenus.org-inf-20240420-210107-7tse6-aborted.json	250	download job
digbysblog.net-inf-20240410-205046-8xlnn-00082.warc.gz	5422288608	download job
digbysblog.net-inf-20240410-205046-8xlnn-00082.warc.os.cdx.gz	224330	download
digbysblog.net-inf-20240410-205046-8xlnn-00083.warc.gz	5435116159	download job
digbysblog.net-inf-20240410-205046-8xlnn-00083.warc.os.cdx.gz	47094	download
electronicplastic.com-inf-20240419-020706-idovb-00000.warc.gz	5368714890	download job
electronicplastic.com-inf-20240419-020706-idovb-00000.warc.os.cdx.gz	46124806	download
europepmc.org-inf-20240212-215511-8x1ov-01955.warc.gz	5379477141	download job
europepmc.org-inf-20240212-215511-8x1ov-01955.warc.os.cdx.gz	86706	download
github.com-shallow-20240420-203836-13ef4-00000.warc.gz	5358307	download job
github.com-shallow-20240420-203836-13ef4-00000.warc.os.cdx.gz	13502	download
github.com-shallow-20240420-203836-13ef4-meta.warc.gz	12388	download job
github.com-shallow-20240420-203836-13ef4-meta.warc.os.cdx.gz	47	download
github.com-shallow-20240420-203836-13ef4.json	275	download job
github.com-shallow-20240420-203837-4tvvg-00000.warc.gz	2778613	download job
github.com-shallow-20240420-203837-4tvvg-00000.warc.os.cdx.gz	11932	download
github.com-shallow-20240420-203837-4tvvg-meta.warc.gz	11596	download job
github.com-shallow-20240420-203837-4tvvg-meta.warc.os.cdx.gz	47	download
github.com-shallow-20240420-203837-4tvvg.json	265	download job
glowbug.nl-inf-20240420-201058-2zbpy-00000.warc.gz	299728663	download job
glowbug.nl-inf-20240420-201058-2zbpy-00000.warc.os.cdx.gz	572884	download
glowbug.nl-inf-20240420-201058-2zbpy-meta.warc.gz	358953	download job
glowbug.nl-inf-20240420-201058-2zbpy-meta.warc.os.cdx.gz	47	download
glowbug.nl-inf-20240420-201058-2zbpy.json	240	download job
minihuskysandblackcats.tumblr.com-inf-20240415-173826-3vk4j-00244.warc.gz	5368738543	download job
minihuskysandblackcats.tumblr.com-inf-20240415-173826-3vk4j-00244.warc.os.cdx.gz	1571469	download
nothingnewunderthesun2016.com-inf-20240419-173125-cpblu-00029.warc.gz	5616601965	download job
nothingnewunderthesun2016.com-inf-20240419-173125-cpblu-00029.warc.os.cdx.gz	1237153	download
palestinemonitor.org-inf-20240420-194031-blb72-00000.warc.gz	619079519	download job
palestinemonitor.org-inf-20240420-194031-blb72-00000.warc.os.cdx.gz	456084	download
palestinemonitor.org-inf-20240420-194031-blb72-meta.warc.gz	342745	download job
palestinemonitor.org-inf-20240420-194031-blb72-meta.warc.os.cdx.gz	47	download
palestinemonitor.org-inf-20240420-194031-blb72.json	248	download job
pidruchnyk.com.ua-inf-20240420-175159-37bno-00006.warc.gz	5393446782	download job
pidruchnyk.com.ua-inf-20240420-175159-37bno-00006.warc.os.cdx.gz	42801	download
repositoriodocumental.ine.mx-inf-20240329-160658-214oh-00830.warc.gz	5969168026	download job
repositoriodocumental.ine.mx-inf-20240329-160658-214oh-00830.warc.os.cdx.gz	4395	download
scholarworks.wmich.edu-inf-20240416-175005-bqm5b-00165.warc.gz	5384245022	download job
scholarworks.wmich.edu-inf-20240416-175005-bqm5b-00165.warc.os.cdx.gz	36507	download
shop.shelter.org.uk-inf-20240410-010008-cjohh-00026.warc.gz	5369391904	download job
shop.shelter.org.uk-inf-20240410-010008-cjohh-00026.warc.os.cdx.gz	799606	download
staging.truthout.org-inf-20240408-170925-2tvgv-00222.warc.gz	5403922653	download job
staging.truthout.org-inf-20240408-170925-2tvgv-00222.warc.os.cdx.gz	420686	download
storage.googleapis.com-inf-20240301-202801-5jgg7-05073.warc.gz	5520184252	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-05073.warc.os.cdx.gz	719	download
storage.googleapis.com-inf-20240301-202801-5jgg7-05074.warc.gz	5531144417	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-05074.warc.os.cdx.gz	665	download
storage.googleapis.com-inf-20240301-202801-5jgg7-05075.warc.gz	5580084514	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-05075.warc.os.cdx.gz	719	download
urls-transfer.archivete.am-sbnation_Boiler-Alert-A-Purdue-University-podcast.txt-shallow-20240420-194622-2zgfa-00001.warc.gz	5370126684	download job
urls-transfer.archivete.am-sbnation_Boiler-Alert-A-Purdue-University-podcast.txt-shallow-20240420-194622-2zgfa-00001.warc.os.cdx.gz	34405	download
urls-transfer.archivete.am-sbnation_Boiler-Alert-A-Purdue-University-podcast.txt-shallow-20240420-194622-2zgfa-00002.warc.gz	1900584518	download job
urls-transfer.archivete.am-sbnation_Boiler-Alert-A-Purdue-University-podcast.txt-shallow-20240420-194622-2zgfa-00002.warc.os.cdx.gz	13101	download
urls-transfer.archivete.am-sbnation_Boiler-Alert-A-Purdue-University-podcast.txt-shallow-20240420-194622-2zgfa-meta.warc.gz	63328	download job
urls-transfer.archivete.am-sbnation_Boiler-Alert-A-Purdue-University-podcast.txt-shallow-20240420-194622-2zgfa-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-sbnation_Boiler-Alert-A-Purdue-University-podcast.txt-shallow-20240420-194622-2zgfa-urls.txt	51698	download
urls-transfer.archivete.am-sbnation_Boiler-Alert-A-Purdue-University-podcast.txt-shallow-20240420-194622-2zgfa.json	399	download job
www.ems1.com-inf-20240418-060803-9vxcd-00065.warc.gz	5792880486	download job
www.ems1.com-inf-20240418-060803-9vxcd-00065.warc.os.cdx.gz	473457	download
www.lpsg.com-inf-20240124-045020-97ypj-00244.warc.gz	5369676974	download job
www.lpsg.com-inf-20240124-045020-97ypj-00244.warc.os.cdx.gz	3291286	download
www.nbnco.com.au-inf-20240420-080450-a7e6e-00009.warc.gz	5434840517	download job
www.nbnco.com.au-inf-20240420-080450-a7e6e-00009.warc.os.cdx.gz	4462	download
www.thesword.com-inf-20240416-044419-b5t0t-00047.warc.gz	5380327378	download job
www.thesword.com-inf-20240416-044419-b5t0t-00047.warc.os.cdx.gz	483189	download
www.thesword.com-inf-20240416-044419-b5t0t-00048.warc.gz	5406691844	download job
www.thesword.com-inf-20240416-044419-b5t0t-00048.warc.os.cdx.gz	392152	download