Item archiveteam_archivebot_go_20240420085231_cce859ea

Filename	Size
apartheidweek.org-inf-20240420-084430-4cang-00000.warc.gz	5220091	download job
apartheidweek.org-inf-20240420-084430-4cang-00000.warc.os.cdx.gz	17234	download
apartheidweek.org-inf-20240420-084430-4cang-meta.warc.gz	13245	download job
apartheidweek.org-inf-20240420-084430-4cang-meta.warc.os.cdx.gz	47	download
apartheidweek.org-inf-20240420-084430-4cang.json	244	download job
apartheidweek.org-inf-20240420-084451-7fx2l-00000.warc.gz	5137658	download job
apartheidweek.org-inf-20240420-084451-7fx2l-00000.warc.os.cdx.gz	16947	download
apartheidweek.org-inf-20240420-084451-7fx2l-meta.warc.gz	13013	download job
apartheidweek.org-inf-20240420-084451-7fx2l-meta.warc.os.cdx.gz	47	download
apartheidweek.org-inf-20240420-084451-7fx2l.json	245	download job
archiveteam_archivebot_go_20240420085231_cce859ea.cdx.gz	15342439	download
archiveteam_archivebot_go_20240420085231_cce859ea.cdx.idx	16073	download
archiveteam_archivebot_go_20240420085231_cce859ea_files.xml	0	download
archiveteam_archivebot_go_20240420085231_cce859ea_meta.sqlite	53248	download
archiveteam_archivebot_go_20240420085231_cce859ea_meta.xml	881	download
development.truthout.org-inf-20240408-171110-46zej-00212.warc.gz	5593847843	download job
development.truthout.org-inf-20240408-171110-46zej-00212.warc.os.cdx.gz	662837	download
europepmc.org-inf-20240212-215511-8x1ov-01942.warc.gz	5441931282	download job
europepmc.org-inf-20240212-215511-8x1ov-01942.warc.os.cdx.gz	111742	download
fatalencounters.org-inf-20240419-163755-3s0nc-00009.warc.gz	5636635255	download job
fatalencounters.org-inf-20240419-163755-3s0nc-00009.warc.os.cdx.gz	1088412	download
foundationfar.org-inf-20240420-050558-4plgc-00000.warc.gz	5368742236	download job
foundationfar.org-inf-20240420-050558-4plgc-00000.warc.os.cdx.gz	2417784	download
lists.aspl.es-inf-20240420-074403-4bghs-00000.warc.gz	431233855	download job
lists.aspl.es-inf-20240420-074403-4bghs-00000.warc.os.cdx.gz	781104	download
lists.aspl.es-inf-20240420-074403-4bghs-meta.warc.gz	471313	download job
lists.aspl.es-inf-20240420-074403-4bghs-meta.warc.os.cdx.gz	47	download
lists.aspl.es-inf-20240420-074403-4bghs.json	240	download job
minihuskysandblackcats.tumblr.com-inf-20240415-173826-3vk4j-00222.warc.gz	5383270858	download job
minihuskysandblackcats.tumblr.com-inf-20240415-173826-3vk4j-00222.warc.os.cdx.gz	1548041	download
repositoriodocumental.ine.mx-inf-20240329-160658-214oh-00807.warc.gz	5819284861	download job
repositoriodocumental.ine.mx-inf-20240329-160658-214oh-00807.warc.os.cdx.gz	3803	download
scholarworks.wmich.edu-inf-20240416-175005-bqm5b-00141.warc.gz	5440295530	download job
scholarworks.wmich.edu-inf-20240416-175005-bqm5b-00141.warc.os.cdx.gz	17259	download
scholarworks.wmich.edu-inf-20240416-175005-bqm5b-00142.warc.gz	5424142425	download job
scholarworks.wmich.edu-inf-20240416-175005-bqm5b-00142.warc.os.cdx.gz	27187	download
staging.truthout.org-inf-20240408-170925-2tvgv-00216.warc.gz	5627536552	download job
staging.truthout.org-inf-20240408-170925-2tvgv-00216.warc.os.cdx.gz	1151191	download
storage.googleapis.com-inf-20240301-202801-5jgg7-05008.warc.gz	5684654099	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-05008.warc.os.cdx.gz	664	download
storage.googleapis.com-inf-20240301-202801-5jgg7-05009.warc.gz	5785891726	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-05009.warc.os.cdx.gz	720	download
urls-transfer.archivete.am-assorted-subdomain-variations_1713601517.290089-shallow-20240420-082527-24yro-00000.warc.gz	24208802	download job
urls-transfer.archivete.am-assorted-subdomain-variations_1713601517.290089-shallow-20240420-082527-24yro-00000.warc.os.cdx.gz	60544	download
urls-transfer.archivete.am-assorted-subdomain-variations_1713601517.290089-shallow-20240420-082527-24yro-meta.warc.gz	42829	download job
urls-transfer.archivete.am-assorted-subdomain-variations_1713601517.290089-shallow-20240420-082527-24yro-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-assorted-subdomain-variations_1713601517.290089-shallow-20240420-082527-24yro-urls.txt	3720	download
urls-transfer.archivete.am-assorted-subdomain-variations_1713601517.290089-shallow-20240420-082527-24yro.json	390	download job
urls-transfer.archivete.am-sbnation_Bleeding-Green-Nation-for-Philadelphia-Eagles-fans-Podcast.txt-shallow-20240420-075136-45lju-00001.warc.gz	5387169126	download job
urls-transfer.archivete.am-sbnation_Bleeding-Green-Nation-for-Philadelphia-Eagles-fans-Podcast.txt-shallow-20240420-075136-45lju-00001.warc.os.cdx.gz	25478	download
urls-transfer.archivete.am-sbnation_Bleeding-Green-Nation-for-Philadelphia-Eagles-fans-Podcast.txt-shallow-20240420-075136-45lju-00002.warc.gz	5370748638	download job
urls-transfer.archivete.am-sbnation_Bleeding-Green-Nation-for-Philadelphia-Eagles-fans-Podcast.txt-shallow-20240420-075136-45lju-00002.warc.os.cdx.gz	27152	download
www.apartheidweek.org-inf-20240420-084559-dduea-00000.warc.gz	5139963	download job
www.apartheidweek.org-inf-20240420-084559-dduea-00000.warc.os.cdx.gz	16739	download
www.apartheidweek.org-inf-20240420-084559-dduea-meta.warc.gz	12843	download job
www.apartheidweek.org-inf-20240420-084559-dduea-meta.warc.os.cdx.gz	47	download
www.apartheidweek.org-inf-20240420-084559-dduea.json	249	download job
www.apartheidweek.org-inf-20240420-084635-4b5n1-00000.warc.gz	5217441	download job
www.apartheidweek.org-inf-20240420-084635-4b5n1-00000.warc.os.cdx.gz	17168	download
www.apartheidweek.org-inf-20240420-084635-4b5n1-meta.warc.gz	13180	download job
www.apartheidweek.org-inf-20240420-084635-4b5n1-meta.warc.os.cdx.gz	47	download
www.apartheidweek.org-inf-20240420-084635-4b5n1.json	248	download job
www.ems1.com-inf-20240418-060803-9vxcd-00045.warc.gz	5378165879	download job
www.ems1.com-inf-20240418-060803-9vxcd-00045.warc.os.cdx.gz	544810	download
www.hibob.com-inf-20240414-151631-73yoz-00005.warc.gz	5368723856	download job
www.hibob.com-inf-20240414-151631-73yoz-00005.warc.os.cdx.gz	6356816	download
www.newshub.co.nz-inf-20240410-200027-3leg3-00176.warc.gz	5585933018	download job
www.newshub.co.nz-inf-20240410-200027-3leg3-00176.warc.os.cdx.gz	157236	download
www.ni.com-inf-20240319-183623-320jn-00332.warc.gz	18210857714	download job
www.ni.com-inf-20240319-183623-320jn-00332.warc.os.cdx.gz	306	download
www.thebluealliance.com-shallow-20240420-034428-46eh5-00000.warc.gz	1279716	download job
www.thebluealliance.com-shallow-20240420-034428-46eh5-00000.warc.os.cdx.gz	5247	download
www.thebluealliance.com-shallow-20240420-034428-46eh5-meta.warc.gz	6336	download job
www.thebluealliance.com-shallow-20240420-034428-46eh5-meta.warc.os.cdx.gz	47	download
www.thebluealliance.com-shallow-20240420-034428-46eh5.json	266	download job
www.thesword.com-inf-20240416-044419-b5t0t-00013.warc.gz	5370986799	download job
www.thesword.com-inf-20240416-044419-b5t0t-00013.warc.os.cdx.gz	681991	download