Item archiveteam_archivebot_go_20241007144015_79ff7c9a

Filename	Size
archiveteam_archivebot_go_20241007144015_79ff7c9a.cdx.gz	21174261	download
archiveteam_archivebot_go_20241007144015_79ff7c9a.cdx.idx	22451	download
archiveteam_archivebot_go_20241007144015_79ff7c9a_files.xml	0	download
archiveteam_archivebot_go_20241007144015_79ff7c9a_meta.sqlite	106496	download
archiveteam_archivebot_go_20241007144015_79ff7c9a_meta.xml	881	download
data.worldpop.org-inf-20240515-011446-esx2x-05038.warc.gz	15789533713	download job
data.worldpop.org-inf-20240515-011446-esx2x-05038.warc.os.cdx.gz	299105	download
dineshdsouza.com-inf-20240927-063401-c8wma-00577.warc.gz	7534378184	download job
dineshdsouza.com-inf-20240927-063401-c8wma-00577.warc.os.cdx.gz	5481	download
dineshdsouza.com-inf-20240927-063401-c8wma-00578.warc.gz	5658774761	download job
dineshdsouza.com-inf-20240927-063401-c8wma-00578.warc.os.cdx.gz	665	download
harpers.org-inf-20241006-133319-42vy2-00003.warc.gz	5407753417	download job
harpers.org-inf-20241006-133319-42vy2-00003.warc.os.cdx.gz	717954	download
hostdeals.net-inf-20241007-141718-7y3f5-00000.warc.gz	122962612	download job
hostdeals.net-inf-20241007-141718-7y3f5-00000.warc.os.cdx.gz	184927	download
hostdeals.net-inf-20241007-141718-7y3f5-meta.warc.gz	105524	download job
hostdeals.net-inf-20241007-141718-7y3f5-meta.warc.os.cdx.gz	47	download
hostdeals.net-inf-20241007-141718-7y3f5.json	240	download job
info.ogci.com-inf-20241007-143403-2hsdu-00000.warc.gz	12875	download job
info.ogci.com-inf-20241007-143403-2hsdu-00000.warc.os.cdx.gz	342	download
info.ogci.com-inf-20241007-143403-2hsdu-meta.warc.gz	3472	download job
info.ogci.com-inf-20241007-143403-2hsdu-meta.warc.os.cdx.gz	47	download
info.ogci.com-inf-20241007-143403-2hsdu.json	244	download job
kevin-kuehnert.berlin-inf-20241007-142337-9dtid-00000.warc.gz	3228428	download job
kevin-kuehnert.berlin-inf-20241007-142337-9dtid-00000.warc.os.cdx.gz	6533	download
kevin-kuehnert.berlin-inf-20241007-142337-9dtid-meta.warc.gz	8735	download job
kevin-kuehnert.berlin-inf-20241007-142337-9dtid-meta.warc.os.cdx.gz	47	download
kevin-kuehnert.berlin-inf-20241007-142337-9dtid.json	249	download job
momfoodie.com-inf-20241006-173804-7hv7e-00003.warc.gz	357109774	download job
momfoodie.com-inf-20241006-173804-7hv7e-00003.warc.os.cdx.gz	477350	download
momfoodie.com-inf-20241006-173804-7hv7e-meta.warc.gz	9157528	download job
momfoodie.com-inf-20241006-173804-7hv7e-meta.warc.os.cdx.gz	47	download
momfoodie.com-inf-20241006-173804-7hv7e.json	238	download job
program.almanar.com.lb-inf-20240929-004116-8kk69-01028.warc.gz	5443886303	download job
program.almanar.com.lb-inf-20240929-004116-8kk69-01028.warc.os.cdx.gz	15753	download
progressreport.ogci.com-inf-20241007-143135-1asom-00000.warc.gz	8278286	download job
progressreport.ogci.com-inf-20241007-143135-1asom-00000.warc.os.cdx.gz	17637	download
progressreport.ogci.com-inf-20241007-143135-1asom-meta.warc.gz	13377	download job
progressreport.ogci.com-inf-20241007-143135-1asom-meta.warc.os.cdx.gz	47	download
progressreport.ogci.com-inf-20241007-143135-1asom.json	254	download job
securingdemocracy.gmfus.org-inf-20241006-173301-delye-00019.warc.gz	5369077006	download job
securingdemocracy.gmfus.org-inf-20241006-173301-delye-00019.warc.os.cdx.gz	477550	download
stewpeters.com-inf-20241006-151750-7gp5w-00064.warc.gz	6102756033	download job
stewpeters.com-inf-20241006-151750-7gp5w-00064.warc.os.cdx.gz	2609	download
urls-transfer.archivete.am-www.rtvs.sk_json_audio5f_outlinks_continue.txt-shallow-20240814-064309-1n40i-00773.warc.gz	5480456700	download job
urls-transfer.archivete.am-www.rtvs.sk_json_audio5f_outlinks_continue.txt-shallow-20240814-064309-1n40i-00773.warc.os.cdx.gz	8578	download
urls-transfer.archivete.am-www.staroetv.su_tgvideo_urls.txt-shallow-20240930-191927-1ok1v-00227.warc.gz	5607880404	download job
urls-transfer.archivete.am-www.staroetv.su_tgvideo_urls.txt-shallow-20240930-191927-1ok1v-00227.warc.os.cdx.gz	546	download
www.dipublico.org-inf-20241002-111515-bbi1h-00007.warc.gz	5386290835	download job
www.dipublico.org-inf-20241002-111515-bbi1h-00007.warc.os.cdx.gz	101167	download
www.getyourselfoptimized.com-inf-20241005-161351-38cku-00025.warc.gz	5368716184	download job
www.getyourselfoptimized.com-inf-20241005-161351-38cku-00025.warc.os.cdx.gz	5969552	download
www.hwcooling.net-inf-20240929-201930-9evf8-00008.warc.gz	5636544475	download job
www.hwcooling.net-inf-20240929-201930-9evf8-00008.warc.os.cdx.gz	3929399	download
www.momsandmunchkins.ca-inf-20241007-015736-7shb6-00004.warc.gz	5369756641	download job
www.momsandmunchkins.ca-inf-20241007-015736-7shb6-00004.warc.os.cdx.gz	5130854	download
www.psp.cz-inf-20240922-144911-3eg8t-00162.warc.gz	5405015147	download job
www.psp.cz-inf-20240922-144911-3eg8t-00162.warc.os.cdx.gz	4088721	download
www.realtek.com-shallow-20241007-143807-e34rv-00000.warc.gz	5876877	download job
www.realtek.com-shallow-20241007-143807-e34rv-00000.warc.os.cdx.gz	3729	download
www.realtek.com-shallow-20241007-143807-e34rv-meta.warc.gz	5697	download job
www.realtek.com-shallow-20241007-143807-e34rv-meta.warc.os.cdx.gz	47	download
www.realtek.com-shallow-20241007-143807-e34rv.json	278	download job
www.scrippsnews.com-inf-20240927-193749-7uvhu-01102.warc.gz	5383061031	download job
www.scrippsnews.com-inf-20240927-193749-7uvhu-01102.warc.os.cdx.gz	21707	download
www.scrippsnews.com-inf-20240927-193749-7uvhu-01103.warc.gz	5447902547	download job
www.scrippsnews.com-inf-20240927-193749-7uvhu-01103.warc.os.cdx.gz	26176	download
www.tagesschau.de-shallow-20241007-143915-7m5hj-00000.warc.gz	28075998	download job
www.tagesschau.de-shallow-20241007-143915-7m5hj-00000.warc.os.cdx.gz	6311	download
www.tagesschau.de-shallow-20241007-143915-7m5hj-meta.warc.gz	7336	download job
www.tagesschau.de-shallow-20241007-143915-7m5hj-meta.warc.os.cdx.gz	47	download
www.tagesschau.de-shallow-20241007-143915-7m5hj.json	292	download job
www.trumpstruth.org-inf-20241007-120806-5ztw6-00007.warc.gz	5417295006	download job
www.trumpstruth.org-inf-20241007-120806-5ztw6-00007.warc.os.cdx.gz	91869	download
www.trumpstruth.org-inf-20241007-120806-5ztw6-00008.warc.gz	5466655354	download job
www.trumpstruth.org-inf-20241007-120806-5ztw6-00008.warc.os.cdx.gz	110231	download
www.wielerkrant.be-shallow-20241007-143452-4drzg-00000.warc.gz	15506031	download job
www.wielerkrant.be-shallow-20241007-143452-4drzg-00000.warc.os.cdx.gz	33564	download
www.wielerkrant.be-shallow-20241007-143452-4drzg-meta.warc.gz	24036	download job
www.wielerkrant.be-shallow-20241007-143452-4drzg-meta.warc.os.cdx.gz	47	download
www.wielerkrant.be-shallow-20241007-143452-4drzg.json	381	download job