Item archiveteam_archivebot_go_20240503191539_00865de8

Filename	Size
advancedbiofuelsusa.info-inf-20240428-014218-7ed8p-00028.warc.gz	5368726562	download job
advancedbiofuelsusa.info-inf-20240428-014218-7ed8p-00028.warc.os.cdx.gz	913666	download
archiveteam_archivebot_go_20240503191539_00865de8.cdx.gz	22574026	download
archiveteam_archivebot_go_20240503191539_00865de8.cdx.idx	23448	download
archiveteam_archivebot_go_20240503191539_00865de8_files.xml	0	download
archiveteam_archivebot_go_20240503191539_00865de8_meta.sqlite	28672	download
archiveteam_archivebot_go_20240503191539_00865de8_meta.xml	914	download
authorize.feedbooks.com-inf-20240329-125426-2ycdr-00024.warc.gz	5379044287	download job
authorize.feedbooks.com-inf-20240329-125426-2ycdr-00024.warc.os.cdx.gz	2099513	download
balloon-juice.com-inf-20240410-205032-ee5cy-00149.warc.gz	5476294095	download job
balloon-juice.com-inf-20240410-205032-ee5cy-00149.warc.os.cdx.gz	1006765	download
forums.tigsource.com-inf-20240310-220010-56h4g-00109.warc.gz	5373054188	download job
forums.tigsource.com-inf-20240310-220010-56h4g-00109.warc.os.cdx.gz	2336371	download
huskiecommons.lib.niu.edu-inf-20240502-213846-9vat8-00007.warc.gz	5403274658	download job
huskiecommons.lib.niu.edu-inf-20240502-213846-9vat8-00007.warc.os.cdx.gz	666149	download
market.feedbooks.com-inf-20240329-040738-7ctg7-00082.warc.gz	5375404941	download job
market.feedbooks.com-inf-20240329-040738-7ctg7-00082.warc.os.cdx.gz	8010596	download
rip.ie-inf-20240503-033311-bq1lh-00021.warc.gz	5371744109	download job
rip.ie-inf-20240503-033311-bq1lh-00021.warc.os.cdx.gz	103310	download
rip.ie-inf-20240503-033311-bq1lh-00022.warc.gz	5652293407	download job
rip.ie-inf-20240503-033311-bq1lh-00022.warc.os.cdx.gz	1826	download
storage.googleapis.com-inf-20240301-202801-5jgg7-06693.warc.gz	5840336915	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-06693.warc.os.cdx.gz	939	download
storage.googleapis.com-inf-20240301-202801-5jgg7-06694.warc.gz	5520232566	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-06694.warc.os.cdx.gz	937	download
urls-transfer.archivete.am-igp06.gameloft.com_urls_via_gl-ads06-gold.s3.amazonaws.com.txt-shallow-20240502-222706-b3ric-00014.warc.gz	5368859592	download job
urls-transfer.archivete.am-igp06.gameloft.com_urls_via_gl-ads06-gold.s3.amazonaws.com.txt-shallow-20240502-222706-b3ric-00014.warc.os.cdx.gz	1108791	download
urls-transfer.archivete.am-sbnation_Steel-Curtain-Network-A-Pittsburgh-Steelers-podcast.txt-shallow-20240503-083528-5yi3q-00021.warc.gz	5419422459	download job
urls-transfer.archivete.am-sbnation_Steel-Curtain-Network-A-Pittsburgh-Steelers-podcast.txt-shallow-20240503-083528-5yi3q-00021.warc.os.cdx.gz	40029	download
urls-transfer.archivete.am-workshop.abcvg.info_seed_urls.txt-inf-20240425-164117-br34y-00507.warc.gz	5424836924	download job
urls-transfer.archivete.am-workshop.abcvg.info_seed_urls.txt-inf-20240425-164117-br34y-00507.warc.os.cdx.gz	5415	download
weser-ems-wirtschaft.de-inf-20240503-123057-3non7-00000.warc.gz	5368787543	download job
weser-ems-wirtschaft.de-inf-20240503-123057-3non7-00000.warc.os.cdx.gz	5417793	download
www.gutenberg.org-inf-20240317-080231-d1spw-00337.warc.gz	5368841615	download job
www.gutenberg.org-inf-20240317-080231-d1spw-00337.warc.os.cdx.gz	555997	download
www.nakedcapitalism.com-inf-20240327-011540-4qq9p-00487.warc.gz	5369107381	download job
www.nakedcapitalism.com-inf-20240327-011540-4qq9p-00487.warc.os.cdx.gz	645635	download
www.polskieradio.pl-inf-20231221-075717-djrf2-01730.warc.gz	5418644156	download job
www.polskieradio.pl-inf-20231221-075717-djrf2-01730.warc.os.cdx.gz	138852	download
www.truthmove.org-inf-20240501-152332-by643-00098.warc.gz	5407027677	download job
www.truthmove.org-inf-20240501-152332-by643-00098.warc.os.cdx.gz	5362	download
www.truthmove.org-inf-20240501-152332-by643-00099.warc.gz	6569440318	download job
www.truthmove.org-inf-20240501-152332-by643-00099.warc.os.cdx.gz	3802	download
www.truthmove.org-inf-20240501-152332-by643-00100.warc.gz	5651387887	download job
www.truthmove.org-inf-20240501-152332-by643-00100.warc.os.cdx.gz	23917	download