Item archiveteam_archivebot_go_20240503125353_3b1c7051

Filename	Size
archiveteam_archivebot_go_20240503125353_3b1c7051.cdx.gz	21706625	download
archiveteam_archivebot_go_20240503125353_3b1c7051.cdx.idx	24708	download
archiveteam_archivebot_go_20240503125353_3b1c7051_files.xml	0	download
archiveteam_archivebot_go_20240503125353_3b1c7051_meta.sqlite	45056	download
archiveteam_archivebot_go_20240503125353_3b1c7051_meta.xml	881	download
greenhouseschool.org-inf-20240503-121209-59rsg-00000.warc.gz	318993296	download job
greenhouseschool.org-inf-20240503-121209-59rsg-00000.warc.os.cdx.gz	406268	download
greenhouseschool.org-inf-20240503-121209-59rsg-meta.warc.gz	317604	download job
greenhouseschool.org-inf-20240503-121209-59rsg-meta.warc.os.cdx.gz	47	download
greenhouseschool.org-inf-20240503-121209-59rsg.json	251	download job
huskiecommons.lib.niu.edu-inf-20240502-213846-9vat8-00005.warc.gz	5384963236	download job
huskiecommons.lib.niu.edu-inf-20240502-213846-9vat8-00005.warc.os.cdx.gz	180587	download
ranieri.agency-inf-20240503-092152-cltet-00000.warc.gz	2456827874	download job
ranieri.agency-inf-20240503-092152-cltet-00000.warc.os.cdx.gz	1873267	download
ranieri.agency-inf-20240503-092152-cltet-meta.warc.gz	1276192	download job
ranieri.agency-inf-20240503-092152-cltet-meta.warc.os.cdx.gz	47	download
ranieri.agency-inf-20240503-092152-cltet.json	242	download job
refdesk.com-inf-20240502-234328-2comb-00018.warc.gz	5370286020	download job
refdesk.com-inf-20240502-234328-2comb-00018.warc.os.cdx.gz	2178138	download
repositoriodocumental.ine.mx-inf-20240329-160658-214oh-01213.warc.gz	5406453789	download job
repositoriodocumental.ine.mx-inf-20240329-160658-214oh-01213.warc.os.cdx.gz	7779	download
richardgage911.org-inf-20240502-180028-d2cig-00048.warc.gz	2344880901	download job
richardgage911.org-inf-20240502-180028-d2cig-00048.warc.os.cdx.gz	21717	download
richardgage911.org-inf-20240502-180028-d2cig-meta.warc.gz	3231276	download job
richardgage911.org-inf-20240502-180028-d2cig-meta.warc.os.cdx.gz	47	download
richardgage911.org-inf-20240502-180028-d2cig.json	249	download job
rip.ie-inf-20240503-033311-bq1lh-00003.warc.gz	5434241809	download job
rip.ie-inf-20240503-033311-bq1lh-00003.warc.os.cdx.gz	1726	download
rip.ie-inf-20240503-033311-bq1lh-00004.warc.gz	5710773870	download job
rip.ie-inf-20240503-033311-bq1lh-00004.warc.os.cdx.gz	1834	download
scepsis.net-inf-20240502-141253-dhyqg-00007.warc.gz	3415692576	download job
scepsis.net-inf-20240502-141253-dhyqg-00007.warc.os.cdx.gz	99282	download
scepsis.net-inf-20240502-141253-dhyqg-meta.warc.gz	38228117	download job
scepsis.net-inf-20240502-141253-dhyqg-meta.warc.os.cdx.gz	47	download
scepsis.net-inf-20240502-141253-dhyqg.json	238	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-06655.warc.gz	5732900128	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-06655.warc.os.cdx.gz	934	download
storage.googleapis.com-inf-20240301-202801-5jgg7-06656.warc.gz	5531916853	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-06656.warc.os.cdx.gz	890	download
storage.googleapis.com-inf-20240301-202801-5jgg7-06657.warc.gz	5481669846	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-06657.warc.os.cdx.gz	896	download
tedium.co-inf-20240430-203321-3rhcc-00037.warc.gz	5368859077	download job
tedium.co-inf-20240430-203321-3rhcc-00037.warc.os.cdx.gz	2731146	download
urls-transfer.archivete.am-2024-05-01_eclipse-mailing-list-pages.txt-shallow-20240501-210640-3tk9q-00001.warc.gz	132185541	download job
urls-transfer.archivete.am-2024-05-01_eclipse-mailing-list-pages.txt-shallow-20240501-210640-3tk9q-00001.warc.os.cdx.gz	282490	download
urls-transfer.archivete.am-2024-05-01_eclipse-mailing-list-pages.txt-shallow-20240501-210640-3tk9q-meta.warc.gz	12422621	download job
urls-transfer.archivete.am-2024-05-01_eclipse-mailing-list-pages.txt-shallow-20240501-210640-3tk9q-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-2024-05-01_eclipse-mailing-list-pages.txt-shallow-20240501-210640-3tk9q-urls.txt	34471373	download
urls-transfer.archivete.am-2024-05-01_eclipse-mailing-list-pages.txt-shallow-20240501-210640-3tk9q.json	375	download job
urls-transfer.archivete.am-sbnation_Steel-Curtain-Network-A-Pittsburgh-Steelers-podcast.txt-shallow-20240503-083528-5yi3q-00006.warc.gz	5377244735	download job
urls-transfer.archivete.am-sbnation_Steel-Curtain-Network-A-Pittsburgh-Steelers-podcast.txt-shallow-20240503-083528-5yi3q-00006.warc.os.cdx.gz	38553	download
urls-transfer.archivete.am-workshop.abcvg.info_seed_urls.txt-inf-20240425-164117-br34y-00488.warc.gz	5396308870	download job
urls-transfer.archivete.am-workshop.abcvg.info_seed_urls.txt-inf-20240425-164117-br34y-00488.warc.os.cdx.gz	6859	download
utcc.utoronto.ca-shallow-20240503-122746-7vixt-00000.warc.gz	3825	download job
utcc.utoronto.ca-shallow-20240503-122746-7vixt-00000.warc.os.cdx.gz	258	download
utcc.utoronto.ca-shallow-20240503-122746-7vixt-meta.warc.gz	3459	download job
utcc.utoronto.ca-shallow-20240503-122746-7vixt-meta.warc.os.cdx.gz	47	download
utcc.utoronto.ca-shallow-20240503-122746-7vixt.json	291	download job
wissenschaft3000.wordpress.com-inf-20240430-203453-33pk9-00073.warc.gz	5456536664	download job
wissenschaft3000.wordpress.com-inf-20240430-203453-33pk9-00073.warc.os.cdx.gz	2298747	download
www.atomseek.com-inf-20240203-212558-8gi8p-00320.warc.gz	5368952344	download job
www.atomseek.com-inf-20240203-212558-8gi8p-00320.warc.os.cdx.gz	2412880	download
www.dushanwegner.com-inf-20240501-203729-bf5p8-00042.warc.gz	5435829431	download job
www.dushanwegner.com-inf-20240501-203729-bf5p8-00042.warc.os.cdx.gz	5729763	download
www.electricsoul.com-inf-20240427-092111-6ey8k-00080.warc.gz	5372760728	download job
www.electricsoul.com-inf-20240427-092111-6ey8k-00080.warc.os.cdx.gz	777447	download
www.greenhouseschool.org-inf-20240503-124212-1sk49-00000.warc.gz	17674606	download job
www.greenhouseschool.org-inf-20240503-124212-1sk49-00000.warc.os.cdx.gz	27332	download
www.greenhouseschool.org-inf-20240503-124212-1sk49-meta.warc.gz	20881	download job
www.greenhouseschool.org-inf-20240503-124212-1sk49-meta.warc.os.cdx.gz	47	download
www.greenhouseschool.org-inf-20240503-124212-1sk49.json	255	download job
www.mhonarc.org-inf-20240501-085716-ccmqi-00005.warc.gz	5487326109	download job
www.mhonarc.org-inf-20240501-085716-ccmqi-00005.warc.os.cdx.gz	2784482	download
www.mhonarc.org-inf-20240501-085716-ccmqi-00006.warc.gz	5652463384	download job
www.mhonarc.org-inf-20240501-085716-ccmqi-00006.warc.os.cdx.gz	6146	download
www.nakedcapitalism.com-inf-20240327-011540-4qq9p-00481.warc.gz	5619203555	download job
www.nakedcapitalism.com-inf-20240327-011540-4qq9p-00481.warc.os.cdx.gz	529391	download
www.warbirdinformationexchange.org-inf-20240502-081708-1jd5w-00010.warc.gz	5370034728	download job
www.warbirdinformationexchange.org-inf-20240502-081708-1jd5w-00010.warc.os.cdx.gz	17359	download