Item archiveteam_archivebot_go_20250413090649_6cb8aa4f

Filename	Size
archiveteam_archivebot_go_20250413090649_6cb8aa4f.cdx.gz	14327081	download
archiveteam_archivebot_go_20250413090649_6cb8aa4f.cdx.idx	20618	download
archiveteam_archivebot_go_20250413090649_6cb8aa4f_files.xml	0	download
archiveteam_archivebot_go_20250413090649_6cb8aa4f_meta.sqlite	114688	download
archiveteam_archivebot_go_20250413090649_6cb8aa4f_meta.xml	1047	download
atlas.ai.umich.edu-inf-20250413-083555-7a3ru-00000.warc.gz	207130973	download job
atlas.ai.umich.edu-inf-20250413-083555-7a3ru-00000.warc.os.cdx.gz	294289	download
atlas.ai.umich.edu-inf-20250413-083555-7a3ru-meta.warc.gz	183493	download job
atlas.ai.umich.edu-inf-20250413-083555-7a3ru-meta.warc.os.cdx.gz	47	download
atlas.ai.umich.edu-inf-20250413-083555-7a3ru.json	246	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-06596.warc.gz	5819990692	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-06596.warc.os.cdx.gz	1000	download
das.sdss.org-inf-20250226-051304-5s39o-00704.warc.gz	5374042966	download job
das.sdss.org-inf-20250226-051304-5s39o-00704.warc.os.cdx.gz	261631	download
data.4dnucleome.org-inf-20250411-043433-d4rx8-00077.warc.gz	21429989964	download job
data.4dnucleome.org-inf-20250411-043433-d4rx8-00077.warc.os.cdx.gz	3896	download
fsg.rostec.ru-inf-20250413-085524-daic6-00000.warc.gz	3063294	download job
fsg.rostec.ru-inf-20250413-085524-daic6-00000.warc.os.cdx.gz	8883	download
fsg.rostec.ru-inf-20250413-085524-daic6-meta.warc.gz	9071	download job
fsg.rostec.ru-inf-20250413-085524-daic6-meta.warc.os.cdx.gz	47	download
fsg.rostec.ru-inf-20250413-085524-daic6.json	241	download job
ipsw.me-inf-20241201-145231-9lrev-07346.warc.gz	6036670415	download job
ipsw.me-inf-20241201-145231-9lrev-07346.warc.os.cdx.gz	1779	download
kulturerbe.niedersachsen.de-inf-20250404-122217-exwh2-00026.warc.gz	5368760918	download job
kulturerbe.niedersachsen.de-inf-20250404-122217-exwh2-00026.warc.os.cdx.gz	5199154	download
lk.rostec.ru-inf-20250413-085710-6t540-aborted-00000.warc.gz	4314976	download job
lk.rostec.ru-inf-20250413-085710-6t540-aborted-00000.warc.os.cdx.gz	4866	download
lk.rostec.ru-inf-20250413-085710-6t540-aborted-wpull.log.gz	4779	download
lk.rostec.ru-inf-20250413-085710-6t540-aborted.json	239	download job
mirror.reenigne.net-inf-20250411-232553-2jmc9-00133.warc.gz	5401588865	download job
mirror.reenigne.net-inf-20250411-232553-2jmc9-00133.warc.os.cdx.gz	3388	download
paradisehistoricalsociety.ca-inf-20250413-071924-672ac-00000.warc.gz	1856456493	download job
paradisehistoricalsociety.ca-inf-20250413-071924-672ac-00000.warc.os.cdx.gz	799917	download
paradisehistoricalsociety.ca-inf-20250413-071924-672ac-meta.warc.gz	1041938	download job
paradisehistoricalsociety.ca-inf-20250413-071924-672ac-meta.warc.os.cdx.gz	47	download
paradisehistoricalsociety.ca-inf-20250413-071924-672ac.json	259	download job
playground.rd-connect.eu-inf-20250413-085728-89gal-00000.warc.gz	19471502	download job
playground.rd-connect.eu-inf-20250413-085728-89gal-00000.warc.os.cdx.gz	70727	download
playground.rd-connect.eu-inf-20250413-085728-89gal-meta.warc.gz	41575	download job
playground.rd-connect.eu-inf-20250413-085728-89gal-meta.warc.os.cdx.gz	47	download
playground.rd-connect.eu-inf-20250413-085728-89gal.json	252	download job
scloud.rostec.ru-inf-20250413-085910-96h21-00000.warc.gz	15245165	download job
scloud.rostec.ru-inf-20250413-085910-96h21-00000.warc.os.cdx.gz	10073	download
scloud.rostec.ru-inf-20250413-085910-96h21-meta.warc.gz	12350	download job
scloud.rostec.ru-inf-20250413-085910-96h21-meta.warc.os.cdx.gz	47	download
scloud.rostec.ru-inf-20250413-085910-96h21.json	244	download job
sorin.stati.free.fr-inf-20250413-085448-27r4i-00000.warc.gz	991086	download job
sorin.stati.free.fr-inf-20250413-085448-27r4i-00000.warc.os.cdx.gz	2385	download
sorin.stati.free.fr-inf-20250413-085448-27r4i-meta.warc.gz	4683	download job
sorin.stati.free.fr-inf-20250413-085448-27r4i-meta.warc.os.cdx.gz	47	download
sorin.stati.free.fr-inf-20250413-085448-27r4i.json	248	download job
thenewamerican.com-inf-20250403-031403-49e0d-00707.warc.gz	5531123161	download job
thenewamerican.com-inf-20250403-031403-49e0d-00707.warc.os.cdx.gz	877	download
thenewamerican.com-inf-20250403-031403-49e0d-00708.warc.gz	6973404569	download job
thenewamerican.com-inf-20250403-031403-49e0d-00708.warc.os.cdx.gz	837	download
urls-transfer.archivete.am-gov.ro_junk-subdomains.txt-inf-20250413-075817-6onfh-00000.warc.gz	126890029	download job
urls-transfer.archivete.am-gov.ro_junk-subdomains.txt-inf-20250413-075817-6onfh-00000.warc.os.cdx.gz	165831	download
urls-transfer.archivete.am-gov.ro_junk-subdomains.txt-inf-20250413-075817-6onfh-meta.warc.gz	131276	download job
urls-transfer.archivete.am-gov.ro_junk-subdomains.txt-inf-20250413-075817-6onfh-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-gov.ro_junk-subdomains.txt-inf-20250413-075817-6onfh-urls.txt	7148	download
urls-transfer.archivete.am-gov.ro_junk-subdomains.txt-inf-20250413-075817-6onfh.json	341	download job
urls-transfer.archivete.am-plala.jp_seed_urls.txt-inf-20250330-064232-1z311-00082.warc.gz	5378243546	download job
urls-transfer.archivete.am-plala.jp_seed_urls.txt-inf-20250330-064232-1z311-00082.warc.os.cdx.gz	7501	download
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00309.warc.gz	5369810385	download job
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00309.warc.os.cdx.gz	27879	download
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_images_full.txt-shallow-20250409-223924-8n4dx-00122.warc.gz	5368712325	download job
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_images_full.txt-shallow-20250409-223924-8n4dx-00122.warc.os.cdx.gz	4671231	download
urls-transfer.archivete.am-www.washingtonruralheritage.org_urls.txt-shallow-20250410-181649-9vqy1-00025.warc.gz	5368897135	download job
urls-transfer.archivete.am-www.washingtonruralheritage.org_urls.txt-shallow-20250410-181649-9vqy1-00025.warc.os.cdx.gz	994379	download
vcs.rostec.ru-inf-20250413-090356-8b8ok-00000.warc.gz	500367	download job
vcs.rostec.ru-inf-20250413-090356-8b8ok-00000.warc.os.cdx.gz	1957	download
vcs.rostec.ru-inf-20250413-090356-8b8ok-meta.warc.gz	4482	download job
vcs.rostec.ru-inf-20250413-090356-8b8ok-meta.warc.os.cdx.gz	47	download
vcs.rostec.ru-inf-20250413-090356-8b8ok.json	241	download job
www.pbs.org-inf-20250330-092508-bykmh-01528.warc.gz	5707751196	download job
www.pbs.org-inf-20250330-092508-bykmh-01528.warc.os.cdx.gz	30796	download
www.pbs.org-inf-20250330-092508-bykmh-01529.warc.gz	5475961593	download job
www.pbs.org-inf-20250330-092508-bykmh-01529.warc.os.cdx.gz	21955	download
www.sciencebase.gov-inf-20250204-024621-3gyep-03889.warc.gz	5394137357	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-03889.warc.os.cdx.gz	142979	download
www.sciencebase.gov-inf-20250204-024621-3gyep-03890.warc.gz	5426234047	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-03890.warc.os.cdx.gz	137967	download
www.seattlejapanesegarden.org-inf-20250413-064008-2cyeg-00000.warc.gz	5370801940	download job
www.seattlejapanesegarden.org-inf-20250413-064008-2cyeg-00000.warc.os.cdx.gz	1872966	download
zenius-i-vanisher.com-inf-20250412-175045-apitj-00033.warc.gz	6044408466	download job
zenius-i-vanisher.com-inf-20250412-175045-apitj-00033.warc.os.cdx.gz	159432	download