Item archiveteam_archivebot_go_20250410064338_deff954b

Filename	Size
angle.ankura.com-inf-20250409-234558-12iut-00001.warc.gz	5375796503	download job
angle.ankura.com-inf-20250409-234558-12iut-00001.warc.os.cdx.gz	2838072	download
archiveteam_archivebot_go_20250410064338_deff954b.cdx.gz	81700773	download
archiveteam_archivebot_go_20250410064338_deff954b.cdx.idx	130015	download
archiveteam_archivebot_go_20250410064338_deff954b_files.xml	0	download
archiveteam_archivebot_go_20250410064338_deff954b_meta.sqlite	61440	download
archiveteam_archivebot_go_20250410064338_deff954b_meta.xml	881	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-06336.warc.gz	5490140184	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-06336.warc.os.cdx.gz	691	download
curtisrcouchdds.com-inf-20250410-052051-bkqk2-00000.warc.gz	1432792858	download job
curtisrcouchdds.com-inf-20250410-052051-bkqk2-00000.warc.os.cdx.gz	743414	download
curtisrcouchdds.com-inf-20250410-052051-bkqk2-meta.warc.gz	490597	download job
curtisrcouchdds.com-inf-20250410-052051-bkqk2-meta.warc.os.cdx.gz	47	download
curtisrcouchdds.com-inf-20250410-052051-bkqk2.json	244	download job
davcp.com-inf-20250410-061956-4djmq-00000.warc.gz	115153765	download job
davcp.com-inf-20250410-061956-4djmq-00000.warc.os.cdx.gz	159141	download
davcp.com-inf-20250410-061956-4djmq-meta.warc.gz	111765	download job
davcp.com-inf-20250410-061956-4djmq-meta.warc.os.cdx.gz	47	download
davcp.com-inf-20250410-061956-4djmq.json	234	download job
deadtoast.com-inf-20250410-063945-4ekfh-meta.warc.gz	27887	download job
deadtoast.com-inf-20250410-063945-4ekfh-meta.warc.os.cdx.gz	47	download
deadtoast.com-inf-20250410-063945-4ekfh.json	238	download job
e621.net-inf-20250410-061631-kxtdz-00000.warc.gz	92277806	download job
e621.net-inf-20250410-061631-kxtdz-00000.warc.os.cdx.gz	200784	download
e621.net-inf-20250410-061631-kxtdz-meta.warc.gz	123010	download job
e621.net-inf-20250410-061631-kxtdz-meta.warc.os.cdx.gz	47	download
e621.net-inf-20250410-061631-kxtdz.json	251	download job
fragdenstaat.de-inf-20250215-082121-boxqa-00671.warc.gz	5369846918	download job
fragdenstaat.de-inf-20250215-082121-boxqa-00671.warc.os.cdx.gz	1316621	download
kulturerbe.niedersachsen.de-inf-20250404-122217-exwh2-00020.warc.gz	5368799454	download job
kulturerbe.niedersachsen.de-inf-20250404-122217-exwh2-00020.warc.os.cdx.gz	4541271	download
old.playworld.com-inf-20250409-235507-9hfka-00001.warc.gz	2604030346	download job
old.playworld.com-inf-20250409-235507-9hfka-00001.warc.os.cdx.gz	2076994	download
old.playworld.com-inf-20250409-235507-9hfka-meta.warc.gz	4021356	download job
old.playworld.com-inf-20250409-235507-9hfka-meta.warc.os.cdx.gz	47	download
old.playworld.com-inf-20250409-235507-9hfka.json	248	download job
re-publica.com-inf-20250409-193355-chhic-00013.warc.gz	5396876742	download job
re-publica.com-inf-20250409-193355-chhic-00013.warc.os.cdx.gz	555267	download
thenewamerican.com-inf-20250403-031403-49e0d-00568.warc.gz	5849414663	download job
thenewamerican.com-inf-20250403-031403-49e0d-00568.warc.os.cdx.gz	1536	download
urls-transfer.archivete.am-nomadglobal.com_subdomains.txt-inf-20250410-005410-7x9d2-00000.warc.gz	5368709967	download job
urls-transfer.archivete.am-nomadglobal.com_subdomains.txt-inf-20250410-005410-7x9d2-00000.warc.os.cdx.gz	4493914	download
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00048.warc.gz	5561237652	download job
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00048.warc.os.cdx.gz	28152	download
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00049.warc.gz	5469033262	download job
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00049.warc.os.cdx.gz	20474	download
urls-transfer.archivete.am-www.pubpub.org_subdomains.txt-inf-20250311-024436-4me3d-00108.warc.gz	5416041183	download job
urls-transfer.archivete.am-www.pubpub.org_subdomains.txt-inf-20250311-024436-4me3d-00108.warc.os.cdx.gz	25721	download
worstgen.alwaysdata.net-inf-20250403-072755-61ozc-00034.warc.gz	5369582412	download job
worstgen.alwaysdata.net-inf-20250403-072755-61ozc-00034.warc.os.cdx.gz	574401	download
www.campaignmoney.com-inf-20250330-164155-1qcfh-00004.warc.gz	5368714516	download job
www.campaignmoney.com-inf-20250330-164155-1qcfh-00004.warc.os.cdx.gz	64577635	download
www.history.navy.mil-inf-20250401-032717-c1m68-00253.warc.gz	5380084025	download job
www.history.navy.mil-inf-20250401-032717-c1m68-00253.warc.os.cdx.gz	63728	download
www.pastperfect-online.com-inf-20250410-052019-807mo-00000.warc.gz	827495679	download job
www.pastperfect-online.com-inf-20250410-052019-807mo-00000.warc.os.cdx.gz	642194	download
www.pastperfect-online.com-inf-20250410-052019-807mo-meta.warc.gz	487951	download job
www.pastperfect-online.com-inf-20250410-052019-807mo-meta.warc.os.cdx.gz	47	download
www.pastperfect-online.com-inf-20250410-052019-807mo.json	256	download job
www.pbs.org-inf-20250330-092508-bykmh-01145.warc.gz	6375174079	download job
www.pbs.org-inf-20250330-092508-bykmh-01145.warc.os.cdx.gz	4552	download
www.sciencebase.gov-inf-20250204-024621-3gyep-03459.warc.gz	5450632039	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-03459.warc.os.cdx.gz	121520	download
www.sciencebase.gov-inf-20250204-024621-3gyep-03461.warc.gz	5371923779	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-03461.warc.os.cdx.gz	158199	download
www.sciencebase.gov-inf-20250204-024621-3gyep-03462.warc.gz	5408210582	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-03462.warc.os.cdx.gz	156740	download
www.sciencebase.gov-inf-20250204-024621-3gyep-03463.warc.gz	5382287275	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-03463.warc.os.cdx.gz	159463	download
www.usgs.gov-inf-20250404-060507-d6v2m-00050.warc.gz	5403204484	download job
www.usgs.gov-inf-20250404-060507-d6v2m-00050.warc.os.cdx.gz	552335	download
www.voadeewanews.com-inf-20250318-081603-6w6oc-01632.warc.gz	5383804366	download job
www.voadeewanews.com-inf-20250318-081603-6w6oc-01632.warc.os.cdx.gz	100400	download
www.wired.com-inf-20250222-101923-dg2iq-00427.warc.gz	5404531231	download job
www.wired.com-inf-20250222-101923-dg2iq-00427.warc.os.cdx.gz	1179058	download