Item archiveteam_archivebot_go_20250418145344_efd8b38d

Filename	Size
archiveteam_archivebot_go_20250418145344_efd8b38d.cdx.gz	14273701	download
archiveteam_archivebot_go_20250418145344_efd8b38d.cdx.idx	15786	download
archiveteam_archivebot_go_20250418145344_efd8b38d_files.xml	0	download
archiveteam_archivebot_go_20250418145344_efd8b38d_meta.sqlite	61440	download
archiveteam_archivebot_go_20250418145344_efd8b38d_meta.xml	881	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-06918.warc.gz	6489208232	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-06918.warc.os.cdx.gz	972	download
portal.nersc.gov-inf-20250411-235739-duomw-00241.warc.gz	5409281709	download job
portal.nersc.gov-inf-20250411-235739-duomw-00241.warc.os.cdx.gz	1741	download
public.dhe.ibm.com-inf-20250416-120237-a9nyc-00036.warc.gz	5644918339	download job
public.dhe.ibm.com-inf-20250416-120237-a9nyc-00036.warc.os.cdx.gz	1444	download
urls-transfer.archivete.am-2025-04-18_mirror.reenigne.net_2jmc92jux0fpj88b85ulzfdr0_failures.txt-shallow-20250418-013713-6bcn9-00042.warc.gz	8204812885	download job
urls-transfer.archivete.am-2025-04-18_mirror.reenigne.net_2jmc92jux0fpj88b85ulzfdr0_failures.txt-shallow-20250418-013713-6bcn9-00042.warc.os.cdx.gz	421	download
urls-transfer.archivete.am-afroamcivilwar.org_seed_urls.txt-inf-20250416-050705-4m6rn-00006.warc.gz	5368902066	download job
urls-transfer.archivete.am-afroamcivilwar.org_seed_urls.txt-inf-20250416-050705-4m6rn-00006.warc.os.cdx.gz	1013483	download
urls-transfer.archivete.am-cdn-prod.playfirst.com_urls_part_08.txt-shallow-20250414-223308-ecoym-00051.warc.gz	5368766549	download job
urls-transfer.archivete.am-cdn-prod.playfirst.com_urls_part_08.txt-shallow-20250414-223308-ecoym-00051.warc.os.cdx.gz	9066181	download
urls-transfer.archivete.am-ebi.ac.uk_subdomains.txt-inf-20250412-060252-cl3rw-00075.warc.gz	5513591859	download job
urls-transfer.archivete.am-ebi.ac.uk_subdomains.txt-inf-20250412-060252-cl3rw-00075.warc.os.cdx.gz	810	download
urls-transfer.archivete.am-monarchinitiative.org_subdomains.txt-inf-20250411-053510-c3hjt-00149.warc.gz	13877068882	download job
urls-transfer.archivete.am-monarchinitiative.org_subdomains.txt-inf-20250411-053510-c3hjt-00149.warc.os.cdx.gz	807	download
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00475.warc.gz	5395423492	download job
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00475.warc.os.cdx.gz	16700	download
urls-transfer.archivete.am-skinregeneration.org_subdomains.txt-inf-20250411-045441-8aqot-00085.warc.gz	5368951327	download job
urls-transfer.archivete.am-skinregeneration.org_subdomains.txt-inf-20250411-045441-8aqot-00085.warc.os.cdx.gz	644421	download
urls-transfer.archivete.am-skinregeneration.org_subdomains.txt-inf-20250411-045441-8aqot-00086.warc.gz	5368788886	download job
urls-transfer.archivete.am-skinregeneration.org_subdomains.txt-inf-20250411-045441-8aqot-00086.warc.os.cdx.gz	789173	download
videocast.nih.gov-inf-20250411-131031-4l9c9-00445.warc.gz	5455170856	download job
videocast.nih.gov-inf-20250411-131031-4l9c9-00445.warc.os.cdx.gz	987	download
videocast.nih.gov-inf-20250411-131031-4l9c9-00446.warc.gz	5897367767	download job
videocast.nih.gov-inf-20250411-131031-4l9c9-00446.warc.os.cdx.gz	887	download
www.npr.org-inf-20250330-091933-craqr-00450.warc.gz	5374261009	download job
www.npr.org-inf-20250330-091933-craqr-00450.warc.os.cdx.gz	751846	download
www.pbs.org-inf-20250330-092508-bykmh-02140.warc.gz	5509824103	download job
www.pbs.org-inf-20250330-092508-bykmh-02140.warc.os.cdx.gz	21689	download
www.pbs.org-inf-20250330-092508-bykmh-02141.warc.gz	5486264395	download job
www.pbs.org-inf-20250330-092508-bykmh-02141.warc.os.cdx.gz	19374	download
www.sciencebase.gov-inf-20250204-024621-3gyep-04831.warc.gz	5388233822	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-04831.warc.os.cdx.gz	100669	download
www.sciencebase.gov-inf-20250204-024621-3gyep-04832.warc.gz	5372747661	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-04832.warc.os.cdx.gz	77680	download
www.sciencebase.gov-inf-20250204-024621-3gyep-04833.warc.gz	5376154865	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-04833.warc.os.cdx.gz	75120	download
www.usgs.gov-inf-20250404-060507-d6v2m-00182.warc.gz	5369460703	download job
www.usgs.gov-inf-20250404-060507-d6v2m-00182.warc.os.cdx.gz	1952378	download