Item archiveteam_archivebot_go_20250418070011_a2dc14ec

Filename	Size
archiveteam_archivebot_go_20250418070011_a2dc14ec.cdx.gz	33137311	download
archiveteam_archivebot_go_20250418070011_a2dc14ec.cdx.idx	37984	download
archiveteam_archivebot_go_20250418070011_a2dc14ec_files.xml	0	download
archiveteam_archivebot_go_20250418070011_a2dc14ec_meta.sqlite	49152	download
archiveteam_archivebot_go_20250418070011_a2dc14ec_meta.xml	881	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-06895.warc.gz	6762792430	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-06895.warc.os.cdx.gz	747	download
ctasia.com.my-inf-20250418-065847-2yxgr-00000.warc.gz	8189	download job
ctasia.com.my-inf-20250418-065847-2yxgr-00000.warc.os.cdx.gz	268	download
ctasia.com.my-inf-20250418-065847-2yxgr-meta.warc.gz	3518	download job
ctasia.com.my-inf-20250418-065847-2yxgr-meta.warc.os.cdx.gz	47	download
ctasia.com.my-inf-20250418-065847-2yxgr.json	244	download job
download.brainimagelibrary.org-inf-20250411-005122-dxu1p-00142.warc.gz	5603537103	download job
download.brainimagelibrary.org-inf-20250411-005122-dxu1p-00142.warc.os.cdx.gz	917	download
ioi-xd.net-inf-20250418-065301-b5wsu-00000.warc.gz	231519506	download job
ioi-xd.net-inf-20250418-065301-b5wsu-00000.warc.os.cdx.gz	69523	download
ioi-xd.net-inf-20250418-065301-b5wsu-meta.warc.gz	50331	download job
ioi-xd.net-inf-20250418-065301-b5wsu-meta.warc.os.cdx.gz	47	download
ioi-xd.net-inf-20250418-065301-b5wsu.json	241	download job
ipsw.me-inf-20241201-145231-9lrev-07588.warc.gz	5833495692	download job
ipsw.me-inf-20241201-145231-9lrev-07588.warc.os.cdx.gz	796	download
jpfo.org-inf-20250418-024829-8gw4m-00000.warc.gz	5375163264	download job
jpfo.org-inf-20250418-024829-8gw4m-00000.warc.os.cdx.gz	3074297	download
mfinante.gov.ro-inf-20250412-061202-6t62a-00077.warc.gz	5395543437	download job
mfinante.gov.ro-inf-20250412-061202-6t62a-00077.warc.os.cdx.gz	769786	download
opusdei.org-inf-20250414-193812-6z0c7-00012.warc.gz	5371323524	download job
opusdei.org-inf-20250414-193812-6z0c7-00012.warc.os.cdx.gz	4051771	download
ospo.noaa.gov-inf-20250404-151509-euinz-00344.warc.gz	5370065580	download job
ospo.noaa.gov-inf-20250404-151509-euinz-00344.warc.os.cdx.gz	166910	download
portal.nersc.gov-inf-20250411-235739-duomw-00214.warc.gz	5489606936	download job
portal.nersc.gov-inf-20250411-235739-duomw-00214.warc.os.cdx.gz	2179	download
urls-transfer.archivete.am-afroamcivilwar.org_seed_urls.txt-inf-20250416-050705-4m6rn-00003.warc.gz	5368825052	download job
urls-transfer.archivete.am-afroamcivilwar.org_seed_urls.txt-inf-20250416-050705-4m6rn-00003.warc.os.cdx.gz	565732	download
urls-transfer.archivete.am-doge.gov_savings_fpds.gov_usaspending.gov_links_2025-04-16.txt-shallow-20250416-185203-d9087-00000.warc.gz	2196754121	download job
urls-transfer.archivete.am-doge.gov_savings_fpds.gov_usaspending.gov_links_2025-04-16.txt-shallow-20250416-185203-d9087-00000.warc.os.cdx.gz	3188634	download
urls-transfer.archivete.am-doge.gov_savings_fpds.gov_usaspending.gov_links_2025-04-16.txt-shallow-20250416-185203-d9087-meta.warc.gz	1657037	download job
urls-transfer.archivete.am-doge.gov_savings_fpds.gov_usaspending.gov_links_2025-04-16.txt-shallow-20250416-185203-d9087-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-doge.gov_savings_fpds.gov_usaspending.gov_links_2025-04-16.txt-shallow-20250416-185203-d9087-urls.txt	5725125	download
urls-transfer.archivete.am-doge.gov_savings_fpds.gov_usaspending.gov_links_2025-04-16.txt-shallow-20250416-185203-d9087.json	420	download job
urls-transfer.archivete.am-ebi.ac.uk_subdomains.txt-inf-20250412-060252-cl3rw-00052.warc.gz	8680134509	download job
urls-transfer.archivete.am-ebi.ac.uk_subdomains.txt-inf-20250412-060252-cl3rw-00052.warc.os.cdx.gz	745	download
urls-transfer.archivete.am-ebi.ac.uk_subdomains.txt-inf-20250412-060252-cl3rw-00053.warc.gz	5908877824	download job
urls-transfer.archivete.am-ebi.ac.uk_subdomains.txt-inf-20250412-060252-cl3rw-00053.warc.os.cdx.gz	459	download
urls-transfer.archivete.am-gsrs.ncats.io_remaining-subdomains.txt-inf-20250412-052629-5c9oz-00007.warc.gz	5368729251	download job
urls-transfer.archivete.am-gsrs.ncats.io_remaining-subdomains.txt-inf-20250412-052629-5c9oz-00007.warc.os.cdx.gz	19434691	download
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00465.warc.gz	5371905905	download job
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00465.warc.os.cdx.gz	50289	download
urls-transfer.archivete.am-www.biblioteca-digitala.ro.txt-inf-20250414-185922-8dp4c-00157.warc.gz	5373382998	download job
urls-transfer.archivete.am-www.biblioteca-digitala.ro.txt-inf-20250414-185922-8dp4c-00157.warc.os.cdx.gz	61581	download
www.pbs.org-inf-20250330-092508-bykmh-02100.warc.gz	6625486025	download job
www.pbs.org-inf-20250330-092508-bykmh-02100.warc.os.cdx.gz	18445	download
www.pbs.org-inf-20250330-092508-bykmh-02101.warc.gz	5452800434	download job
www.pbs.org-inf-20250330-092508-bykmh-02101.warc.os.cdx.gz	12882	download
www.sciencebase.gov-inf-20250204-024621-3gyep-04759.warc.gz	5484697141	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-04759.warc.os.cdx.gz	90670	download
www.sciencebase.gov-inf-20250204-024621-3gyep-04760.warc.gz	5445244674	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-04760.warc.os.cdx.gz	95186	download
www.sciencebase.gov-inf-20250204-024621-3gyep-04761.warc.gz	5405948438	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-04761.warc.os.cdx.gz	114537	download
www.usgs.gov-inf-20250404-060507-d6v2m-00180.warc.gz	5368718981	download job
www.usgs.gov-inf-20250404-060507-d6v2m-00180.warc.os.cdx.gz	2117957	download