Item archiveteam_archivebot_go_20250214043420_d665c61e

Filename	Size
agricolaverkko.fi-inf-20250213-093404-a3v60-00003.warc.gz	5368718129	download job
agricolaverkko.fi-inf-20250213-093404-a3v60-00003.warc.os.cdx.gz	2655722	download
archiveteam_archivebot_go_20250214043420_d665c61e.cdx.gz	17191954	download
archiveteam_archivebot_go_20250214043420_d665c61e.cdx.idx	18177	download
archiveteam_archivebot_go_20250214043420_d665c61e_files.xml	0	download
archiveteam_archivebot_go_20250214043420_d665c61e_meta.sqlite	90112	download
archiveteam_archivebot_go_20250214043420_d665c61e_meta.xml	1047	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-00506.warc.gz	10758163020	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-00506.warc.os.cdx.gz	655	download
eiweb.ccf.org-inf-20250214-042732-2r8qd-00000.warc.gz	15470	download job
eiweb.ccf.org-inf-20250214-042732-2r8qd-00000.warc.os.cdx.gz	496	download
eiweb.ccf.org-inf-20250214-042732-2r8qd-meta.warc.gz	3590	download job
eiweb.ccf.org-inf-20250214-042732-2r8qd-meta.warc.os.cdx.gz	47	download
eiweb.ccf.org-inf-20250214-042732-2r8qd.json	244	download job
gaftp.epa.gov-inf-20250202-142657-6l7f5-00124.warc.gz	5514511875	download job
gaftp.epa.gov-inf-20250202-142657-6l7f5-00124.warc.os.cdx.gz	34211	download
healthcareedu.ccf.org-inf-20250214-040138-cfm99-00000.warc.gz	461037994	download job
healthcareedu.ccf.org-inf-20250214-040138-cfm99-00000.warc.os.cdx.gz	126596	download
healthcareedu.ccf.org-inf-20250214-040138-cfm99-meta.warc.gz	113806	download job
healthcareedu.ccf.org-inf-20250214-040138-cfm99-meta.warc.os.cdx.gz	47	download
healthcareedu.ccf.org-inf-20250214-040138-cfm99.json	252	download job
massgrave.dev-inf-20250214-034532-c8iaq-00003.warc.gz	5402285576	download job
massgrave.dev-inf-20250214-034532-c8iaq-00003.warc.os.cdx.gz	440	download
massgrave.dev-inf-20250214-034532-c8iaq-00004.warc.gz	6344848706	download job
massgrave.dev-inf-20250214-034532-c8iaq-00004.warc.os.cdx.gz	1804	download
massgrave.dev-inf-20250214-034532-c8iaq-00005.warc.gz	6053376175	download job
massgrave.dev-inf-20250214-034532-c8iaq-00005.warc.os.cdx.gz	979	download
massgrave.dev-inf-20250214-034532-c8iaq-00006.warc.gz	6102650912	download job
massgrave.dev-inf-20250214-034532-c8iaq-00006.warc.os.cdx.gz	1195	download
rheum.ccf.org-inf-20250214-033317-79ufx-00000.warc.gz	1752196292	download job
rheum.ccf.org-inf-20250214-033317-79ufx-00000.warc.os.cdx.gz	1719051	download
rheum.ccf.org-inf-20250214-033317-79ufx-meta.warc.gz	945604	download job
rheum.ccf.org-inf-20250214-033317-79ufx-meta.warc.os.cdx.gz	47	download
rheum.ccf.org-inf-20250214-033317-79ufx.json	244	download job
urls-transfer.archivete.am-api.rubinobservatory.org_urls.txt-shallow-20250214-041954-510it-00000.warc.gz	41324	download job
urls-transfer.archivete.am-api.rubinobservatory.org_urls.txt-shallow-20250214-041954-510it-00000.warc.os.cdx.gz	2300	download
urls-transfer.archivete.am-api.rubinobservatory.org_urls.txt-shallow-20250214-041954-510it-meta.warc.gz	4967	download job
urls-transfer.archivete.am-api.rubinobservatory.org_urls.txt-shallow-20250214-041954-510it-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-api.rubinobservatory.org_urls.txt-shallow-20250214-041954-510it-urls.txt	22091	download
urls-transfer.archivete.am-api.rubinobservatory.org_urls.txt-shallow-20250214-041954-510it.json	376	download job
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01792.warc.gz	5397722466	download job
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01792.warc.os.cdx.gz	7033	download
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01793.warc.gz	5373250650	download job
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01793.warc.os.cdx.gz	7262	download
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-00720.warc.gz	5384603586	download job
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-00720.warc.os.cdx.gz	21595	download
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-00721.warc.gz	5453587492	download job
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-00721.warc.os.cdx.gz	25497	download
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-00722.warc.gz	5425498163	download job
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-00722.warc.os.cdx.gz	26486	download
urls-transfer.archivete.am-www.europe-solidaire.org.txt-inf-20250108-125529-416ez-00231.warc.gz	5369764575	download job
urls-transfer.archivete.am-www.europe-solidaire.org.txt-inf-20250108-125529-416ez-00231.warc.os.cdx.gz	5825639	download
urls-transfer.archivete.am-www.hsdl.org_seed_urls.txt-inf-20250212-070728-d1q93-00011.warc.gz	6856581840	download job
urls-transfer.archivete.am-www.hsdl.org_seed_urls.txt-inf-20250212-070728-d1q93-00011.warc.os.cdx.gz	1819	download
www.dni.gov-inf-20250213-212624-6b383-00005.warc.gz	6097354829	download job
www.dni.gov-inf-20250213-212624-6b383-00005.warc.os.cdx.gz	3308209	download
www.fs.usda.gov-inf-20250203-040015-9klc9-00261.warc.gz	6438856995	download job
www.fs.usda.gov-inf-20250203-040015-9klc9-00261.warc.os.cdx.gz	10349	download
www.nrc.gov-inf-20250203-010245-clhpa-00016.warc.gz	5368733864	download job
www.nrc.gov-inf-20250203-010245-clhpa-00016.warc.os.cdx.gz	295351	download
www.plannedparenthood.org-inf-20250213-082341-6j3h0-00003.warc.gz	5371272592	download job
www.plannedparenthood.org-inf-20250213-082341-6j3h0-00003.warc.os.cdx.gz	2377378	download
www.ptsd.va.gov-inf-20250214-022351-6isrb-00000.warc.gz	5370346565	download job
www.ptsd.va.gov-inf-20250214-022351-6isrb-00000.warc.os.cdx.gz	1382043	download
www.spaceforce.mil-inf-20250126-104111-c3t8z-01376.warc.gz	5376257982	download job
www.spaceforce.mil-inf-20250126-104111-c3t8z-01376.warc.os.cdx.gz	23115	download