Item archiveteam_archivebot_go_20250405012858_531d863e

Filename	Size
archiveteam_archivebot_go_20250405012858_531d863e.cdx.gz	17447988	download
archiveteam_archivebot_go_20250405012858_531d863e.cdx.idx	18656	download
archiveteam_archivebot_go_20250405012858_531d863e_files.xml	0	download
archiveteam_archivebot_go_20250405012858_531d863e_meta.sqlite	20480	download
archiveteam_archivebot_go_20250405012858_531d863e_meta.xml	881	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-05662.warc.gz	8940778225	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-05662.warc.os.cdx.gz	775	download
defence-industry.eu-inf-20250404-131529-eqbrh-00001.warc.gz	5368744348	download job
defence-industry.eu-inf-20250404-131529-eqbrh-00001.warc.os.cdx.gz	2529469	download
files.scene.org-inf-20250403-155646-7mm68-00073.warc.gz	8346786186	download job
files.scene.org-inf-20250403-155646-7mm68-00073.warc.os.cdx.gz	687	download
files.scene.org-inf-20250403-155646-7mm68-00074.warc.gz	8019351273	download job
files.scene.org-inf-20250403-155646-7mm68-00074.warc.os.cdx.gz	441	download
hr.umich.edu-inf-20250404-182054-6zizt-00000.warc.gz	5391524328	download job
hr.umich.edu-inf-20250404-182054-6zizt-00000.warc.os.cdx.gz	3058197	download
ipsw.me-inf-20241201-145231-9lrev-06900.warc.gz	6061702073	download job
ipsw.me-inf-20241201-145231-9lrev-06900.warc.os.cdx.gz	1429	download
urls-transfer.archivete.am-adw.org_subdomains.txt-inf-20250403-221051-3u4nl-00008.warc.gz	5368788101	download job
urls-transfer.archivete.am-adw.org_subdomains.txt-inf-20250403-221051-3u4nl-00008.warc.os.cdx.gz	2326136	download
urls-transfer.archivete.am-ourlummiisland.org_junk_subdomains.txt-inf-20250405-010453-3d1mx-00000.warc.gz	238355190	download job
urls-transfer.archivete.am-ourlummiisland.org_junk_subdomains.txt-inf-20250405-010453-3d1mx-00000.warc.os.cdx.gz	360022	download
urls-transfer.archivete.am-ourlummiisland.org_junk_subdomains.txt-inf-20250405-010453-3d1mx-meta.warc.gz	201800	download job
urls-transfer.archivete.am-ourlummiisland.org_junk_subdomains.txt-inf-20250405-010453-3d1mx-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-ourlummiisland.org_junk_subdomains.txt-inf-20250405-010453-3d1mx-urls.txt	1046	download
urls-transfer.archivete.am-ourlummiisland.org_junk_subdomains.txt-inf-20250405-010453-3d1mx.json	368	download job
uswheat.org-inf-20250404-040212-62n5q-00005.warc.gz	5474243210	download job
uswheat.org-inf-20250404-040212-62n5q-00005.warc.os.cdx.gz	300331	download
www.ars.usda.gov-inf-20250306-151524-z1x7l-00502.warc.gz	42025560984	download job
www.ars.usda.gov-inf-20250306-151524-z1x7l-00502.warc.os.cdx.gz	330	download
www.pbs.org-inf-20250330-092508-bykmh-00456.warc.gz	6074120190	download job
www.pbs.org-inf-20250330-092508-bykmh-00456.warc.os.cdx.gz	8138	download
www.sciencebase.gov-inf-20250204-024621-3gyep-02641.warc.gz	5375868681	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-02641.warc.os.cdx.gz	165661	download
www.spc.noaa.gov-inf-20250326-171522-53voz-00037.warc.gz	5368810414	download job
www.spc.noaa.gov-inf-20250326-171522-53voz-00037.warc.os.cdx.gz	6351448	download
www.usafencing.org-inf-20250404-190338-3wcuq-00001.warc.gz	5369968301	download job
www.usafencing.org-inf-20250404-190338-3wcuq-00001.warc.os.cdx.gz	2775976	download
www.voaafrica.com-inf-20250318-081912-1fye9-01860.warc.gz	5534164369	download job
www.voaafrica.com-inf-20250318-081912-1fye9-01860.warc.os.cdx.gz	4418	download