Item archiveteam_archivebot_go_20250420074842_66b2b1b3

Filename	Size
archiveteam_archivebot_go_20250420074842_66b2b1b3.cdx.gz	1598211	download
archiveteam_archivebot_go_20250420074842_66b2b1b3.cdx.idx	1877	download
archiveteam_archivebot_go_20250420074842_66b2b1b3_files.xml	0	download
archiveteam_archivebot_go_20250420074842_66b2b1b3_meta.sqlite	49152	download
archiveteam_archivebot_go_20250420074842_66b2b1b3_meta.xml	914	download
blog.flickr.net-inf-20250417-070550-2yvt6-00058.warc.gz	5368940427	download job
blog.flickr.net-inf-20250417-070550-2yvt6-00058.warc.os.cdx.gz	1102994	download
das.sdss.org-inf-20250226-051304-5s39o-00809.warc.gz	5371070373	download job
das.sdss.org-inf-20250226-051304-5s39o-00809.warc.os.cdx.gz	291483	download
documented.info-inf-20250420-073818-3fm76-00000.warc.gz	104890	download job
documented.info-inf-20250420-073818-3fm76-00000.warc.os.cdx.gz	1007	download
documented.info-inf-20250420-073818-3fm76-meta.warc.gz	4446	download job
documented.info-inf-20250420-073818-3fm76-meta.warc.os.cdx.gz	47	download
documented.info-inf-20250420-073818-3fm76-wpull.log.gz	1782	download
documented.info-inf-20250420-073818-3fm76.json	246	download job
granteehq.theajp.org-inf-20250420-074257-bhobf-00000.warc.gz	17949082	download job
granteehq.theajp.org-inf-20250420-074257-bhobf-00000.warc.os.cdx.gz	23977	download
granteehq.theajp.org-inf-20250420-074257-bhobf-meta.warc.gz	16663	download job
granteehq.theajp.org-inf-20250420-074257-bhobf-meta.warc.os.cdx.gz	47	download
granteehq.theajp.org-inf-20250420-074257-bhobf.json	251	download job
handbook.theajp.org-inf-20250420-074400-1ap1p-00000.warc.gz	17947541	download job
handbook.theajp.org-inf-20250420-074400-1ap1p-00000.warc.os.cdx.gz	23981	download
handbook.theajp.org-inf-20250420-074400-1ap1p-meta.warc.gz	16622	download job
handbook.theajp.org-inf-20250420-074400-1ap1p-meta.warc.os.cdx.gz	47	download
handbook.theajp.org-inf-20250420-074400-1ap1p.json	250	download job
ospo.noaa.gov-inf-20250404-151509-euinz-00395.warc.gz	5369244404	download job
ospo.noaa.gov-inf-20250404-151509-euinz-00395.warc.os.cdx.gz	221484	download
pastdeadline.com-inf-20250420-070655-bf9t1-00000.warc.gz	3670628938	download job
pastdeadline.com-inf-20250420-070655-bf9t1-00000.warc.os.cdx.gz	2101728	download
pastdeadline.com-inf-20250420-070655-bf9t1-meta.warc.gz	1847084	download job
pastdeadline.com-inf-20250420-070655-bf9t1-meta.warc.os.cdx.gz	47	download
pastdeadline.com-inf-20250420-070655-bf9t1.json	241	download job
portal.nersc.gov-inf-20250411-235739-duomw-00330.warc.gz	5558162985	download job
portal.nersc.gov-inf-20250411-235739-duomw-00330.warc.os.cdx.gz	2047	download
theajp.org-inf-20250420-073649-dnja7-00000.warc.gz	2623314	download job
theajp.org-inf-20250420-073649-dnja7-00000.warc.os.cdx.gz	5022	download
theajp.org-inf-20250420-073649-dnja7-meta.warc.gz	6428	download job
theajp.org-inf-20250420-073649-dnja7-meta.warc.os.cdx.gz	47	download
theajp.org-inf-20250420-073649-dnja7.json	241	download job
thelibrarydistrict.org-inf-20250419-192418-c3tuk-00003.warc.gz	5370763707	download job
thelibrarydistrict.org-inf-20250419-192418-c3tuk-00003.warc.os.cdx.gz	3815834	download
urls-transfer.archivete.am-4dnucleome.org_subdomains.txt-inf-20250411-044610-9dhhx-00095.warc.gz	13062474199	download job
urls-transfer.archivete.am-4dnucleome.org_subdomains.txt-inf-20250411-044610-9dhhx-00095.warc.os.cdx.gz	1107	download
urls-transfer.archivete.am-afroamcivilwar.org_seed_urls.txt-inf-20250416-050705-4m6rn-00021.warc.gz	5369993681	download job
urls-transfer.archivete.am-afroamcivilwar.org_seed_urls.txt-inf-20250416-050705-4m6rn-00021.warc.os.cdx.gz	1252788	download
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00526.warc.gz	5371289689	download job
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00526.warc.os.cdx.gz	19511	download
urls-transfer.archivete.am-www.biblioteca-digitala.ro.txt-inf-20250414-185922-8dp4c-00244.warc.gz	5378966770	download job
urls-transfer.archivete.am-www.biblioteca-digitala.ro.txt-inf-20250414-185922-8dp4c-00244.warc.os.cdx.gz	171514	download
videocast.nih.gov-inf-20250411-131031-4l9c9-00564.warc.gz	5669464251	download job
videocast.nih.gov-inf-20250411-131031-4l9c9-00564.warc.os.cdx.gz	687	download
videocast.nih.gov-inf-20250411-131031-4l9c9-00565.warc.gz	5501544385	download job
videocast.nih.gov-inf-20250411-131031-4l9c9-00565.warc.os.cdx.gz	630	download
www.documentedny.com-inf-20250420-073845-6buw8-00000.warc.gz	6504085	download job
www.documentedny.com-inf-20250420-073845-6buw8-00000.warc.os.cdx.gz	5575	download
www.documentedny.com-inf-20250420-073845-6buw8-meta.warc.gz	7132	download job
www.documentedny.com-inf-20250420-073845-6buw8-meta.warc.os.cdx.gz	47	download
www.documentedny.com-inf-20250420-073845-6buw8.json	251	download job
www.gazeteduvar.com.tr-inf-20250313-223802-94e2e-00017.warc.gz	5368804470	download job
www.gazeteduvar.com.tr-inf-20250313-223802-94e2e-00017.warc.os.cdx.gz	4816165	download
www.naturatech.org-inf-20250420-064502-7bh8f-00000.warc.gz	1306468284	download job
www.naturatech.org-inf-20250420-064502-7bh8f-00000.warc.os.cdx.gz	1054770	download
www.naturatech.org-inf-20250420-064502-7bh8f-meta.warc.gz	1038300	download job
www.naturatech.org-inf-20250420-064502-7bh8f-meta.warc.os.cdx.gz	47	download
www.naturatech.org-inf-20250420-064502-7bh8f.json	249	download job
www.pbs.org-inf-20250330-092508-bykmh-02290.warc.gz	5584920894	download job
www.pbs.org-inf-20250330-092508-bykmh-02290.warc.os.cdx.gz	30099	download
www.sciencebase.gov-inf-20250204-024621-3gyep-05150.warc.gz	5539316554	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-05150.warc.os.cdx.gz	75314	download
www.sciencebase.gov-inf-20250204-024621-3gyep-05151.warc.gz	5553390894	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-05151.warc.os.cdx.gz	106367	download
www.sciencebase.gov-inf-20250204-024621-3gyep-05152.warc.gz	5397847585	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-05152.warc.os.cdx.gz	77559	download
www.studios-efanyc.org-inf-20250420-003910-24uwk-00001.warc.gz	5149910339	download job
www.studios-efanyc.org-inf-20250420-003910-24uwk-00001.warc.os.cdx.gz	1704430	download
www.studios-efanyc.org-inf-20250420-003910-24uwk-meta.warc.gz	1862447	download job
www.studios-efanyc.org-inf-20250420-003910-24uwk-meta.warc.os.cdx.gz	47	download
www.studios-efanyc.org-inf-20250420-003910-24uwk.json	253	download job
www.usgs.gov-inf-20250404-060507-d6v2m-00212.warc.gz	5370435003	download job
www.usgs.gov-inf-20250404-060507-d6v2m-00212.warc.os.cdx.gz	116513	download
www.voanews.com-inf-20250317-033633-biyl5-01654.warc.gz	6489257289	download job
www.voanews.com-inf-20250317-033633-biyl5-01654.warc.os.cdx.gz	263437	download