Item archiveteam_archivebot_go_20250421140351_95e4bfff

Filename	Size
archiveteam_archivebot_go_20250421140351_95e4bfff.cdx.gz	12354833	download
archiveteam_archivebot_go_20250421140351_95e4bfff.cdx.idx	11878	download
archiveteam_archivebot_go_20250421140351_95e4bfff_files.xml	0	download
archiveteam_archivebot_go_20250421140351_95e4bfff_meta.sqlite	69632	download
archiveteam_archivebot_go_20250421140351_95e4bfff_meta.xml	881	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-07143.warc.gz	6303638855	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-07143.warc.os.cdx.gz	734	download
dumskaya.net-inf-20250417-084446-1cb2y-00024.warc.gz	5369203038	download job
dumskaya.net-inf-20250417-084446-1cb2y-00024.warc.os.cdx.gz	1426428	download
leaderswedeserve.com-inf-20250421-123813-9gkfk-00000.warc.gz	5425573486	download job
leaderswedeserve.com-inf-20250421-123813-9gkfk-00000.warc.os.cdx.gz	954627	download
leaderswedeserve.com-inf-20250421-123813-9gkfk-00001.warc.gz	5440519035	download job
leaderswedeserve.com-inf-20250421-123813-9gkfk-00001.warc.os.cdx.gz	254596	download
ospo.noaa.gov-inf-20250404-151509-euinz-00425.warc.gz	5369461254	download job
ospo.noaa.gov-inf-20250404-151509-euinz-00425.warc.os.cdx.gz	841531	download
physionet.org-inf-20250411-000834-4ozqg-00024.warc.gz	5431121628	download job
physionet.org-inf-20250411-000834-4ozqg-00024.warc.os.cdx.gz	7215	download
portal.nersc.gov-inf-20250411-235739-duomw-00407.warc.gz	5405812139	download job
portal.nersc.gov-inf-20250411-235739-duomw-00407.warc.os.cdx.gz	5293	download
public.dhe.ibm.com-inf-20250416-120237-a9nyc-00076.warc.gz	6431496927	download job
public.dhe.ibm.com-inf-20250416-120237-a9nyc-00076.warc.os.cdx.gz	1365	download
pubs.usgs.gov-inf-20250404-060456-32bnb-00104.warc.gz	5638378111	download job
pubs.usgs.gov-inf-20250404-060456-32bnb-00104.warc.os.cdx.gz	491502	download
search.ddosecrets.com-inf-20231231-142101-483il-01492.warc.gz	5437054956	download job
search.ddosecrets.com-inf-20231231-142101-483il-01492.warc.os.cdx.gz	745207	download
urls-transfer.archivete.am-pen.org_subdomains.txt-inf-20250411-220821-9zvv0-00062.warc.gz	5369558714	download job
urls-transfer.archivete.am-pen.org_subdomains.txt-inf-20250411-220821-9zvv0-00062.warc.os.cdx.gz	1282473	download
urls-transfer.archivete.am-www.biblioteca-digitala.ro.txt-inf-20250414-185922-8dp4c-00275.warc.gz	5368714524	download job
urls-transfer.archivete.am-www.biblioteca-digitala.ro.txt-inf-20250414-185922-8dp4c-00275.warc.os.cdx.gz	4873966	download
urls-transfer.archivete.am-www.electronicsandbooks.com.txt-inf-20250103-223214-boqpe-01612.warc.gz	5372247198	download job
urls-transfer.archivete.am-www.electronicsandbooks.com.txt-inf-20250103-223214-boqpe-01612.warc.os.cdx.gz	143653	download
videocast.nih.gov-inf-20250411-131031-4l9c9-00660.warc.gz	7353285642	download job
videocast.nih.gov-inf-20250411-131031-4l9c9-00660.warc.os.cdx.gz	910	download
wellsweekly.wells.edu-inf-20250421-134452-1d36l-00000.warc.gz	223963548	download job
wellsweekly.wells.edu-inf-20250421-134452-1d36l-00000.warc.os.cdx.gz	119121	download
wellsweekly.wells.edu-inf-20250421-134452-1d36l-meta.warc.gz	70129	download job
wellsweekly.wells.edu-inf-20250421-134452-1d36l-meta.warc.os.cdx.gz	47	download
wellsweekly.wells.edu-inf-20250421-134452-1d36l.json	251	download job
www.flickr.com-inf-20250416-203114-2njgm-00056.warc.gz	5380589504	download job
www.flickr.com-inf-20250416-203114-2njgm-00056.warc.os.cdx.gz	540144	download
www.npr.org-inf-20250330-091933-craqr-00495.warc.gz	5371830558	download job
www.npr.org-inf-20250330-091933-craqr-00495.warc.os.cdx.gz	552135	download
www.pbs.org-inf-20250330-092508-bykmh-02389.warc.gz	5505070288	download job
www.pbs.org-inf-20250330-092508-bykmh-02389.warc.os.cdx.gz	9641	download
www.sciencebase.gov-inf-20250204-024621-3gyep-05419.warc.gz	5372669750	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-05419.warc.os.cdx.gz	57409	download
www.sciencebase.gov-inf-20250204-024621-3gyep-05420.warc.gz	5542532979	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-05420.warc.os.cdx.gz	63890	download
www.sciencebase.gov-inf-20250204-024621-3gyep-05421.warc.gz	5585867644	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-05421.warc.os.cdx.gz	88640	download
www.usgs.gov-inf-20250404-060507-d6v2m-00233.warc.gz	5395014601	download job
www.usgs.gov-inf-20250404-060507-d6v2m-00233.warc.os.cdx.gz	113751	download