Item archiveteam_archivebot_go_20250429125111_cf26b28f

Filename	Size
archiveteam_archivebot_go_20250429125111_cf26b28f.cdx.gz	22887525	download
archiveteam_archivebot_go_20250429125111_cf26b28f.cdx.idx	26302	download
archiveteam_archivebot_go_20250429125111_cf26b28f_files.xml	0	download
archiveteam_archivebot_go_20250429125111_cf26b28f_meta.sqlite	20480	download
archiveteam_archivebot_go_20250429125111_cf26b28f_meta.xml	881	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-07537.warc.gz	5638394138	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-07537.warc.os.cdx.gz	1478	download
data.4dnucleome.org-inf-20250411-043433-d4rx8-00429.warc.gz	32699688484	download job
data.4dnucleome.org-inf-20250411-043433-d4rx8-00429.warc.os.cdx.gz	911	download
hoyre.no-inf-20250428-195814-bxb3a-00004.warc.gz	5368884336	download job
hoyre.no-inf-20250428-195814-bxb3a-00004.warc.os.cdx.gz	4294705	download
ospo.noaa.gov-inf-20250404-151509-euinz-00584.warc.gz	5368736721	download job
ospo.noaa.gov-inf-20250404-151509-euinz-00584.warc.os.cdx.gz	1750215	download
portal.nersc.gov-inf-20250411-235739-duomw-00765.warc.gz	5411909626	download job
portal.nersc.gov-inf-20250411-235739-duomw-00765.warc.os.cdx.gz	1882	download
urls-transfer.archivete.am-cdn-prod.playfirst.com_urls_part_10.txt-shallow-20250428-184205-cjz94-00009.warc.gz	5371016670	download job
urls-transfer.archivete.am-cdn-prod.playfirst.com_urls_part_10.txt-shallow-20250428-184205-cjz94-00009.warc.os.cdx.gz	8694520	download
urls-transfer.archivete.am-frc.org_washingtonstand.com_subdomains.txt-inf-20250427-052828-bqp7v-00034.warc.gz	5375784636	download job
urls-transfer.archivete.am-frc.org_washingtonstand.com_subdomains.txt-inf-20250427-052828-bqp7v-00034.warc.os.cdx.gz	29412	download
urls-transfer.archivete.am-mam.org_subdomains.txt-inf-20250420-004303-3r9y9-00111.warc.gz	5548987016	download job
urls-transfer.archivete.am-mam.org_subdomains.txt-inf-20250420-004303-3r9y9-00111.warc.os.cdx.gz	22500	download
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00762.warc.gz	5370818790	download job
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00762.warc.os.cdx.gz	15808	download
urls-transfer.archivete.am-www.dhs.gov_large_files_and_flickr.txt-shallow-20250429-060723-1ls5x-00002.warc.gz	5372923495	download job
urls-transfer.archivete.am-www.dhs.gov_large_files_and_flickr.txt-shallow-20250429-060723-1ls5x-00002.warc.os.cdx.gz	443611	download
videocast.nih.gov-inf-20250411-131031-4l9c9-01142.warc.gz	7034167244	download job
videocast.nih.gov-inf-20250411-131031-4l9c9-01142.warc.os.cdx.gz	519	download
www.chp.ca-inf-20250429-001705-3vip1-00013.warc.gz	5368754235	download job
www.chp.ca-inf-20250429-001705-3vip1-00013.warc.os.cdx.gz	443342	download
www.flickr.com-inf-20250424-223237-7v090-00243.warc.gz	5377946195	download job
www.flickr.com-inf-20250424-223237-7v090-00243.warc.os.cdx.gz	295917	download
www.flickr.com-inf-20250424-223237-7v090-00244.warc.gz	5370369791	download job
www.flickr.com-inf-20250424-223237-7v090-00244.warc.os.cdx.gz	148400	download
www.npr.org-inf-20250330-091933-craqr-00607.warc.gz	5516212548	download job
www.npr.org-inf-20250330-091933-craqr-00607.warc.os.cdx.gz	20826	download
www.pbs.org-inf-20250330-092508-bykmh-03120.warc.gz	5713016410	download job
www.pbs.org-inf-20250330-092508-bykmh-03120.warc.os.cdx.gz	28372	download
www.sciencebase.gov-inf-20250204-024621-3gyep-06896.warc.gz	5653456977	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-06896.warc.os.cdx.gz	116451	download
www.sciencebase.gov-inf-20250204-024621-3gyep-06897.warc.gz	5382639544	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-06897.warc.os.cdx.gz	119314	download
www.sciencebase.gov-inf-20250204-024621-3gyep-06898.warc.gz	5407751070	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-06898.warc.os.cdx.gz	78016	download
www.suicidegirls.com-inf-20241130-132148-afqgf-00528.warc.gz	5368785881	download job
www.suicidegirls.com-inf-20241130-132148-afqgf-00528.warc.os.cdx.gz	6947528	download
www.usgs.gov-inf-20250404-060507-d6v2m-00362.warc.gz	5561631574	download job
www.usgs.gov-inf-20250404-060507-d6v2m-00362.warc.os.cdx.gz	12853	download