Item archiveteam_archivebot_go_20250212102619_0b1851d5

Filename	Size
archive.stsci.edu-inf-20250211-091742-c3w6g-00026.warc.gz	41742834657	download job
archive.stsci.edu-inf-20250211-091742-c3w6g-00026.warc.os.cdx.gz	50520	download
archiveteam_archivebot_go_20250212102619_0b1851d5.cdx.gz	6422466	download
archiveteam_archivebot_go_20250212102619_0b1851d5.cdx.idx	6038	download
archiveteam_archivebot_go_20250212102619_0b1851d5_files.xml	0	download
archiveteam_archivebot_go_20250212102619_0b1851d5_meta.sqlite	57344	download
archiveteam_archivebot_go_20250212102619_0b1851d5_meta.xml	881	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-00352.warc.gz	7351871282	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-00352.warc.os.cdx.gz	638	download
ecma-international.org-inf-20250212-083853-dyo50-00001.warc.gz	5388921062	download job
ecma-international.org-inf-20250212-083853-dyo50-00001.warc.os.cdx.gz	236616	download
flibusta.is-inf-20240924-060021-7gpwv-01057.warc.gz	5386086525	download job
flibusta.is-inf-20240924-060021-7gpwv-01057.warc.os.cdx.gz	3521300	download
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01621.warc.gz	5382083391	download job
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01621.warc.os.cdx.gz	6672	download
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01622.warc.gz	5397760302	download job
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01622.warc.os.cdx.gz	6539	download
urls-transfer.archivete.am-partyhouse-kameleon.txt-shallow-20250212-100354-974hs-00000.warc.gz	238752106	download job
urls-transfer.archivete.am-partyhouse-kameleon.txt-shallow-20250212-100354-974hs-00000.warc.os.cdx.gz	124517	download
urls-transfer.archivete.am-partyhouse-kameleon.txt-shallow-20250212-100354-974hs-meta.warc.gz	79560	download job
urls-transfer.archivete.am-partyhouse-kameleon.txt-shallow-20250212-100354-974hs-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-partyhouse-kameleon.txt-shallow-20250212-100354-974hs-urls.txt	1735	download
urls-transfer.archivete.am-partyhouse-kameleon.txt-shallow-20250212-100354-974hs.json	339	download job
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-00536.warc.gz	5391183739	download job
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-00536.warc.os.cdx.gz	41589	download
urls-transfer.archivete.am-www.chds.us_seed_urls.txt-inf-20250212-070430-83r8x-00000.warc.gz	5378445908	download job
urls-transfer.archivete.am-www.chds.us_seed_urls.txt-inf-20250212-070430-83r8x-00000.warc.os.cdx.gz	2225961	download
urls-transfer.archivete.am-www.hsdl.org_seed_urls.txt-inf-20250212-070728-d1q93-00001.warc.gz	5395894561	download job
urls-transfer.archivete.am-www.hsdl.org_seed_urls.txt-inf-20250212-070728-d1q93-00001.warc.os.cdx.gz	25206	download
uscode.house.gov-inf-20250208-105004-67glb-00080.warc.gz	5371806748	download job
uscode.house.gov-inf-20250208-105004-67glb-00080.warc.os.cdx.gz	74485	download
www.fs.usda.gov-inf-20250203-040015-9klc9-00168.warc.gz	11051793478	download job
www.fs.usda.gov-inf-20250203-040015-9klc9-00168.warc.os.cdx.gz	2840	download
www.spaceforce.mil-inf-20250126-104111-c3t8z-01220.warc.gz	5392212585	download job
www.spaceforce.mil-inf-20250126-104111-c3t8z-01220.warc.os.cdx.gz	5865	download
www.usda.gov-inf-20250203-020346-1xsre-00062.warc.gz	5947911197	download job
www.usda.gov-inf-20250203-020346-1xsre-00062.warc.os.cdx.gz	8248	download
www.usgs.gov-inf-20250207-145004-d6v2m-00013.warc.gz	5372459896	download job
www.usgs.gov-inf-20250207-145004-d6v2m-00013.warc.os.cdx.gz	222254	download