Item archiveteam_archivebot_go_20250819073420_5c2e42e1

Filename	Size
archiveteam_archivebot_go_20250819073420_5c2e42e1.cdx.gz	7940123	download
archiveteam_archivebot_go_20250819073420_5c2e42e1.cdx.idx	7910	download
archiveteam_archivebot_go_20250819073420_5c2e42e1_files.xml	0	download
archiveteam_archivebot_go_20250819073420_5c2e42e1_meta.sqlite	57344	download
archiveteam_archivebot_go_20250819073420_5c2e42e1_meta.xml	1047	download
cdsarc.cds.unistra.fr-inf-20250316-091614-2ddo1-02120.warc.gz	5871978480	download job
cdsarc.cds.unistra.fr-inf-20250316-091614-2ddo1-02120.warc.os.cdx.gz	3955	download
deutsch-mit-anna.de-inf-20250818-231926-1trs9-00003.warc.gz	5541010779	download job
deutsch-mit-anna.de-inf-20250818-231926-1trs9-00003.warc.os.cdx.gz	231145	download
diodes-delight.com-inf-20250819-071241-14yui-00000.warc.gz	301077040	download job
diodes-delight.com-inf-20250819-071241-14yui-00000.warc.os.cdx.gz	273161	download
diodes-delight.com-inf-20250819-071241-14yui-meta.warc.gz	196937	download job
diodes-delight.com-inf-20250819-071241-14yui-meta.warc.os.cdx.gz	47	download
diodes-delight.com-inf-20250819-071241-14yui.json	249	download job
funkypenguin.co.nz-inf-20250819-051215-56ltk-00000.warc.gz	3653850900	download job
funkypenguin.co.nz-inf-20250819-051215-56ltk-00000.warc.os.cdx.gz	2049035	download
funkypenguin.co.nz-inf-20250819-051215-56ltk-meta.warc.gz	1346581	download job
funkypenguin.co.nz-inf-20250819-051215-56ltk-meta.warc.os.cdx.gz	47	download
funkypenguin.co.nz-inf-20250819-051215-56ltk.json	243	download job
karapaia.com-inf-20250805-142557-9bbzq-00111.warc.gz	5415981860	download job
karapaia.com-inf-20250805-142557-9bbzq-00111.warc.os.cdx.gz	965711	download
saccsiv.wordpress.com-inf-20250818-193149-4ptuc-00001.warc.gz	5368741171	download job
saccsiv.wordpress.com-inf-20250818-193149-4ptuc-00001.warc.os.cdx.gz	4597864	download
urls-transfer.archivete.am-4dnucleome.org_subdomains.txt-inf-20250411-044610-9dhhx-01995.warc.gz	63998327570	download job
urls-transfer.archivete.am-4dnucleome.org_subdomains.txt-inf-20250411-044610-9dhhx-01995.warc.os.cdx.gz	1870	download
urls-transfer.archivete.am-abandonedatlas.com_and_related_domains.txt-inf-20250818-031051-5wvvg-00009.warc.gz	5916165194	download job
urls-transfer.archivete.am-abandonedatlas.com_and_related_domains.txt-inf-20250818-031051-5wvvg-00009.warc.os.cdx.gz	6218566	download
urls-transfer.archivete.am-gis.dnr.wa.gov_site2_arcgis_urls.txt-shallow-20250819-002717-7845s-00002.warc.gz	5370221234	download job
urls-transfer.archivete.am-gis.dnr.wa.gov_site2_arcgis_urls.txt-shallow-20250819-002717-7845s-00002.warc.os.cdx.gz	245260	download
urls-transfer.archivete.am-hartenergy.com_subdomains.txt-inf-20250817-192705-dna3r-00010.warc.gz	5368729241	download job
urls-transfer.archivete.am-hartenergy.com_subdomains.txt-inf-20250817-192705-dna3r-00010.warc.os.cdx.gz	1526581	download
usatoday.tumblr.com-inf-20250628-071652-9p1l8-00948.warc.gz	5378278179	download job
usatoday.tumblr.com-inf-20250628-071652-9p1l8-00948.warc.os.cdx.gz	1448299	download
www.pbs.org-inf-20250330-092508-bykmh-12197.warc.gz	5569620127	download job
www.pbs.org-inf-20250330-092508-bykmh-12197.warc.os.cdx.gz	8057	download
www.pbs.org-inf-20250330-092508-bykmh-12198.warc.gz	5554550325	download job
www.pbs.org-inf-20250330-092508-bykmh-12198.warc.os.cdx.gz	9664	download