Item archiveteam_archivebot_go_20260501105429_815f5aa8

Filename	Size
archiveteam_archivebot_go_20260501105429_815f5aa8.cdx.gz	30191698	download
archiveteam_archivebot_go_20260501105429_815f5aa8.cdx.idx	47606	download
archiveteam_archivebot_go_20260501105429_815f5aa8_files.xml	0	download
archiveteam_archivebot_go_20260501105429_815f5aa8_meta.sqlite	12288	download
archiveteam_archivebot_go_20260501105429_815f5aa8_meta.xml	881	download
estrelaseouricos.sapo.pt-inf-20260428-075630-6bise-00005.warc.gz	5368709770	download job
estrelaseouricos.sapo.pt-inf-20260428-075630-6bise-00005.warc.os.cdx.gz	5358974	download
forum.xnxx.com-inf-20260316-120422-cd0ta-00606.warc.gz	5513610522	download job
forum.xnxx.com-inf-20260316-120422-cd0ta-00606.warc.os.cdx.gz	600460	download
geheugen.delpher.nl-inf-20260110-014315-a3zib-00043.warc.gz	5368902179	download job
geheugen.delpher.nl-inf-20260110-014315-a3zib-00043.warc.os.cdx.gz	15347604	download
lla.la.gov-inf-20260430-234530-cvxz0-00004.warc.gz	5371054797	download job
lla.la.gov-inf-20260430-234530-cvxz0-00004.warc.os.cdx.gz	274073	download
publichealth.jhu.edu-inf-20260429-223615-9md7c-00035.warc.gz	5426376388	download job
publichealth.jhu.edu-inf-20260429-223615-9md7c-00035.warc.os.cdx.gz	439290	download
publichealth.jhu.edu-inf-20260429-223615-9md7c-00036.warc.gz	5391813269	download job
publichealth.jhu.edu-inf-20260429-223615-9md7c-00036.warc.os.cdx.gz	11191	download
publichealth.jhu.edu-inf-20260429-223615-9md7c-00037.warc.gz	5682649020	download job
publichealth.jhu.edu-inf-20260429-223615-9md7c-00037.warc.os.cdx.gz	9844	download
snn.ir-inf-20260130-203432-2nkxg-00272.warc.gz	5368908444	download job
snn.ir-inf-20260130-203432-2nkxg-00272.warc.os.cdx.gz	1234061	download
urls-transfer.archivete.am-bankruptcies-NL-2026-may01-ref.txt-shallow-20260501-101454-558ck-00000.warc.gz	180731984	download job
urls-transfer.archivete.am-bankruptcies-NL-2026-may01-ref.txt-shallow-20260501-101454-558ck-00000.warc.os.cdx.gz	355902	download
urls-transfer.archivete.am-bankruptcies-NL-2026-may01-ref.txt-shallow-20260501-101454-558ck-meta.warc.gz	212228	download job
urls-transfer.archivete.am-bankruptcies-NL-2026-may01-ref.txt-shallow-20260501-101454-558ck-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-bankruptcies-NL-2026-may01-ref.txt-shallow-20260501-101454-558ck-urls.txt	9620	download
urls-transfer.archivete.am-bankruptcies-NL-2026-may01-ref.txt-shallow-20260501-101454-558ck.json	361	download job
urls-transfer.archivete.am-developer.nvidia.com_and_docs.nvidia.com_ignored-download-urls_deduped.txt-shallow-20260501-094130-2nont-00004.warc.gz	14823088054	download job
urls-transfer.archivete.am-developer.nvidia.com_and_docs.nvidia.com_ignored-download-urls_deduped.txt-shallow-20260501-094130-2nont-00004.warc.os.cdx.gz	1280	download
urls-transfer.archivete.am-developer.nvidia.com_and_docs.nvidia.com_ignored-download-urls_deduped.txt-shallow-20260501-094130-2nont-00005.warc.gz	5525264736	download job
urls-transfer.archivete.am-developer.nvidia.com_and_docs.nvidia.com_ignored-download-urls_deduped.txt-shallow-20260501-094130-2nont-00005.warc.os.cdx.gz	1497	download
urls-transfer.archivete.am-developer.nvidia.com_and_docs.nvidia.com_ignored-download-urls_deduped.txt-shallow-20260501-094130-2nont-00006.warc.gz	5410270092	download job
urls-transfer.archivete.am-developer.nvidia.com_and_docs.nvidia.com_ignored-download-urls_deduped.txt-shallow-20260501-094130-2nont-00006.warc.os.cdx.gz	3993	download
urls-transfer.archivete.am-dotat.at_ignored_nw18.com_mp4-files.txt-shallow-20260501-092939-96zzl-00001.warc.gz	5955615185	download job
urls-transfer.archivete.am-dotat.at_ignored_nw18.com_mp4-files.txt-shallow-20260501-092939-96zzl-00001.warc.os.cdx.gz	1572	download
urls-transfer.archivete.am-services.arcgis.com_P3ePLMYs2RVChkJx_arcgis_urls_nca-atlas-nationalclimate.hub.arcgis.com_was_atlas.globalchange.gov.txt-shallow-20251009-023936-jyia4-00090.warc.gz	5369440823	download job
urls-transfer.archivete.am-services.arcgis.com_P3ePLMYs2RVChkJx_arcgis_urls_nca-atlas-nationalclimate.hub.arcgis.com_was_atlas.globalchange.gov.txt-shallow-20251009-023936-jyia4-00090.warc.os.cdx.gz	739289	download
urls-transfer.archivete.am-www.henrymakow.com.txt-inf-20260430-025513-1zaji-00024.warc.gz	5376720970	download job
urls-transfer.archivete.am-www.henrymakow.com.txt-inf-20260430-025513-1zaji-00024.warc.os.cdx.gz	1174378	download
vtcnews.vn-inf-20260422-180952-5dk5f-00267.warc.gz	5368912537	download job
vtcnews.vn-inf-20260422-180952-5dk5f-00267.warc.os.cdx.gz	132004	download
www.5-tv.ru-inf-20260426-201818-3vkhf-00704.warc.gz	5415371960	download job
www.5-tv.ru-inf-20260426-201818-3vkhf-00704.warc.os.cdx.gz	15666	download
www.artsonia.com-inf-20260415-190033-4lap7-00621.warc.gz	5368819709	download job
www.artsonia.com-inf-20260415-190033-4lap7-00621.warc.os.cdx.gz	462033	download
www.justice-integrity.org-inf-20260430-024715-35856-00042.warc.gz	5369591865	download job
www.justice-integrity.org-inf-20260430-024715-35856-00042.warc.os.cdx.gz	116733	download
www.nyfoundling.org-inf-20260429-024442-2wlty-00032.warc.gz	6215660032	download job
www.nyfoundling.org-inf-20260429-024442-2wlty-00032.warc.os.cdx.gz	1342	download
www.tajin.com-inf-20260501-035257-bdc9h-00000.warc.gz	5369722385	download job
www.tajin.com-inf-20260501-035257-bdc9h-00000.warc.os.cdx.gz	4868663	download