Item archiveteam_archivebot_go_20250702191358_a80c014b

Filename	Size
amazonwatch.org-inf-20250701-182959-1plzh-00005.warc.gz	5369534103	download job
amazonwatch.org-inf-20250701-182959-1plzh-00005.warc.os.cdx.gz	1070573	download
archiveteam_archivebot_go_20250702191358_a80c014b.cdx.gz	25519520	download
archiveteam_archivebot_go_20250702191358_a80c014b.cdx.idx	33616	download
archiveteam_archivebot_go_20250702191358_a80c014b_files.xml	0	download
archiveteam_archivebot_go_20250702191358_a80c014b_meta.sqlite	77824	download
archiveteam_archivebot_go_20250702191358_a80c014b_meta.xml	1047	download
deutsche-stimme.de-inf-20250701-183116-atjfc-00008.warc.gz	5427204767	download job
deutsche-stimme.de-inf-20250701-183116-atjfc-00008.warc.os.cdx.gz	380629	download
events.haecksen.org-inf-20250702-183534-9ah2l-00000.warc.gz	125292079	download job
events.haecksen.org-inf-20250702-183534-9ah2l-00000.warc.os.cdx.gz	165812	download
events.haecksen.org-inf-20250702-183534-9ah2l-meta.warc.gz	118108	download job
events.haecksen.org-inf-20250702-183534-9ah2l-meta.warc.os.cdx.gz	47	download
events.haecksen.org-inf-20250702-183534-9ah2l.json	253	download job
forum.novosti-kosmonavtiki.ru-inf-20250628-095757-kd9d5-00088.warc.gz	5368800472	download job
forum.novosti-kosmonavtiki.ru-inf-20250628-095757-kd9d5-00088.warc.os.cdx.gz	2027604	download
ipsw.me-inf-20241201-145231-9lrev-11393.warc.gz	7828249111	download job
ipsw.me-inf-20241201-145231-9lrev-11393.warc.os.cdx.gz	737	download
lemmy.zip-inf-20250312-165238-aa83x-00629.warc.gz	5369033795	download job
lemmy.zip-inf-20250312-165238-aa83x-00629.warc.os.cdx.gz	2556870	download
ofac.treasury.gov-inf-20250701-193730-abzga-00000.warc.gz	5370781665	download job
ofac.treasury.gov-inf-20250701-193730-abzga-00000.warc.os.cdx.gz	3506842	download
thebullelephant.com-inf-20250628-232351-53qd8-00063.warc.gz	5586659878	download job
thebullelephant.com-inf-20250628-232351-53qd8-00063.warc.os.cdx.gz	482383	download
urls-transfer.archivete.am-angrymetalguy.com_api_urls.txt-shallow-20250702-172356-cuff1-00001.warc.gz	590239302	download job
urls-transfer.archivete.am-angrymetalguy.com_api_urls.txt-shallow-20250702-172356-cuff1-00001.warc.os.cdx.gz	253691	download
urls-transfer.archivete.am-angrymetalguy.com_api_urls.txt-shallow-20250702-172356-cuff1-meta.warc.gz	1367488	download job
urls-transfer.archivete.am-angrymetalguy.com_api_urls.txt-shallow-20250702-172356-cuff1-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-angrymetalguy.com_api_urls.txt-shallow-20250702-172356-cuff1-urls.txt	41441	download
urls-transfer.archivete.am-angrymetalguy.com_api_urls.txt-shallow-20250702-172356-cuff1.json	370	download job
urls-transfer.archivete.am-cap.gov_gocivilairpatrol.com_cap.news_subdomains.txt-inf-20250426-065415-yy94g-00553.warc.gz	5369011926	download job
urls-transfer.archivete.am-cap.gov_gocivilairpatrol.com_cap.news_subdomains.txt-inf-20250426-065415-yy94g-00553.warc.os.cdx.gz	763532	download
urls-transfer.archivete.am-digital.archives.alabama.gov_urls_fixed_iiif.txt-shallow-20250624-073538-40x7k-00281.warc.gz	5368894145	download job
urls-transfer.archivete.am-digital.archives.alabama.gov_urls_fixed_iiif.txt-shallow-20250624-073538-40x7k-00281.warc.os.cdx.gz	2366821	download
urls-transfer.archivete.am-ebi.ac.uk_subdomains.txt-inf-20250412-060252-cl3rw-01939.warc.gz	9234451098	download job
urls-transfer.archivete.am-ebi.ac.uk_subdomains.txt-inf-20250412-060252-cl3rw-01939.warc.os.cdx.gz	265	download
urls-transfer.archivete.am-nysed.gov_subdomains.txt-inf-20250514-070805-3nai2-00433.warc.gz	5385615706	download job
urls-transfer.archivete.am-nysed.gov_subdomains.txt-inf-20250514-070805-3nai2-00433.warc.os.cdx.gz	535244	download
urls-transfer.archivete.am-www.ine.mx_all-subdomains.txt-inf-20250602-135418-473yz-00430.warc.gz	5677165745	download job
urls-transfer.archivete.am-www.ine.mx_all-subdomains.txt-inf-20250602-135418-473yz-00430.warc.os.cdx.gz	4424	download
urls-transfer.archivete.am-www.palarchive.org.txt-inf-20250514-161724-b14on-00307.warc.gz	5372081154	download job
urls-transfer.archivete.am-www.palarchive.org.txt-inf-20250514-161724-b14on-00307.warc.os.cdx.gz	80142	download
www.assnat.qc.ca-inf-20250628-184306-cmlix-00166.warc.gz	6178720389	download job
www.assnat.qc.ca-inf-20250628-184306-cmlix-00166.warc.os.cdx.gz	10519	download
www.bitkom.org-inf-20250702-120922-10tcc-00009.warc.gz	5419015168	download job
www.bitkom.org-inf-20250702-120922-10tcc-00009.warc.os.cdx.gz	1567959	download
www.cato.org-inf-20250616-181337-woehf-00416.warc.gz	5731607655	download job
www.cato.org-inf-20250616-181337-woehf-00416.warc.os.cdx.gz	10599	download
www.instructables.com-inf-20250620-084548-96szf-00221.warc.gz	5371833876	download job
www.instructables.com-inf-20250620-084548-96szf-00221.warc.os.cdx.gz	3054352	download
www.laptopmag.com-inf-20250702-035542-3hc8e-00002.warc.gz	5368712633	download job
www.laptopmag.com-inf-20250702-035542-3hc8e-00002.warc.os.cdx.gz	3621503	download
www.martinoticias.com-inf-20250605-173025-9jp0f-02600.warc.gz	5374181902	download job
www.martinoticias.com-inf-20250605-173025-9jp0f-02600.warc.os.cdx.gz	3489769	download
www.ncpssm.org-inf-20250630-011124-3bqlc-00039.warc.gz	5492141913	download job
www.ncpssm.org-inf-20250630-011124-3bqlc-00039.warc.os.cdx.gz	14093	download
www.wanzl.com-inf-20250630-035704-21fkg-00256.warc.gz	5374693566	download job
www.wanzl.com-inf-20250630-035704-21fkg-00256.warc.os.cdx.gz	157579	download