Item archiveteam_archivebot_go_20250705100328_25f25c18

Filename	Size
acdis.org-inf-20250704-224904-3mjo1-00001.warc.gz	5369206062	download job
acdis.org-inf-20250704-224904-3mjo1-00001.warc.os.cdx.gz	5307129	download
archiveteam_archivebot_go_20250705100328_25f25c18.cdx.gz	9839174	download
archiveteam_archivebot_go_20250705100328_25f25c18.cdx.idx	9958	download
archiveteam_archivebot_go_20250705100328_25f25c18_files.xml	0	download
archiveteam_archivebot_go_20250705100328_25f25c18_meta.sqlite	98304	download
archiveteam_archivebot_go_20250705100328_25f25c18_meta.xml	1047	download
congan.backan.gov.vn-inf-20250703-195236-639to-00000.warc.gz	5373737300	download job
congan.backan.gov.vn-inf-20250703-195236-639to-00000.warc.os.cdx.gz	2934925	download
das-blaettchen.de-inf-20250704-103444-69fm9-00004.warc.gz	2749665584	download job
das-blaettchen.de-inf-20250704-103444-69fm9-00004.warc.os.cdx.gz	1833509	download
das-blaettchen.de-inf-20250704-103444-69fm9-meta.warc.gz	9459602	download job
das-blaettchen.de-inf-20250704-103444-69fm9-meta.warc.os.cdx.gz	47	download
das-blaettchen.de-inf-20250704-103444-69fm9.json	245	download job
diglib.eg.org-inf-20250630-200411-6bn9i-00067.warc.gz	5372337566	download job
diglib.eg.org-inf-20250630-200411-6bn9i-00067.warc.os.cdx.gz	473763	download
diglib7.eg.org-inf-20250630-191830-bo5u6-00095.warc.gz	5398480167	download job
diglib7.eg.org-inf-20250630-191830-bo5u6-00095.warc.os.cdx.gz	155498	download
dish.andrewsullivan.com-inf-20250702-065556-27fz7-00056.warc.gz	5500506418	download job
dish.andrewsullivan.com-inf-20250702-065556-27fz7-00056.warc.os.cdx.gz	972672	download
ipsw.me-inf-20241201-145231-9lrev-11511.warc.gz	8644824423	download job
ipsw.me-inf-20241201-145231-9lrev-11511.warc.os.cdx.gz	352	download
open-educational-resources.de-inf-20250705-100046-5tx2v-aborted-00000.warc.gz	2410	download job
open-educational-resources.de-inf-20250705-100046-5tx2v-aborted-00000.warc.os.cdx.gz	47	download
open-educational-resources.de-inf-20250705-100046-5tx2v-aborted-wpull.log.gz	845	download
open-educational-resources.de-inf-20250705-100046-5tx2v-aborted.json	256	download job
sheepdogchurchsecurity.net-inf-20250705-033154-dr5kk-00007.warc.gz	5787311425	download job
sheepdogchurchsecurity.net-inf-20250705-033154-dr5kk-00007.warc.os.cdx.gz	710122	download
support.google.com-inf-20250420-195502-2chqd-00117.warc.gz	5368824715	download job
support.google.com-inf-20250420-195502-2chqd-00117.warc.os.cdx.gz	906542	download
urls-transfer.archivete.am-4dnucleome.org_subdomains.txt-inf-20250411-044610-9dhhx-01123.warc.gz	6983806832	download job
urls-transfer.archivete.am-4dnucleome.org_subdomains.txt-inf-20250411-044610-9dhhx-01123.warc.os.cdx.gz	639	download
urls-transfer.archivete.am-ebi.ac.uk_subdomains.txt-inf-20250412-060252-cl3rw-01963.warc.gz	6134873153	download job
urls-transfer.archivete.am-ebi.ac.uk_subdomains.txt-inf-20250412-060252-cl3rw-01963.warc.os.cdx.gz	882	download
urls-transfer.archivete.am-milliken.com_subdomains.txt-inf-20250704-200742-9dlqg-00006.warc.gz	5369825623	download job
urls-transfer.archivete.am-milliken.com_subdomains.txt-inf-20250704-200742-9dlqg-00006.warc.os.cdx.gz	1402744	download
urls-transfer.archivete.am-refinebroadcast.blob.core.windows.net_urls.txt-shallow-20250705-064321-9lwuq-00024.warc.gz	5695515549	download job
urls-transfer.archivete.am-refinebroadcast.blob.core.windows.net_urls.txt-shallow-20250705-064321-9lwuq-00024.warc.os.cdx.gz	2925	download
urls-transfer.archivete.am-refinebroadcast.blob.core.windows.net_urls.txt-shallow-20250705-064321-9lwuq-00025.warc.gz	5516257611	download job
urls-transfer.archivete.am-refinebroadcast.blob.core.windows.net_urls.txt-shallow-20250705-064321-9lwuq-00025.warc.os.cdx.gz	2706	download
urls-transfer.archivete.am-refinebroadcast.blob.core.windows.net_urls.txt-shallow-20250705-064321-9lwuq-00026.warc.gz	5641970779	download job
urls-transfer.archivete.am-refinebroadcast.blob.core.windows.net_urls.txt-shallow-20250705-064321-9lwuq-00026.warc.os.cdx.gz	2652	download
urls-transfer.archivete.am-tigerweb.geo.census.gov_arcgis_urls.txt-shallow-20250618-080816-kbsmw-00034.warc.gz	5381110969	download job
urls-transfer.archivete.am-tigerweb.geo.census.gov_arcgis_urls.txt-shallow-20250618-080816-kbsmw-00034.warc.os.cdx.gz	14484	download
www.academyofsciencestl.org-inf-20250705-095432-ero13-00000.warc.gz	8169	download job
www.academyofsciencestl.org-inf-20250705-095432-ero13-00000.warc.os.cdx.gz	47	download
www.academyofsciencestl.org-inf-20250705-095432-ero13-meta.warc.gz	3622	download job
www.academyofsciencestl.org-inf-20250705-095432-ero13-meta.warc.os.cdx.gz	47	download
www.academyofsciencestl.org-inf-20250705-095432-ero13.json	255	download job
www.academyofsciencestl.org-inf-20250705-095520-ero13-00000.warc.gz	16666214	download job
www.academyofsciencestl.org-inf-20250705-095520-ero13-00000.warc.os.cdx.gz	17345	download
www.academyofsciencestl.org-inf-20250705-095520-ero13-meta.warc.gz	13776	download job
www.academyofsciencestl.org-inf-20250705-095520-ero13-meta.warc.os.cdx.gz	47	download
www.academyofsciencestl.org-inf-20250705-095520-ero13.json	255	download job
www.assnat.qc.ca-inf-20250628-184306-cmlix-00229.warc.gz	6017531399	download job
www.assnat.qc.ca-inf-20250628-184306-cmlix-00229.warc.os.cdx.gz	5404	download
www.erisinfo.com-inf-20250704-221231-5xvav-00005.warc.gz	5415966391	download job
www.erisinfo.com-inf-20250704-221231-5xvav-00005.warc.os.cdx.gz	2740482	download
www.girlus.com-inf-20250705-071805-8v1ya-00001.warc.gz	5368940356	download job
www.girlus.com-inf-20250705-071805-8v1ya-00001.warc.os.cdx.gz	472570	download
www.martinoticias.com-inf-20250605-173025-9jp0f-02658.warc.gz	5401881646	download job
www.martinoticias.com-inf-20250605-173025-9jp0f-02658.warc.os.cdx.gz	620314	download
www.open-educational-resources.de-inf-20250705-095623-8im0n-00000.warc.gz	2482	download job
www.open-educational-resources.de-inf-20250705-095623-8im0n-00000.warc.os.cdx.gz	47	download
www.open-educational-resources.de-inf-20250705-095623-8im0n-meta.warc.gz	3666	download job
www.open-educational-resources.de-inf-20250705-095623-8im0n-meta.warc.os.cdx.gz	47	download
www.open-educational-resources.de-inf-20250705-095623-8im0n.json	261	download job
www.open-educational-resources.de-inf-20250705-095924-8im0n-00000.warc.gz	6906240	download job
www.open-educational-resources.de-inf-20250705-095924-8im0n-00000.warc.os.cdx.gz	10350	download
www.open-educational-resources.de-inf-20250705-095924-8im0n-meta.warc.gz	9727	download job
www.open-educational-resources.de-inf-20250705-095924-8im0n-meta.warc.os.cdx.gz	47	download
www.open-educational-resources.de-inf-20250705-095924-8im0n.json	261	download job
www.pbs.org-inf-20250330-092508-bykmh-08147.warc.gz	5488707344	download job
www.pbs.org-inf-20250330-092508-bykmh-08147.warc.os.cdx.gz	5494	download