Item archiveteam_archivebot_go_20250705044823_4375f8a9

Filename	Size
archive.physionet.org-inf-20250411-000907-260ld-02215.warc.gz	5371253344	download job
archive.physionet.org-inf-20250411-000907-260ld-02215.warc.os.cdx.gz	187244	download
archiveteam_archivebot_go_20250705044823_4375f8a9.cdx.gz	1467475	download
archiveteam_archivebot_go_20250705044823_4375f8a9.cdx.idx	1352	download
archiveteam_archivebot_go_20250705044823_4375f8a9_files.xml	0	download
archiveteam_archivebot_go_20250705044823_4375f8a9_meta.sqlite	81920	download
archiveteam_archivebot_go_20250705044823_4375f8a9_meta.xml	1046	download
atmos.earth-inf-20250704-200600-cv8zb-00003.warc.gz	5370870321	download job
atmos.earth-inf-20250704-200600-cv8zb-00003.warc.os.cdx.gz	1310896	download
cdsarc.cds.unistra.fr-inf-20250316-091614-2ddo1-01543.warc.gz	6760055913	download job
cdsarc.cds.unistra.fr-inf-20250316-091614-2ddo1-01543.warc.os.cdx.gz	518	download
flibusta.is-inf-20240924-060021-7gpwv-01426.warc.gz	5368905460	download job
flibusta.is-inf-20240924-060021-7gpwv-01426.warc.os.cdx.gz	785202	download
g-form.com-inf-20250704-204317-arfrt-00001.warc.gz	5369137824	download job
g-form.com-inf-20250704-204317-arfrt-00001.warc.os.cdx.gz	150524	download
ipsw.me-inf-20241201-145231-9lrev-11501.warc.gz	6583751422	download job
ipsw.me-inf-20241201-145231-9lrev-11501.warc.os.cdx.gz	1663	download
mysiena.sienaheights.edu-inf-20250704-154126-62x83-00005.warc.gz	5368720226	download job
mysiena.sienaheights.edu-inf-20250704-154126-62x83-00005.warc.os.cdx.gz	2254882	download
publication.pravo.gov.ru-inf-20250406-135504-9vgms-00281.warc.gz	5380367136	download job
publication.pravo.gov.ru-inf-20250406-135504-9vgms-00281.warc.os.cdx.gz	2640965	download
support.glitch.com-shallow-20250705-042341-4xl8f-00000.warc.gz	4287326	download job
support.glitch.com-shallow-20250705-042341-4xl8f-00000.warc.os.cdx.gz	71541	download
support.glitch.com-shallow-20250705-042341-4xl8f-meta.warc.gz	39276	download job
support.glitch.com-shallow-20250705-042341-4xl8f-meta.warc.os.cdx.gz	47	download
support.glitch.com-shallow-20250705-042341-4xl8f.json	333	download job
support.glitch.com-shallow-20250705-042354-17a4q-00000.warc.gz	4292266	download job
support.glitch.com-shallow-20250705-042354-17a4q-00000.warc.os.cdx.gz	71409	download
support.glitch.com-shallow-20250705-042354-17a4q-meta.warc.gz	39196	download job
support.glitch.com-shallow-20250705-042354-17a4q-meta.warc.os.cdx.gz	47	download
support.glitch.com-shallow-20250705-042354-17a4q.json	321	download job
test.erisinfo.com-inf-20250704-221522-dsepv-00001.warc.gz	879134750	download job
test.erisinfo.com-inf-20250704-221522-dsepv-00001.warc.os.cdx.gz	1523313	download
test.erisinfo.com-inf-20250704-221522-dsepv-meta.warc.gz	3451252	download job
test.erisinfo.com-inf-20250704-221522-dsepv-meta.warc.os.cdx.gz	47	download
test.erisinfo.com-inf-20250704-221522-dsepv.json	248	download job
urls-transfer.archivete.am-digitalcollections.lib.washington.edu_urls.txt-shallow-20250611-002657-6vmvn-00390.warc.gz	5369480035	download job
urls-transfer.archivete.am-digitalcollections.lib.washington.edu_urls.txt-shallow-20250611-002657-6vmvn-00390.warc.os.cdx.gz	606202	download
urls-transfer.archivete.am-gore.com_gore.co.jp_gore.co.uk_gore.com.br_gore.com.cn_gore.com.es_gore.de_gore.fr_gore.it_goremedical.com_subdomains.txt-inf-20250704-193207-bwwom-00001.warc.gz	5372113689	download job
urls-transfer.archivete.am-gore.com_gore.co.jp_gore.co.uk_gore.com.br_gore.com.cn_gore.com.es_gore.de_gore.fr_gore.it_goremedical.com_subdomains.txt-inf-20250704-193207-bwwom-00001.warc.os.cdx.gz	6043717	download
urls-transfer.archivete.am-milliken.com_subdomains.txt-inf-20250704-200742-9dlqg-00003.warc.gz	5368739664	download job
urls-transfer.archivete.am-milliken.com_subdomains.txt-inf-20250704-200742-9dlqg-00003.warc.os.cdx.gz	987740	download
urls-transfer.archivete.am-www.ine.mx_all-subdomains.txt-inf-20250602-135418-473yz-00526.warc.gz	5586211103	download job
urls-transfer.archivete.am-www.ine.mx_all-subdomains.txt-inf-20250602-135418-473yz-00526.warc.os.cdx.gz	15343	download
usatoday.tumblr.com-inf-20250628-071652-9p1l8-00080.warc.gz	5368726508	download job
usatoday.tumblr.com-inf-20250628-071652-9p1l8-00080.warc.os.cdx.gz	2346100	download
www.assnat.qc.ca-inf-20250628-184306-cmlix-00218.warc.gz	5643934789	download job
www.assnat.qc.ca-inf-20250628-184306-cmlix-00218.warc.os.cdx.gz	2271	download
www.cato.org-inf-20250616-181337-woehf-00469.warc.gz	6167094650	download job
www.cato.org-inf-20250616-181337-woehf-00469.warc.os.cdx.gz	15511	download
www.erisinfo.com-inf-20250704-221231-5xvav-00003.warc.gz	5368802860	download job
www.erisinfo.com-inf-20250704-221231-5xvav-00003.warc.os.cdx.gz	1143256	download
www.hawzahnews.com-inf-20250629-170726-375e9-00017.warc.gz	5371457017	download job
www.hawzahnews.com-inf-20250629-170726-375e9-00017.warc.os.cdx.gz	1290969	download
www.instructables.com-inf-20250620-084548-96szf-00246.warc.gz	8235194886	download job
www.instructables.com-inf-20250620-084548-96szf-00246.warc.os.cdx.gz	1407063	download
www.martinoticias.com-inf-20250605-173025-9jp0f-02650.warc.gz	5530373402	download job
www.martinoticias.com-inf-20250605-173025-9jp0f-02650.warc.os.cdx.gz	1191157	download
www.martinoticias.com-inf-20250605-173025-9jp0f-02651.warc.gz	5399709024	download job
www.martinoticias.com-inf-20250605-173025-9jp0f-02651.warc.os.cdx.gz	14674	download
www.pbs.org-inf-20250330-092508-bykmh-08133.warc.gz	5579185796	download job
www.pbs.org-inf-20250330-092508-bykmh-08133.warc.os.cdx.gz	7882	download