Item archiveteam_archivebot_go_20260406170910_7440bd6f

Filename	Size
19thnews.org-inf-20260327-013804-9sv7h-00077.warc.gz	5369067049	download job
19thnews.org-inf-20260327-013804-9sv7h-00077.warc.os.cdx.gz	114194	download
archiveteam_archivebot_go_20260406170910_7440bd6f.cdx.gz	31860769	download
archiveteam_archivebot_go_20260406170910_7440bd6f.cdx.idx	34042	download
archiveteam_archivebot_go_20260406170910_7440bd6f_files.xml	0	download
archiveteam_archivebot_go_20260406170910_7440bd6f_meta.sqlite	102400	download
archiveteam_archivebot_go_20260406170910_7440bd6f_meta.xml	1047	download
cdsarc.cds.unistra.fr-inf-20250316-091614-2ddo1-02449.warc.gz	5715645919	download job
cdsarc.cds.unistra.fr-inf-20250316-091614-2ddo1-02449.warc.os.cdx.gz	1535172	download
ddr.densho.org-inf-20260328-213558-5eckx-00323.warc.gz	5390209498	download job
ddr.densho.org-inf-20260328-213558-5eckx-00323.warc.os.cdx.gz	1093601	download
en.dravenstales.ch-inf-20260402-145316-2r4mk-00066.warc.gz	5379832461	download job
en.dravenstales.ch-inf-20260402-145316-2r4mk-00066.warc.os.cdx.gz	813164	download
etcjournal.com-inf-20260406-121928-5tgsb-00001.warc.gz	5369296433	download job
etcjournal.com-inf-20260406-121928-5tgsb-00001.warc.os.cdx.gz	911209	download
foto.patriarchia.ru-inf-20260406-025907-d1vgb-00015.warc.gz	5370836741	download job
foto.patriarchia.ru-inf-20260406-025907-d1vgb-00015.warc.os.cdx.gz	101321	download
idec.org.br-inf-20260405-212402-88yij-00003.warc.gz	5368887002	download job
idec.org.br-inf-20260405-212402-88yij-00003.warc.os.cdx.gz	3141118	download
presidency.gov.mv-inf-20260404-105154-3e07k-00053.warc.gz	5370847022	download job
presidency.gov.mv-inf-20260404-105154-3e07k-00053.warc.os.cdx.gz	641609	download
snuc.com-inf-20260406-163121-b7vgz-00000.warc.gz	8813673	download job
snuc.com-inf-20260406-163121-b7vgz-00000.warc.os.cdx.gz	21456	download
snuc.com-inf-20260406-163121-b7vgz-meta.warc.gz	17647	download job
snuc.com-inf-20260406-163121-b7vgz-meta.warc.os.cdx.gz	47	download
snuc.com-inf-20260406-163121-b7vgz.json	233	download job
snuc.eu-inf-20260406-163159-29s2t-00000.warc.gz	8836492	download job
snuc.eu-inf-20260406-163159-29s2t-00000.warc.os.cdx.gz	21639	download
snuc.eu-inf-20260406-163159-29s2t-meta.warc.gz	17826	download job
snuc.eu-inf-20260406-163159-29s2t-meta.warc.os.cdx.gz	47	download
snuc.eu-inf-20260406-163159-29s2t.json	231	download job
urls-transfer.archivete.am-identityweek.net_falsely-ignored-wp-json-urls.txt-shallow-20260405-164508-4dz3e-00000.warc.gz	5604590930	download job
urls-transfer.archivete.am-identityweek.net_falsely-ignored-wp-json-urls.txt-shallow-20260405-164508-4dz3e-00000.warc.os.cdx.gz	2288767	download
urls-transfer.archivete.am-identityweek.net_falsely-ignored-wp-json-urls.txt-shallow-20260405-164508-4dz3e-00001.warc.gz	1295261243	download job
urls-transfer.archivete.am-identityweek.net_falsely-ignored-wp-json-urls.txt-shallow-20260405-164508-4dz3e-00001.warc.os.cdx.gz	18086	download
urls-transfer.archivete.am-identityweek.net_falsely-ignored-wp-json-urls.txt-shallow-20260405-164508-4dz3e-meta.warc.gz	1756755	download job
urls-transfer.archivete.am-identityweek.net_falsely-ignored-wp-json-urls.txt-shallow-20260405-164508-4dz3e-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-identityweek.net_falsely-ignored-wp-json-urls.txt-shallow-20260405-164508-4dz3e-urls.txt	4160116	download
urls-transfer.archivete.am-identityweek.net_falsely-ignored-wp-json-urls.txt-shallow-20260405-164508-4dz3e.json	391	download job
urls-transfer.archivete.am-momsforliberty.org_m4lacademy.org_m4lfoundation.org_subdomains.txt-inf-20260406-033337-2m20m-00012.warc.gz	5904065402	download job
urls-transfer.archivete.am-momsforliberty.org_m4lacademy.org_m4lfoundation.org_subdomains.txt-inf-20260406-033337-2m20m-00012.warc.os.cdx.gz	309063	download
urls-transfer.archivete.am-momsforliberty.org_m4lacademy.org_m4lfoundation.org_subdomains.txt-inf-20260406-033337-2m20m-00013.warc.gz	5462308316	download job
urls-transfer.archivete.am-momsforliberty.org_m4lacademy.org_m4lfoundation.org_subdomains.txt-inf-20260406-033337-2m20m-00013.warc.os.cdx.gz	18942	download
urls-transfer.archivete.am-momsforliberty.org_m4lacademy.org_m4lfoundation.org_subdomains.txt-inf-20260406-033337-2m20m-00014.warc.gz	5688273704	download job
urls-transfer.archivete.am-momsforliberty.org_m4lacademy.org_m4lfoundation.org_subdomains.txt-inf-20260406-033337-2m20m-00014.warc.os.cdx.gz	26834	download
urls-transfer.archivete.am-www.arcair.com.txt-inf-20260406-054401-2i39v-00000.warc.gz	5368727489	download job
urls-transfer.archivete.am-www.arcair.com.txt-inf-20260406-054401-2i39v-00000.warc.os.cdx.gz	13636198	download
urls-transfer.archivete.am-www.compactmag.com_429-api.microlink.io-urls.txt-shallow-20260406-133859-5h5da-aborted-00000.warc.gz	63889506	download job
urls-transfer.archivete.am-www.compactmag.com_429-api.microlink.io-urls.txt-shallow-20260406-133859-5h5da-aborted-00000.warc.os.cdx.gz	10507	download
urls-transfer.archivete.am-www.compactmag.com_429-api.microlink.io-urls.txt-shallow-20260406-133859-5h5da-aborted-wpull.log.gz	7571	download
urls-transfer.archivete.am-www.compactmag.com_429-api.microlink.io-urls.txt-shallow-20260406-133859-5h5da-aborted.json	388	download job
urls-transfer.archivete.am-www.compactmag.com_429-api.microlink.io-urls.txt-shallow-20260406-133859-5h5da-urls.txt	314819	download
urls-transfer.archivete.am-www.sikhnet.com.txt-inf-20260404-062338-2mo2a-00163.warc.gz	5374024107	download job
urls-transfer.archivete.am-www.sikhnet.com.txt-inf-20260404-062338-2mo2a-00163.warc.os.cdx.gz	83269	download
urls-transfer.archivete.am-www.sikhnet.com.txt-inf-20260404-062338-2mo2a-00164.warc.gz	5396114383	download job
urls-transfer.archivete.am-www.sikhnet.com.txt-inf-20260404-062338-2mo2a-00164.warc.os.cdx.gz	88726	download
urls-transfer.archivete.am-www.sikhnet.com.txt-inf-20260404-062338-2mo2a-00165.warc.gz	5371514454	download job
urls-transfer.archivete.am-www.sikhnet.com.txt-inf-20260404-062338-2mo2a-00165.warc.os.cdx.gz	92541	download
usgovernmentofficial.tumblr.com-inf-20251222-061339-b1lo1-02223.warc.gz	5368754732	download job
usgovernmentofficial.tumblr.com-inf-20251222-061339-b1lo1-02223.warc.os.cdx.gz	1551875	download
www.flickr.com-inf-20260402-011356-5q76e-00031.warc.gz	5369698932	download job
www.flickr.com-inf-20260402-011356-5q76e-00031.warc.os.cdx.gz	546198	download
www.mneuhold.at-inf-20260403-174542-8cov7-00002.warc.gz	5692264209	download job
www.mneuhold.at-inf-20260403-174542-8cov7-00002.warc.os.cdx.gz	4214768	download
www.nalog.gov.ru-inf-20260124-135338-73l2b-00235.warc.gz	5368737291	download job
www.nalog.gov.ru-inf-20260124-135338-73l2b-00235.warc.os.cdx.gz	528148	download
www.richmondfreepress.com-inf-20260406-164234-cie8u-00000.warc.gz	14745	download job
www.richmondfreepress.com-inf-20260406-164234-cie8u-00000.warc.os.cdx.gz	566	download
www.richmondfreepress.com-inf-20260406-164234-cie8u-meta.warc.gz	3599	download job
www.richmondfreepress.com-inf-20260406-164234-cie8u-meta.warc.os.cdx.gz	47	download
www.richmondfreepress.com-inf-20260406-164234-cie8u.json	256	download job
www.ushmm.org-inf-20260406-023153-12bo5-00007.warc.gz	5424923266	download job
www.ushmm.org-inf-20260406-023153-12bo5-00007.warc.os.cdx.gz	234932	download
www.volkswagenstiftung.de-inf-20260406-115201-7z5if-00002.warc.gz	5382966527	download job
www.volkswagenstiftung.de-inf-20260406-115201-7z5if-00002.warc.os.cdx.gz	777011	download