Item archiveteam_archivebot_go_20260405092911_0c6c0914

Filename	Size
archiveteam_archivebot_go_20260405092911_0c6c0914.cdx.gz	60911834	download
archiveteam_archivebot_go_20260405092911_0c6c0914.cdx.idx	36537	download
archiveteam_archivebot_go_20260405092911_0c6c0914_files.xml	0	download
archiveteam_archivebot_go_20260405092911_0c6c0914_meta.sqlite	110592	download
archiveteam_archivebot_go_20260405092911_0c6c0914_meta.xml	1047	download
cynthiachung.substack.com-inf-20260402-160908-2nojt-00013.warc.gz	5398143152	download job
cynthiachung.substack.com-inf-20260402-160908-2nojt-00013.warc.os.cdx.gz	1014723	download
geodesy.noaa.gov-inf-20250209-132218-9k33v-00466.warc.gz	5369055943	download job
geodesy.noaa.gov-inf-20250209-132218-9k33v-00466.warc.os.cdx.gz	645164	download
old.4vlast-bg.com-inf-20260325-223510-dcbtl-00029.warc.gz	5376139671	download job
old.4vlast-bg.com-inf-20260325-223510-dcbtl-00029.warc.os.cdx.gz	7854317	download
presidency.gov.mv-inf-20260404-105154-3e07k-00021.warc.gz	5368771352	download job
presidency.gov.mv-inf-20260404-105154-3e07k-00021.warc.os.cdx.gz	709738	download
qpress.de-inf-20260404-090738-bd4jd-00010.warc.gz	5368979875	download job
qpress.de-inf-20260404-090738-bd4jd-00010.warc.os.cdx.gz	509808	download
refusefascism.org-inf-20260405-040741-d1k3a-00001.warc.gz	5405986147	download job
refusefascism.org-inf-20260405-040741-d1k3a-00001.warc.os.cdx.gz	1085400	download
theprimaryschool.org-inf-20260405-092230-2ftf9-00000.warc.gz	8826260	download job
theprimaryschool.org-inf-20260405-092230-2ftf9-00000.warc.os.cdx.gz	14267	download
theprimaryschool.org-inf-20260405-092230-2ftf9-meta.warc.gz	12158	download job
theprimaryschool.org-inf-20260405-092230-2ftf9-meta.warc.os.cdx.gz	47	download
theprimaryschool.org-inf-20260405-092230-2ftf9.json	248	download job
urls-transfer.archivete.am-www.alalam.ir_and_en.alalam.ir_and_fa.alalam.ir.txt-inf-20260328-153005-5hc4r-00115.warc.gz	5378424271	download job
urls-transfer.archivete.am-www.alalam.ir_and_en.alalam.ir_and_fa.alalam.ir.txt-inf-20260328-153005-5hc4r-00115.warc.os.cdx.gz	41693	download
urls-transfer.archivete.am-www.sikhnet.com.txt-inf-20260404-062338-2mo2a-00038.warc.gz	5391072966	download job
urls-transfer.archivete.am-www.sikhnet.com.txt-inf-20260404-062338-2mo2a-00038.warc.os.cdx.gz	81630	download
urls-transfer.archivete.am-www.sikhnet.com.txt-inf-20260404-062338-2mo2a-00039.warc.gz	5412471967	download job
urls-transfer.archivete.am-www.sikhnet.com.txt-inf-20260404-062338-2mo2a-00039.warc.os.cdx.gz	50186	download
urls-transfer.archivete.am-www.sikhnet.com.txt-inf-20260404-062338-2mo2a-00040.warc.gz	5758632714	download job
urls-transfer.archivete.am-www.sikhnet.com.txt-inf-20260404-062338-2mo2a-00040.warc.os.cdx.gz	46462	download
usgovernmentofficial.tumblr.com-inf-20251222-061339-b1lo1-02198.warc.gz	5368904440	download job
usgovernmentofficial.tumblr.com-inf-20251222-061339-b1lo1-02198.warc.os.cdx.gz	1526437	download
www.4rt.fr-inf-20260405-090523-7xez0-00000.warc.gz	205572743	download job
www.4rt.fr-inf-20260405-090523-7xez0-00000.warc.os.cdx.gz	193435	download
www.4rt.fr-inf-20260405-090523-7xez0-meta.warc.gz	126183	download job
www.4rt.fr-inf-20260405-090523-7xez0-meta.warc.os.cdx.gz	47	download
www.4rt.fr-inf-20260405-090523-7xez0.json	244	download job
www.aafcollection.com-inf-20260405-072452-aeu1l-00000.warc.gz	2569535232	download job
www.aafcollection.com-inf-20260405-072452-aeu1l-00000.warc.os.cdx.gz	1099574	download
www.aafcollection.com-inf-20260405-072452-aeu1l-meta.warc.gz	809756	download job
www.aafcollection.com-inf-20260405-072452-aeu1l-meta.warc.os.cdx.gz	47	download
www.aafcollection.com-inf-20260405-072452-aeu1l.json	249	download job
www.alainboullet.fr-inf-20260405-091932-7khov-00000.warc.gz	56711829	download job
www.alainboullet.fr-inf-20260405-091932-7khov-00000.warc.os.cdx.gz	55619	download
www.alainboullet.fr-inf-20260405-091932-7khov-meta.warc.gz	34587	download job
www.alainboullet.fr-inf-20260405-091932-7khov-meta.warc.os.cdx.gz	47	download
www.alainboullet.fr-inf-20260405-091932-7khov.json	253	download job
www.daniellevi.fr-inf-20260405-074707-edy02-00000.warc.gz	4335257195	download job
www.daniellevi.fr-inf-20260405-074707-edy02-00000.warc.os.cdx.gz	989648	download
www.daniellevi.fr-inf-20260405-074707-edy02-meta.warc.gz	612324	download job
www.daniellevi.fr-inf-20260405-074707-edy02-meta.warc.os.cdx.gz	47	download
www.daniellevi.fr-inf-20260405-074707-edy02.json	250	download job
www.jacquesbralpeintre.fr-inf-20260405-084847-f48cf-00000.warc.gz	860271446	download job
www.jacquesbralpeintre.fr-inf-20260405-084847-f48cf-00000.warc.os.cdx.gz	569326	download
www.jacquesbralpeintre.fr-inf-20260405-084847-f48cf-meta.warc.gz	357006	download job
www.jacquesbralpeintre.fr-inf-20260405-084847-f48cf-meta.warc.os.cdx.gz	47	download
www.jacquesbralpeintre.fr-inf-20260405-084847-f48cf.json	258	download job
www.nalog.gov.ru-inf-20260124-135338-73l2b-00229.warc.gz	5369009164	download job
www.nalog.gov.ru-inf-20260124-135338-73l2b-00229.warc.os.cdx.gz	2501430	download
www.nytimes.com-shallow-20260405-091905-d1wya-00000.warc.gz	5648	download job
www.nytimes.com-shallow-20260405-091905-d1wya-00000.warc.os.cdx.gz	250	download
www.nytimes.com-shallow-20260405-091905-d1wya-meta.warc.gz	3509	download job
www.nytimes.com-shallow-20260405-091905-d1wya-meta.warc.os.cdx.gz	47	download
www.nytimes.com-shallow-20260405-091905-d1wya.json	296	download job
www.nytimes.com-shallow-20260405-091942-d1wya-00000.warc.gz	5564	download job
www.nytimes.com-shallow-20260405-091942-d1wya-00000.warc.os.cdx.gz	251	download
www.nytimes.com-shallow-20260405-091942-d1wya-meta.warc.gz	3443	download job
www.nytimes.com-shallow-20260405-091942-d1wya-meta.warc.os.cdx.gz	47	download
www.nytimes.com-shallow-20260405-091942-d1wya.json	296	download job
www.pagodentreff.de-inf-20260402-055910-8snbd-00011.warc.gz	8235706711	download job
www.pagodentreff.de-inf-20260402-055910-8snbd-00011.warc.os.cdx.gz	29454643	download
www.scenemag.co.uk-inf-20260402-012618-2t2pw-00022.warc.gz	5368728985	download job
www.scenemag.co.uk-inf-20260402-012618-2t2pw-00022.warc.os.cdx.gz	2870384	download
www.staging.sidehustlenation.com-inf-20260404-181202-1iofe-00006.warc.gz	5383628586	download job
www.staging.sidehustlenation.com-inf-20260404-181202-1iofe-00006.warc.os.cdx.gz	277501	download
www.stjames-cathedral.org-inf-20260405-070314-4thct-00000.warc.gz	5408163883	download job
www.stjames-cathedral.org-inf-20260405-070314-4thct-00000.warc.os.cdx.gz	1631212	download
www.talabat.com-inf-20260302-231615-3a9pm-00018.warc.gz	5368767580	download job
www.talabat.com-inf-20260302-231615-3a9pm-00018.warc.os.cdx.gz	4361674	download
www.wfpa.org-inf-20260404-211645-59ued-00002.warc.gz	5445893334	download job
www.wfpa.org-inf-20260404-211645-59ued-00002.warc.os.cdx.gz	3635350	download
www.wfpa.org-inf-20260404-211645-59ued-00003.warc.gz	5500085358	download job
www.wfpa.org-inf-20260404-211645-59ued-00003.warc.os.cdx.gz	16066	download
www.wfpa.org-inf-20260404-211645-59ued-00004.warc.gz	5645954432	download job
www.wfpa.org-inf-20260404-211645-59ued-00004.warc.os.cdx.gz	13851	download