Item archiveteam_archivebot_go_20260529120729_1433a2d7

Filename	Size
angryczeck.wordpress.com-inf-20260529-111720-bomxt-00000.warc.gz	1085330261	download job
angryczeck.wordpress.com-inf-20260529-111720-bomxt-00000.warc.os.cdx.gz	670796	download
angryczeck.wordpress.com-inf-20260529-111720-bomxt-meta.warc.gz	440556	download job
angryczeck.wordpress.com-inf-20260529-111720-bomxt-meta.warc.os.cdx.gz	47	download
angryczeck.wordpress.com-inf-20260529-111720-bomxt.json	252	download job
animetosho.org-inf-20260507-015459-bhzal-00064.warc.gz	5369245591	download job
animetosho.org-inf-20260507-015459-bhzal-00064.warc.os.cdx.gz	1099038	download
archiveteam_archivebot_go_20260529120729_1433a2d7.cdx.gz	655994	download
archiveteam_archivebot_go_20260529120729_1433a2d7.cdx.idx	917	download
archiveteam_archivebot_go_20260529120729_1433a2d7_files.xml	0	download
archiveteam_archivebot_go_20260529120729_1433a2d7_meta.sqlite	94208	download
archiveteam_archivebot_go_20260529120729_1433a2d7_meta.xml	1046	download
countercurrents.org-inf-20260501-221532-c2foy-00286.warc.gz	5369345495	download job
countercurrents.org-inf-20260501-221532-c2foy-00286.warc.os.cdx.gz	1574971	download
discourse.webflow.com-inf-20260524-100959-chvlj-00010.warc.gz	5372794086	download job
discourse.webflow.com-inf-20260524-100959-chvlj-00010.warc.os.cdx.gz	3221417	download
dogsmeat.wordpress.com-inf-20260528-160936-34pbx-00006.warc.gz	5611035986	download job
dogsmeat.wordpress.com-inf-20260528-160936-34pbx-00006.warc.os.cdx.gz	746520	download
fleshbot.com-inf-20260501-090643-46ic1-00508.warc.gz	5371483081	download job
fleshbot.com-inf-20260501-090643-46ic1-00508.warc.os.cdx.gz	15694	download
fleshbot.com-inf-20260501-090643-46ic1-00509.warc.gz	5480572637	download job
fleshbot.com-inf-20260501-090643-46ic1-00509.warc.os.cdx.gz	41757	download
hirado.hu-inf-20260416-011624-91i1j-00037.warc.gz	5385417357	download job
hirado.hu-inf-20260416-011624-91i1j-00037.warc.os.cdx.gz	2627016	download
internetfoodassociation.wordpress.com-inf-20260529-073855-6nsd3-00001.warc.gz	5543927481	download job
internetfoodassociation.wordpress.com-inf-20260529-073855-6nsd3-00001.warc.os.cdx.gz	1934514	download
library-of-leng.com-inf-20260523-050738-35m7l-00038.warc.gz	5368750795	download job
library-of-leng.com-inf-20260523-050738-35m7l-00038.warc.os.cdx.gz	833539	download
newsguild.org-inf-20260528-193147-4m35f-00010.warc.gz	4412149310	download job
newsguild.org-inf-20260528-193147-4m35f-00010.warc.os.cdx.gz	4069628	download
newsguild.org-inf-20260528-193147-4m35f-meta.warc.gz	10492557	download job
newsguild.org-inf-20260528-193147-4m35f-meta.warc.os.cdx.gz	47	download
newsguild.org-inf-20260528-193147-4m35f.json	244	download job
openresearch-repository.anu.edu.au-inf-20260430-202033-a51bw-00069.warc.gz	5371965041	download job
openresearch-repository.anu.edu.au-inf-20260430-202033-a51bw-00069.warc.os.cdx.gz	105320	download
sproutmirror9.wordpress.com-inf-20260529-113755-3aq3x-00000.warc.gz	136908264	download job
sproutmirror9.wordpress.com-inf-20260529-113755-3aq3x-00000.warc.os.cdx.gz	380873	download
sproutmirror9.wordpress.com-inf-20260529-113755-3aq3x-meta.warc.gz	281450	download job
sproutmirror9.wordpress.com-inf-20260529-113755-3aq3x-meta.warc.os.cdx.gz	47	download
sproutmirror9.wordpress.com-inf-20260529-113755-3aq3x.json	255	download job
theverge.tumblr.com-inf-20260512-005336-axm49-00299.warc.gz	5369663809	download job
theverge.tumblr.com-inf-20260512-005336-axm49-00299.warc.os.cdx.gz	2362673	download
thirdworldxxx.com-inf-20260308-223712-a31io-00560.warc.gz	5368774749	download job
thirdworldxxx.com-inf-20260308-223712-a31io-00560.warc.os.cdx.gz	5104823	download
urls-transfer.archivete.am-berkeley.edu_subdomains.txt-inf-20260225-025210-bb9um-00680.warc.gz	5825466374	download job
urls-transfer.archivete.am-berkeley.edu_subdomains.txt-inf-20260225-025210-bb9um-00680.warc.os.cdx.gz	1480	download
urls-transfer.archivete.am-cdm16998.contentdm.oclc.org_urls_mirrors_digital.cincinnatilibrary.org.txt-shallow-20251110-043506-ddfqe-00882.warc.gz	5368847025	download job
urls-transfer.archivete.am-cdm16998.contentdm.oclc.org_urls_mirrors_digital.cincinnatilibrary.org.txt-shallow-20251110-043506-ddfqe-00882.warc.os.cdx.gz	386759	download
urls-transfer.archivete.am-www.gdcvault.com_gdcvault.blazestreaming.com_cdn-a.blazestreaming.com_segments_from_4wbxk.txt-inf-20260527-064831-6lqlv-00175.warc.gz	5370203829	download job
urls-transfer.archivete.am-www.gdcvault.com_gdcvault.blazestreaming.com_cdn-a.blazestreaming.com_segments_from_4wbxk.txt-inf-20260527-064831-6lqlv-00175.warc.os.cdx.gz	427711	download
utb.go.ug-inf-20260523-160523-32zdh-00009.warc.gz	5405817840	download job
utb.go.ug-inf-20260523-160523-32zdh-00009.warc.os.cdx.gz	20874441	download
waterrights.utah.gov-inf-20260514-020816-4kdhr-00276.warc.gz	5368998428	download job
waterrights.utah.gov-inf-20260514-020816-4kdhr-00276.warc.os.cdx.gz	1829560	download
www.55haitao.com-inf-20251009-181115-alu95-00452.warc.gz	5369367140	download job
www.55haitao.com-inf-20251009-181115-alu95-00452.warc.os.cdx.gz	5803876	download
www.conspiracyculture.com-inf-20260529-114447-7b0cn-00000.warc.gz	15231629	download job
www.conspiracyculture.com-inf-20260529-114447-7b0cn-00000.warc.os.cdx.gz	100780	download
www.conspiracyculture.com-inf-20260529-114447-7b0cn-meta.warc.gz	51265	download job
www.conspiracyculture.com-inf-20260529-114447-7b0cn-meta.warc.os.cdx.gz	47	download
www.conspiracyculture.com-inf-20260529-114447-7b0cn.json	253	download job
www.ilxor.com-inf-20260514-065748-becak-00199.warc.gz	5504628113	download job
www.ilxor.com-inf-20260514-065748-becak-00199.warc.os.cdx.gz	6550820	download
www.sociaalopleidingsinstituut.nl-inf-20260529-105215-eenni-00000.warc.gz	406508521	download job
www.sociaalopleidingsinstituut.nl-inf-20260529-105215-eenni-00000.warc.os.cdx.gz	711383	download
www.sociaalopleidingsinstituut.nl-inf-20260529-105215-eenni-meta.warc.gz	471810	download job
www.sociaalopleidingsinstituut.nl-inf-20260529-105215-eenni-meta.warc.os.cdx.gz	47	download
www.sociaalopleidingsinstituut.nl-inf-20260529-105215-eenni.json	261	download job
www.volontereport.com-inf-20260412-152230-by3bf-00903.warc.gz	5388578016	download job
www.volontereport.com-inf-20260412-152230-by3bf-00903.warc.os.cdx.gz	285544	download
www.yawbbs.com-inf-20260428-042118-40ce1-00040.warc.gz	5368964376	download job
www.yawbbs.com-inf-20260428-042118-40ce1-00040.warc.os.cdx.gz	926383	download