Item archiveteam_archivebot_go_20251111174248_e3f21e55

Filename	Size
archiveteam_archivebot_go_20251111174248_e3f21e55.cdx.gz	56691697	download
archiveteam_archivebot_go_20251111174248_e3f21e55.cdx.idx	70830	download
archiveteam_archivebot_go_20251111174248_e3f21e55_files.xml	0	download
archiveteam_archivebot_go_20251111174248_e3f21e55_meta.sqlite	98304	download
archiveteam_archivebot_go_20251111174248_e3f21e55_meta.xml	881	download
cabinet.gov.eg-inf-20251111-105109-cvl8p-00000.warc.gz	4615683916	download job
cabinet.gov.eg-inf-20251111-105109-cvl8p-00000.warc.os.cdx.gz	1179143	download
cabinet.gov.eg-inf-20251111-105109-cvl8p-meta.warc.gz	1214564	download job
cabinet.gov.eg-inf-20251111-105109-cvl8p-meta.warc.os.cdx.gz	47	download
cabinet.gov.eg-inf-20251111-105109-cvl8p.json	242	download job
dennikn.sk-inf-20251107-153927-7fz2s-00054.warc.gz	5369041708	download job
dennikn.sk-inf-20251107-153927-7fz2s-00054.warc.os.cdx.gz	897675	download
forum.davidicke.com-inf-20251025-164458-13s4j-00300.warc.gz	5836687734	download job
forum.davidicke.com-inf-20251025-164458-13s4j-00300.warc.os.cdx.gz	624460	download
grijalva.house.gov-inf-20251111-170419-b55wu-00000.warc.gz	9164071	download job
grijalva.house.gov-inf-20251111-170419-b55wu-00000.warc.os.cdx.gz	5832	download
grijalva.house.gov-inf-20251111-170419-b55wu-meta.warc.gz	7001	download job
grijalva.house.gov-inf-20251111-170419-b55wu-meta.warc.os.cdx.gz	47	download
grijalva.house.gov-inf-20251111-170419-b55wu.json	249	download job
kitsunes.dev-inf-20251109-233804-5fvq8-00020.warc.gz	5210082719	download job
kitsunes.dev-inf-20251109-233804-5fvq8-00020.warc.os.cdx.gz	4994887	download
kitsunes.dev-inf-20251109-233804-5fvq8-meta.warc.gz	41817072	download job
kitsunes.dev-inf-20251109-233804-5fvq8-meta.warc.os.cdx.gz	47	download
kitsunes.dev-inf-20251109-233804-5fvq8.json	238	download job
realitatea.md-inf-20251005-085145-84wpv-01119.warc.gz	6233507957	download job
realitatea.md-inf-20251005-085145-84wpv-01119.warc.os.cdx.gz	70091	download
realitatea.md-inf-20251005-085145-84wpv-01120.warc.gz	8013463200	download job
realitatea.md-inf-20251005-085145-84wpv-01120.warc.os.cdx.gz	43029	download
shop.penguin.co.uk-inf-20251111-102758-9943o-00001.warc.gz	5368709172	download job
shop.penguin.co.uk-inf-20251111-102758-9943o-00001.warc.os.cdx.gz	1642620	download
urls-transfer.archivete.am-cdm16118.contentdm.oclc.org_urls_spl.contentdm.oclc.org_spl.org.txt-shallow-20251019-175530-brjfd-00667.warc.gz	5369008757	download job
urls-transfer.archivete.am-cdm16118.contentdm.oclc.org_urls_spl.contentdm.oclc.org_spl.org.txt-shallow-20251019-175530-brjfd-00667.warc.os.cdx.gz	1449497	download
urls-transfer.archivete.am-cloudwaysapps.com-24606-subdomains-inf-20250710-234441-5btzz-00276.warc.gz	5368714973	download job
urls-transfer.archivete.am-cloudwaysapps.com-24606-subdomains-inf-20250710-234441-5btzz-00276.warc.os.cdx.gz	8653096	download
urls-transfer.archivete.am-contentdm.lib.byu.edu_urls.txt-shallow-20251109-235823-1vha6-00015.warc.gz	5368723900	download job
urls-transfer.archivete.am-contentdm.lib.byu.edu_urls.txt-shallow-20251109-235823-1vha6-00015.warc.os.cdx.gz	652642	download
urls-transfer.archivete.am-ohiomemory.org_urls.txt-shallow-20251009-234219-cuwl7-01759.warc.gz	5371363514	download job
urls-transfer.archivete.am-ohiomemory.org_urls.txt-shallow-20251009-234219-cuwl7-01759.warc.os.cdx.gz	152028	download
urls-transfer.archivete.am-seattleschools.org_subdomains.txt-inf-20251109-234020-4p895-00011.warc.gz	5368764460	download job
urls-transfer.archivete.am-seattleschools.org_subdomains.txt-inf-20251109-234020-4p895-00011.warc.os.cdx.gz	5569598	download
urls-transfer.archivete.am-www.hindi.cpiml.net.txt-inf-20251111-115323-9xbfx-00000.warc.gz	5368938210	download job
urls-transfer.archivete.am-www.hindi.cpiml.net.txt-inf-20251111-115323-9xbfx-00000.warc.os.cdx.gz	3168668	download
urls-transfer.archivete.am-www.opm.gov_seed_urls_november_2025.txt-inf-20251110-235454-7lkp8-00002.warc.gz	5368710880	download job
urls-transfer.archivete.am-www.opm.gov_seed_urls_november_2025.txt-inf-20251110-235454-7lkp8-00002.warc.os.cdx.gz	6699203	download
urls-transfer.archivete.am-www.stortinget.no.txt-inf-20250921-100738-9hyvg-00825.warc.gz	5368821973	download job
urls-transfer.archivete.am-www.stortinget.no.txt-inf-20250921-100738-9hyvg-00825.warc.os.cdx.gz	720268	download
www.lhboutique.co.uk-inf-20251013-225655-7q9k0-00130.warc.gz	5368978650	download job
www.lhboutique.co.uk-inf-20251013-225655-7q9k0-00130.warc.os.cdx.gz	3162956	download
www.nycfoodpolicy.org-inf-20251107-213141-do9y9-00051.warc.gz	5375387765	download job
www.nycfoodpolicy.org-inf-20251107-213141-do9y9-00051.warc.os.cdx.gz	9042096	download
www.onomastik.com-inf-20251111-102404-bjrzi-00000.warc.gz	5388476861	download job
www.onomastik.com-inf-20251111-102404-bjrzi-00000.warc.os.cdx.gz	5108892	download
www.senado.gob.ar-inf-20251031-170707-c99m5-00021.warc.gz	5368709272	download job
www.senado.gob.ar-inf-20251031-170707-c99m5-00021.warc.os.cdx.gz	2409737	download
www.sociocracyforall.org-inf-20251111-170329-1s13d-00000.warc.gz	16101	download job
www.sociocracyforall.org-inf-20251111-170329-1s13d-00000.warc.os.cdx.gz	393	download
www.sociocracyforall.org-inf-20251111-170329-1s13d-meta.warc.gz	3524	download job
www.sociocracyforall.org-inf-20251111-170329-1s13d-meta.warc.os.cdx.gz	47	download
www.sociocracyforall.org-inf-20251111-170329-1s13d.json	254	download job
www.sociocracyforall.org-inf-20251111-170407-1s13d-00000.warc.gz	16427	download job
www.sociocracyforall.org-inf-20251111-170407-1s13d-00000.warc.os.cdx.gz	390	download
www.sociocracyforall.org-inf-20251111-170407-1s13d-meta.warc.gz	3617	download job
www.sociocracyforall.org-inf-20251111-170407-1s13d-meta.warc.os.cdx.gz	47	download
www.sociocracyforall.org-inf-20251111-170407-1s13d.json	254	download job
www.sociocracyforall.org-inf-20251111-170603-1s13d-00000.warc.gz	15733	download job
www.sociocracyforall.org-inf-20251111-170603-1s13d-00000.warc.os.cdx.gz	384	download
www.sociocracyforall.org-inf-20251111-170603-1s13d-meta.warc.gz	3426	download job
www.sociocracyforall.org-inf-20251111-170603-1s13d-meta.warc.os.cdx.gz	47	download
www.sociocracyforall.org-inf-20251111-170603-1s13d.json	254	download job
www.tasnimnews.com-inf-20250615-195050-79wa4-01170.warc.gz	5426358531	download job
www.tasnimnews.com-inf-20250615-195050-79wa4-01170.warc.os.cdx.gz	178523	download
www.unz.com-inf-20251027-024316-1qan5-00247.warc.gz	5439553417	download job
www.unz.com-inf-20251027-024316-1qan5-00247.warc.os.cdx.gz	740759	download
www.wbur.org-inf-20251016-103411-cgnfa-00486.warc.gz	5369143523	download job
www.wbur.org-inf-20251016-103411-cgnfa-00486.warc.os.cdx.gz	1199359	download