Item archiveteam_archivebot_go_20240409105938_b72402ba

Filename	Size
agnetwest.com-inf-20240404-205635-jk482-00033.warc.gz	5371439959	download job
agnetwest.com-inf-20240404-205635-jk482-00033.warc.os.cdx.gz	1809592	download
archiveteam_archivebot_go_20240409105938_b72402ba.cdx.gz	1761044	download
archiveteam_archivebot_go_20240409105938_b72402ba.cdx.idx	2161	download
archiveteam_archivebot_go_20240409105938_b72402ba_files.xml	0	download
archiveteam_archivebot_go_20240409105938_b72402ba_meta.sqlite	69632	download
archiveteam_archivebot_go_20240409105938_b72402ba_meta.xml	1046	download
development.truthout.org-inf-20240408-171110-46zej-00021.warc.gz	5369477122	download job
development.truthout.org-inf-20240408-171110-46zej-00021.warc.os.cdx.gz	1924218	download
evrs.bkg.bund.de-inf-20240409-094322-328ej-00000.warc.gz	4451104353	download job
evrs.bkg.bund.de-inf-20240409-094322-328ej-00000.warc.os.cdx.gz	1770186	download
evrs.bkg.bund.de-inf-20240409-094322-328ej-meta.warc.gz	1314080	download job
evrs.bkg.bund.de-inf-20240409-094322-328ej-meta.warc.os.cdx.gz	47	download
evrs.bkg.bund.de-inf-20240409-094322-328ej.json	244	download job
fivethirtyeight.com-inf-20240408-172625-aggl8-00017.warc.gz	5370198691	download job
fivethirtyeight.com-inf-20240408-172625-aggl8-00017.warc.os.cdx.gz	856792	download
gdzshopt-lpz.bkg.bund.de-inf-20240409-100344-70jun-00000.warc.gz	194088460	download job
gdzshopt-lpz.bkg.bund.de-inf-20240409-100344-70jun-00000.warc.os.cdx.gz	209110	download
gdzshopt-lpz.bkg.bund.de-inf-20240409-100344-70jun-meta.warc.gz	233924	download job
gdzshopt-lpz.bkg.bund.de-inf-20240409-100344-70jun-meta.warc.os.cdx.gz	47	download
gdzshopt-lpz.bkg.bund.de-inf-20240409-100344-70jun.json	252	download job
gesund.bund.de-inf-20240409-103401-476va-aborted-00000.warc.gz	9086	download job
gesund.bund.de-inf-20240409-103401-476va-aborted-00000.warc.os.cdx.gz	299	download
gesund.bund.de-inf-20240409-103401-476va-aborted-wpull.log.gz	852	download
gesund.bund.de-inf-20240409-103401-476va-aborted.json	241	download job
gesund.bund.de-inf-20240409-103548-476va-aborted-00000.warc.gz	10873	download job
gesund.bund.de-inf-20240409-103548-476va-aborted-00000.warc.os.cdx.gz	397	download
gesund.bund.de-inf-20240409-103548-476va-aborted-wpull.log.gz	940	download
gesund.bund.de-inf-20240409-103548-476va-aborted.json	241	download job
gis.bvl.bund.de-inf-20240409-104245-233w0-00000.warc.gz	15300539	download job
gis.bvl.bund.de-inf-20240409-104245-233w0-00000.warc.os.cdx.gz	26676	download
gis.bvl.bund.de-inf-20240409-104245-233w0-meta.warc.gz	19667	download job
gis.bvl.bund.de-inf-20240409-104245-233w0-meta.warc.os.cdx.gz	47	download
gis.bvl.bund.de-inf-20240409-104245-233w0.json	243	download job
goaml.fiu.bund.de-inf-20240409-102550-q7qiv-00000.warc.gz	327210820	download job
goaml.fiu.bund.de-inf-20240409-102550-q7qiv-00000.warc.os.cdx.gz	114003	download
goaml.fiu.bund.de-inf-20240409-102550-q7qiv-meta.warc.gz	92614	download job
goaml.fiu.bund.de-inf-20240409-102550-q7qiv-meta.warc.os.cdx.gz	47	download
goaml.fiu.bund.de-inf-20240409-102550-q7qiv.json	245	download job
picklebums.com-inf-20240409-034629-4dcji-00002.warc.gz	5411174031	download job
picklebums.com-inf-20240409-034629-4dcji-00002.warc.os.cdx.gz	3672141	download
pubsindex.trb.org-inf-20240409-054002-b1rhs-00000.warc.gz	5369287061	download job
pubsindex.trb.org-inf-20240409-054002-b1rhs-00000.warc.os.cdx.gz	4460912	download
repositoriodocumental.ine.mx-inf-20240329-160658-214oh-00322.warc.gz	5566469343	download job
repositoriodocumental.ine.mx-inf-20240329-160658-214oh-00322.warc.os.cdx.gz	2382	download
repositoriodocumental.ine.mx-inf-20240329-160658-214oh-00323.warc.gz	5459932972	download job
repositoriodocumental.ine.mx-inf-20240329-160658-214oh-00323.warc.os.cdx.gz	3641	download
staging.truthout.org-inf-20240408-170925-2tvgv-00030.warc.gz	5494203847	download job
staging.truthout.org-inf-20240408-170925-2tvgv-00030.warc.os.cdx.gz	565401	download
storage.googleapis.com-inf-20240301-202801-5jgg7-03812.warc.gz	5435675055	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-03812.warc.os.cdx.gz	771	download
storage.googleapis.com-inf-20240301-202801-5jgg7-03813.warc.gz	5692391702	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-03813.warc.os.cdx.gz	725	download
storage.googleapis.com-inf-20240301-202801-5jgg7-03814.warc.gz	5384031133	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-03814.warc.os.cdx.gz	774	download
transparencia.ieeg.mx-inf-20240409-045105-ejccb-00001.warc.gz	1786939347	download job
transparencia.ieeg.mx-inf-20240409-045105-ejccb-00001.warc.os.cdx.gz	11739083	download
transparencia.ieeg.mx-inf-20240409-045105-ejccb-meta.warc.gz	7837626	download job
transparencia.ieeg.mx-inf-20240409-045105-ejccb-meta.warc.os.cdx.gz	47	download
transparencia.ieeg.mx-inf-20240409-045105-ejccb.json	252	download job
truthout.org-inf-20240408-165731-16a89-00023.warc.gz	5378310963	download job
truthout.org-inf-20240408-165731-16a89-00023.warc.os.cdx.gz	469246	download
www.espritshop.ch-inf-20240326-142257-7jy5c-00024.warc.gz	5368734657	download job
www.espritshop.ch-inf-20240326-142257-7jy5c-00024.warc.os.cdx.gz	8495631	download
www.komikrealm.my.id-inf-20240408-220435-o5oxi-00027.warc.gz	5371086443	download job
www.komikrealm.my.id-inf-20240408-220435-o5oxi-00027.warc.os.cdx.gz	985901	download
www.polskieradio.pl-inf-20231221-075717-djrf2-01244.warc.gz	5948410345	download job
www.polskieradio.pl-inf-20231221-075717-djrf2-01244.warc.os.cdx.gz	30761	download
www.seattlechamber.com-inf-20240408-005244-46qjh-00009.warc.gz	5368915751	download job
www.seattlechamber.com-inf-20240408-005244-46qjh-00009.warc.os.cdx.gz	4708947	download
www.thepinknews.com-inf-20240408-161708-3qz78-00014.warc.gz	5368709766	download job
www.thepinknews.com-inf-20240408-161708-3qz78-00014.warc.os.cdx.gz	2209264	download
www.trb.org-inf-20240409-043140-1ve4l-00004.warc.gz	5435215834	download job
www.trb.org-inf-20240409-043140-1ve4l-00004.warc.os.cdx.gz	719493	download
www.whoi.edu-inf-20240407-190918-ctswh-00009.warc.gz	5415218269	download job
www.whoi.edu-inf-20240407-190918-ctswh-00009.warc.os.cdx.gz	12842	download