Item archiveteam_archivebot_go_20240410171948_d383e1f7

Filename	Size
archiveteam_archivebot_go_20240410171948_d383e1f7.cdx.gz	19868004	download
archiveteam_archivebot_go_20240410171948_d383e1f7.cdx.idx	21015	download
archiveteam_archivebot_go_20240410171948_d383e1f7_files.xml	0	download
archiveteam_archivebot_go_20240410171948_d383e1f7_meta.sqlite	77824	download
archiveteam_archivebot_go_20240410171948_d383e1f7_meta.xml	881	download
development.truthout.org-inf-20240408-171110-46zej-00063.warc.gz	5399535307	download job
development.truthout.org-inf-20240408-171110-46zej-00063.warc.os.cdx.gz	1323305	download
digitale-pracht.de-inf-20240410-133324-bomdx-00000.warc.gz	5372002046	download job
digitale-pracht.de-inf-20240410-133324-bomdx-00000.warc.os.cdx.gz	2369626	download
digitale-pracht.de-inf-20240410-133324-bomdx-00001.warc.gz	2025454	download job
digitale-pracht.de-inf-20240410-133324-bomdx-00001.warc.os.cdx.gz	21281	download
digitale-pracht.de-inf-20240410-133324-bomdx-meta.warc.gz	1492349	download job
digitale-pracht.de-inf-20240410-133324-bomdx-meta.warc.os.cdx.gz	47	download
digitale-pracht.de-inf-20240410-133324-bomdx.json	246	download job
hod4.sega.jp-inf-20240410-164505-h45cu-00000.warc.gz	89820532	download job
hod4.sega.jp-inf-20240410-164505-h45cu-00000.warc.os.cdx.gz	32386	download
hod4.sega.jp-inf-20240410-164505-h45cu-meta.warc.gz	23552	download job
hod4.sega.jp-inf-20240410-164505-h45cu-meta.warc.os.cdx.gz	47	download
hod4.sega.jp-inf-20240410-164505-h45cu.json	240	download job
infektionsradar.gesund.bund.de-inf-20240410-161702-yzsz0-00000.warc.gz	318443250	download job
infektionsradar.gesund.bund.de-inf-20240410-161702-yzsz0-00000.warc.os.cdx.gz	135775	download
infektionsradar.gesund.bund.de-inf-20240410-161702-yzsz0-meta.warc.gz	88191	download job
infektionsradar.gesund.bund.de-inf-20240410-161702-yzsz0-meta.warc.os.cdx.gz	47	download
infektionsradar.gesund.bund.de-inf-20240410-161702-yzsz0.json	258	download job
jacebeleren.tumblr.com-inf-20240407-183358-9fp1s-00127.warc.gz	5372286798	download job
jacebeleren.tumblr.com-inf-20240407-183358-9fp1s-00127.warc.os.cdx.gz	4358056	download
karriere.mri.bund.de-inf-20240410-162916-8a8v1-00000.warc.gz	118187974	download job
karriere.mri.bund.de-inf-20240410-162916-8a8v1-00000.warc.os.cdx.gz	158498	download
karriere.mri.bund.de-inf-20240410-162916-8a8v1-meta.warc.gz	98626	download job
karriere.mri.bund.de-inf-20240410-162916-8a8v1-meta.warc.os.cdx.gz	47	download
karriere.mri.bund.de-inf-20240410-162916-8a8v1.json	248	download job
kolep.bva.bund.de-inf-20240410-163238-72fbo-00000.warc.gz	867083854	download job
kolep.bva.bund.de-inf-20240410-163238-72fbo-00000.warc.os.cdx.gz	522206	download
kolep.bva.bund.de-inf-20240410-163238-72fbo-meta.warc.gz	388139	download job
kolep.bva.bund.de-inf-20240410-163238-72fbo-meta.warc.os.cdx.gz	47	download
kolep.bva.bund.de-inf-20240410-163238-72fbo.json	245	download job
kunstverwaltung.bund.de-inf-20240410-163432-paasc-00000.warc.gz	388331949	download job
kunstverwaltung.bund.de-inf-20240410-163432-paasc-00000.warc.os.cdx.gz	184722	download
kunstverwaltung.bund.de-inf-20240410-163432-paasc-meta.warc.gz	131576	download job
kunstverwaltung.bund.de-inf-20240410-163432-paasc-meta.warc.os.cdx.gz	47	download
kunstverwaltung.bund.de-inf-20240410-163432-paasc.json	251	download job
laverdi-gs.bkg.bund.de-inf-20240410-171903-1ax71-00000.warc.gz	7123	download job
laverdi-gs.bkg.bund.de-inf-20240410-171903-1ax71-00000.warc.os.cdx.gz	273	download
laverdi-gs.bkg.bund.de-inf-20240410-171903-1ax71-meta.warc.gz	3537	download job
laverdi-gs.bkg.bund.de-inf-20240410-171903-1ax71-meta.warc.os.cdx.gz	47	download
laverdi-gs.bkg.bund.de-inf-20240410-171903-1ax71.json	250	download job
mvdirona.com-inf-20240409-064236-c26dk-00020.warc.gz	5370014360	download job
mvdirona.com-inf-20240409-064236-c26dk-00020.warc.os.cdx.gz	492780	download
scholarworks.umt.edu-inf-20240409-050039-2ekzj-00041.warc.gz	5808366593	download job
scholarworks.umt.edu-inf-20240409-050039-2ekzj-00041.warc.os.cdx.gz	228043	download
scholarworks.uni.edu-inf-20240409-155507-aa0jg-00023.warc.gz	5782558030	download job
scholarworks.uni.edu-inf-20240409-155507-aa0jg-00023.warc.os.cdx.gz	232601	download
scholarworks.uni.edu-inf-20240409-155507-aa0jg-00024.warc.gz	5660625511	download job
scholarworks.uni.edu-inf-20240409-155507-aa0jg-00024.warc.os.cdx.gz	3734	download
staging.truthout.org-inf-20240408-170925-2tvgv-00063.warc.gz	5378251620	download job
staging.truthout.org-inf-20240408-170925-2tvgv-00063.warc.os.cdx.gz	1108484	download
storage.googleapis.com-inf-20240301-202801-5jgg7-03999.warc.gz	5385009957	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-03999.warc.os.cdx.gz	719	download
storage.googleapis.com-inf-20240301-202801-5jgg7-04000.warc.gz	5464431302	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-04000.warc.os.cdx.gz	721	download
storage.googleapis.com-inf-20240301-202801-5jgg7-04001.warc.gz	5523741217	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-04001.warc.os.cdx.gz	772	download
urls-transfer.archivete.am-2024-04-10_IEEPCO-flickr-accidentally-ignored-photos-shallow-20240410-165837-6f4sk-aborted-00000.warc.gz	11485713	download job
urls-transfer.archivete.am-2024-04-10_IEEPCO-flickr-accidentally-ignored-photos-shallow-20240410-165837-6f4sk-aborted-00000.warc.os.cdx.gz	916	download
urls-transfer.archivete.am-2024-04-10_IEEPCO-flickr-accidentally-ignored-photos-shallow-20240410-165837-6f4sk-aborted-wpull.log.gz	1190	download
urls-transfer.archivete.am-2024-04-10_IEEPCO-flickr-accidentally-ignored-photos-shallow-20240410-165837-6f4sk-aborted.json	396	download job
urls-transfer.archivete.am-2024-04-10_IEEPCO-flickr-accidentally-ignored-photos-shallow-20240410-165837-6f4sk-urls.txt	67506	download
urls-transfer.archivete.am-2024-04-10_IEEPCO-flickr-accidentally-ignored-photos-shallow-20240410-165902-6f4sk-00000.warc.gz	888805668	download job
urls-transfer.archivete.am-2024-04-10_IEEPCO-flickr-accidentally-ignored-photos-shallow-20240410-165902-6f4sk-00000.warc.os.cdx.gz	54344	download
urls-transfer.archivete.am-2024-04-10_IEEPCO-flickr-accidentally-ignored-photos-shallow-20240410-165902-6f4sk-meta.warc.gz	25241	download job
urls-transfer.archivete.am-2024-04-10_IEEPCO-flickr-accidentally-ignored-photos-shallow-20240410-165902-6f4sk-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-2024-04-10_IEEPCO-flickr-accidentally-ignored-photos-shallow-20240410-165902-6f4sk-urls.txt	67506	download
urls-transfer.archivete.am-2024-04-10_IEEPCO-flickr-accidentally-ignored-photos-shallow-20240410-165902-6f4sk.json	397	download job
wellcomecollection.org-inf-20231009-135258-6qeuc-02228.warc.gz	5368848783	download job
wellcomecollection.org-inf-20231009-135258-6qeuc-02228.warc.os.cdx.gz	2502292	download
www.bay12forums.com-inf-20240404-074352-d56pl-00049.warc.gz	5371292677	download job
www.bay12forums.com-inf-20240404-074352-d56pl-00049.warc.os.cdx.gz	1269985	download
www.ine.mx-inf-20240409-170158-5g0ex-00048.warc.gz	5539348796	download job
www.ine.mx-inf-20240409-170158-5g0ex-00048.warc.os.cdx.gz	3554	download
www.ine.mx-inf-20240409-170158-5g0ex-00049.warc.gz	6151685069	download job
www.ine.mx-inf-20240409-170158-5g0ex-00049.warc.os.cdx.gz	5554	download
www.niskanencenter.org-inf-20240410-000214-v8kju-00010.warc.gz	5477170856	download job
www.niskanencenter.org-inf-20240410-000214-v8kju-00010.warc.os.cdx.gz	496487	download
www.niskanencenter.org-inf-20240410-000214-v8kju-00011.warc.gz	5377766639	download job
www.niskanencenter.org-inf-20240410-000214-v8kju-00011.warc.os.cdx.gz	40586	download
www.polskieradio.pl-inf-20231221-075717-djrf2-01285.warc.gz	5549644652	download job
www.polskieradio.pl-inf-20231221-075717-djrf2-01285.warc.os.cdx.gz	64210	download
www.stepbystep.com-inf-20240402-192710-1rkf0-00029.warc.gz	5368766834	download job
www.stepbystep.com-inf-20240402-192710-1rkf0-00029.warc.os.cdx.gz	1595206	download
www.upload.ee-inf-20240406-070853-aew25-00025.warc.gz	5368723193	download job
www.upload.ee-inf-20240406-070853-aew25-00025.warc.os.cdx.gz	3233710	download