Item archiveteam_archivebot_go_20240408172743_cfe51453

Filename	Size
2021jlid.de-inf-20240408-114545-2vwns-00003.warc.gz	5369206631	download job
2021jlid.de-inf-20240408-114545-2vwns-00003.warc.os.cdx.gz	1599493	download
archive.transmediale.de-inf-20240407-195538-bdn15-00019.warc.gz	5513884887	download job
archive.transmediale.de-inf-20240407-195538-bdn15-00019.warc.os.cdx.gz	524261	download
archiveteam_archivebot_go_20240408172743_cfe51453.cdx.gz	1568742	download
archiveteam_archivebot_go_20240408172743_cfe51453.cdx.idx	1666	download
archiveteam_archivebot_go_20240408172743_cfe51453_files.xml	0	download
archiveteam_archivebot_go_20240408172743_cfe51453_meta.sqlite	53248	download
archiveteam_archivebot_go_20240408172743_cfe51453_meta.xml	1046	download
crm.truthout.org-inf-20240408-170034-7dx4u-00000.warc.gz	25727610	download job
crm.truthout.org-inf-20240408-170034-7dx4u-00000.warc.os.cdx.gz	52530	download
crm.truthout.org-inf-20240408-170034-7dx4u-meta.warc.gz	36563	download job
crm.truthout.org-inf-20240408-170034-7dx4u-meta.warc.os.cdx.gz	47	download
crm.truthout.org-inf-20240408-170034-7dx4u.json	244	download job
demo.truthout.org-inf-20240408-170436-11wjp-00000.warc.gz	8105042	download job
demo.truthout.org-inf-20240408-170436-11wjp-00000.warc.os.cdx.gz	20696	download
demo.truthout.org-inf-20240408-170436-11wjp-meta.warc.gz	15042	download job
demo.truthout.org-inf-20240408-170436-11wjp-meta.warc.os.cdx.gz	47	download
demo.truthout.org-inf-20240408-170436-11wjp.json	245	download job
europepmc.org-inf-20240212-215511-8x1ov-01618.warc.gz	5397392026	download job
europepmc.org-inf-20240212-215511-8x1ov-01618.warc.os.cdx.gz	105712	download
fivethirtyeight.com-shallow-20240408-172308-aggl8-aborted-00000.warc.gz	11363723	download job
fivethirtyeight.com-shallow-20240408-172308-aggl8-aborted-00000.warc.os.cdx.gz	37779	download
fivethirtyeight.com-shallow-20240408-172308-aggl8-aborted-wpull.log.gz	24496	download
fivethirtyeight.com-shallow-20240408-172308-aggl8-aborted.json	250	download job
fru.truthout.org-shallow-20240408-170836-eu2gp-00000.warc.gz	18474957	download job
fru.truthout.org-shallow-20240408-170836-eu2gp-00000.warc.os.cdx.gz	17179	download
fru.truthout.org-shallow-20240408-170836-eu2gp-meta.warc.gz	12854	download job
fru.truthout.org-shallow-20240408-170836-eu2gp-meta.warc.os.cdx.gz	47	download
fru.truthout.org-shallow-20240408-170836-eu2gp.json	248	download job
jacebeleren.tumblr.com-inf-20240407-183358-9fp1s-00054.warc.gz	5368994087	download job
jacebeleren.tumblr.com-inf-20240407-183358-9fp1s-00054.warc.os.cdx.gz	2461056	download
plugins.truthout.org-inf-20240408-170851-bmpx9-00000.warc.gz	13291	download job
plugins.truthout.org-inf-20240408-170851-bmpx9-00000.warc.os.cdx.gz	401	download
plugins.truthout.org-inf-20240408-170851-bmpx9-meta.warc.gz	3638	download job
plugins.truthout.org-inf-20240408-170851-bmpx9-meta.warc.os.cdx.gz	47	download
plugins.truthout.org-inf-20240408-170851-bmpx9.json	248	download job
portal-pautas.ine.mx-inf-20240401-130435-8fydn-00079.warc.gz	5370706596	download job
portal-pautas.ine.mx-inf-20240401-130435-8fydn-00079.warc.os.cdx.gz	18524	download
storage.googleapis.com-inf-20240301-202801-5jgg7-03704.warc.gz	5656406443	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-03704.warc.os.cdx.gz	610	download
storage.googleapis.com-inf-20240301-202801-5jgg7-03705.warc.gz	5427607258	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-03705.warc.os.cdx.gz	604	download
storage.googleapis.com-inf-20240301-202801-5jgg7-03706.warc.gz	5852002377	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-03706.warc.os.cdx.gz	613	download
subdomainfinder.c99.nl-shallow-20240408-165808-e3gra-00000.warc.gz	3984067	download job
subdomainfinder.c99.nl-shallow-20240408-165808-e3gra-00000.warc.os.cdx.gz	27062	download
subdomainfinder.c99.nl-shallow-20240408-165808-e3gra.json	283	download job
subdomainfinder.c99.nl-shallow-20240408-171900-7xxzc-00000.warc.gz	3974986	download job
subdomainfinder.c99.nl-shallow-20240408-171900-7xxzc-00000.warc.os.cdx.gz	27049	download
subdomainfinder.c99.nl-shallow-20240408-171900-7xxzc-meta.warc.gz	14436	download job
subdomainfinder.c99.nl-shallow-20240408-171900-7xxzc-meta.warc.os.cdx.gz	47	download
subdomainfinder.c99.nl-shallow-20240408-171900-7xxzc.json	279	download job
support.truthout.org-inf-20240408-171941-7rdhd-meta.warc.gz	16944	download job
support.truthout.org-inf-20240408-171941-7rdhd-meta.warc.os.cdx.gz	47	download
to5prod.truthout.org-inf-20240408-171950-dj7hf-00000.warc.gz	13233	download job
to5prod.truthout.org-inf-20240408-171950-dj7hf-00000.warc.os.cdx.gz	406	download
to5prod.truthout.org-inf-20240408-171950-dj7hf-meta.warc.gz	3636	download job
to5prod.truthout.org-inf-20240408-171950-dj7hf-meta.warc.os.cdx.gz	47	download
to5prod.truthout.org-inf-20240408-171950-dj7hf.json	248	download job
urls-transfer.archivete.am-2024-04-08_www.flickr.com-inf-20231127-054743-9ftak-meta_photo-urls-shallow-20240408-163819-amvgl-00000.warc.gz	656102858	download job
urls-transfer.archivete.am-2024-04-08_www.flickr.com-inf-20231127-054743-9ftak-meta_photo-urls-shallow-20240408-163819-amvgl-00000.warc.os.cdx.gz	198921	download
urls-transfer.archivete.am-2024-04-08_www.flickr.com-inf-20231127-054743-9ftak-meta_photo-urls-shallow-20240408-163819-amvgl-meta.warc.gz	1139850	download job
urls-transfer.archivete.am-2024-04-08_www.flickr.com-inf-20231127-054743-9ftak-meta_photo-urls-shallow-20240408-163819-amvgl-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-2024-04-08_www.flickr.com-inf-20231127-054743-9ftak-meta_photo-urls-shallow-20240408-163819-amvgl-urls.txt	221710	download
urls-transfer.archivete.am-2024-04-08_www.flickr.com-inf-20231127-054743-9ftak-meta_photo-urls-shallow-20240408-163819-amvgl.json	427	download job
urls-transfer.archivete.am-www.curseforge.com_mod_download_404s_resume.txt-shallow-20240219-030715-cpamk-03391.warc.gz	5853277029	download job
urls-transfer.archivete.am-www.curseforge.com_mod_download_404s_resume.txt-shallow-20240219-030715-cpamk-03391.warc.os.cdx.gz	1297	download
urls-transfer.archivete.am-www.curseforge.com_mod_download_404s_resume.txt-shallow-20240219-030715-cpamk-03392.warc.gz	5369400743	download job
urls-transfer.archivete.am-www.curseforge.com_mod_download_404s_resume.txt-shallow-20240219-030715-cpamk-03392.warc.os.cdx.gz	4718	download
www.anagramtimes.com-inf-20240408-042736-5dj1u-00027.warc.gz	483602957	download job
www.anagramtimes.com-inf-20240408-042736-5dj1u-00027.warc.os.cdx.gz	100460	download
www.anagramtimes.com-inf-20240408-042736-5dj1u-meta.warc.gz	15932872	download job
www.anagramtimes.com-inf-20240408-042736-5dj1u-meta.warc.os.cdx.gz	47	download
www.anagramtimes.com-inf-20240408-042736-5dj1u.json	245	download job
www.bundesimmobilien.de-inf-20240408-153602-374of-00000.warc.gz	5637727923	download job
www.bundesimmobilien.de-inf-20240408-153602-374of-00000.warc.os.cdx.gz	1534817	download
www.bundesimmobilien.de-inf-20240408-153602-374of-meta.warc.gz	1058720	download job
www.bundesimmobilien.de-inf-20240408-153602-374of-meta.warc.os.cdx.gz	47	download
www.flickr.com-inf-20240408-152737-6i2sn-00002.warc.gz	5373571967	download job
www.flickr.com-inf-20240408-152737-6i2sn-00002.warc.os.cdx.gz	828237	download
www.fredmiranda.com-inf-20240209-021150-e7ewv-00633.warc.gz	5382369290	download job
www.fredmiranda.com-inf-20240209-021150-e7ewv-00633.warc.os.cdx.gz	816775	download
www.ictp.tv-inf-20240229-174550-7nypw-00376.warc.gz	5709046107	download job
www.ictp.tv-inf-20240229-174550-7nypw-00376.warc.os.cdx.gz	3391	download
www.ieepco.org.mx-inf-20240408-152829-nxuo1-00004.warc.gz	5368943795	download job
www.ieepco.org.mx-inf-20240408-152829-nxuo1-00004.warc.os.cdx.gz	378226	download
www.krone.at-inf-20231223-062754-80xk9-00812.warc.gz	5583956226	download job
www.krone.at-inf-20231223-062754-80xk9-00812.warc.os.cdx.gz	1783324	download
www.seattlechamber.com-inf-20240408-005244-46qjh-00005.warc.gz	5503636779	download job
www.seattlechamber.com-inf-20240408-005244-46qjh-00005.warc.os.cdx.gz	3140774	download
www.spacefoundation.org-inf-20240407-233121-dplc4-00009.warc.gz	5369777294	download job
www.spacefoundation.org-inf-20240407-233121-dplc4-00009.warc.os.cdx.gz	913955	download
www.stepbystep.com-inf-20240402-192710-1rkf0-00020.warc.gz	5368709463	download job
www.stepbystep.com-inf-20240402-192710-1rkf0-00020.warc.os.cdx.gz	3885279	download
www.truthout.org-shallow-20240408-165742-bgn5c-00000.warc.gz	18569170	download job
www.truthout.org-shallow-20240408-165742-bgn5c-00000.warc.os.cdx.gz	17152	download
www.truthout.org-shallow-20240408-165742-bgn5c-meta.warc.gz	12903	download job
www.truthout.org-shallow-20240408-165742-bgn5c-meta.warc.os.cdx.gz	47	download
www.truthout.org-shallow-20240408-165742-bgn5c.json	248	download job
www.wivestownhallconnection.com-inf-20240408-045439-7lpx6-00003.warc.gz	5382705410	download job
www.wivestownhallconnection.com-inf-20240408-045439-7lpx6-00003.warc.os.cdx.gz	845814	download