Item archiveteam_archivebot_go_20240408221854_69ee386d

Filename	Size
archiveteam_archivebot_go_20240408221854_69ee386d.cdx.gz	24071759	download
archiveteam_archivebot_go_20240408221854_69ee386d.cdx.idx	24693	download
archiveteam_archivebot_go_20240408221854_69ee386d_files.xml	0	download
archiveteam_archivebot_go_20240408221854_69ee386d_meta.sqlite	36864	download
archiveteam_archivebot_go_20240408221854_69ee386d_meta.xml	881	download
development.truthout.org-inf-20240408-171110-46zej-00001.warc.gz	5370556434	download job
development.truthout.org-inf-20240408-171110-46zej-00001.warc.os.cdx.gz	1144510	download
europepmc.org-inf-20240212-215511-8x1ov-01625.warc.gz	5374460456	download job
europepmc.org-inf-20240212-215511-8x1ov-01625.warc.os.cdx.gz	81501	download
fivethirtyeight.com-inf-20240408-172625-aggl8-00009.warc.gz	5455333283	download job
fivethirtyeight.com-inf-20240408-172625-aggl8-00009.warc.os.cdx.gz	486553	download
jacebeleren.tumblr.com-inf-20240407-183358-9fp1s-00066.warc.gz	5368989084	download job
jacebeleren.tumblr.com-inf-20240407-183358-9fp1s-00066.warc.os.cdx.gz	7186881	download
osdn.net-inf-20240122-051507-7ys7c-00021.warc.gz	6000236263	download job
osdn.net-inf-20240122-051507-7ys7c-00021.warc.os.cdx.gz	8833670	download
portal-pautas.ine.mx-inf-20240401-130435-8fydn-00081.warc.gz	5403453085	download job
portal-pautas.ine.mx-inf-20240401-130435-8fydn-00081.warc.os.cdx.gz	22178	download
scholarworks.umass.edu-inf-20240406-153438-bc7j1-00048.warc.gz	5376439661	download job
scholarworks.umass.edu-inf-20240406-153438-bc7j1-00048.warc.os.cdx.gz	156896	download
staging.truthout.org-inf-20240408-170925-2tvgv-00000.warc.gz	5369958044	download job
staging.truthout.org-inf-20240408-170925-2tvgv-00000.warc.os.cdx.gz	3686972	download
storage.googleapis.com-inf-20240301-202801-5jgg7-03731.warc.gz	6075436336	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-03731.warc.os.cdx.gz	659	download
storage.googleapis.com-inf-20240301-202801-5jgg7-03732.warc.gz	5900585418	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-03732.warc.os.cdx.gz	611	download
thepostmillennial.com-inf-20240325-204021-4ss18-00508.warc.gz	5369499116	download job
thepostmillennial.com-inf-20240325-204021-4ss18-00508.warc.os.cdx.gz	323598	download
transfer.archivete.am-shallow-20240408-215300-1y61m-00000.warc.gz	13679	download job
transfer.archivete.am-shallow-20240408-215300-1y61m-00000.warc.os.cdx.gz	268	download
transfer.archivete.am-shallow-20240408-215300-1y61m-meta.warc.gz	3546	download job
transfer.archivete.am-shallow-20240408-215300-1y61m-meta.warc.os.cdx.gz	47	download
transfer.archivete.am-shallow-20240408-215300-1y61m.json	327	download job
truthout.org-inf-20240408-165731-16a89-00002.warc.gz	5451146679	download job
truthout.org-inf-20240408-165731-16a89-00002.warc.os.cdx.gz	346027	download
truthout.org-inf-20240408-165731-16a89-00003.warc.gz	5431356694	download job
truthout.org-inf-20240408-165731-16a89-00003.warc.os.cdx.gz	9944	download
urls-storage.scenariopla.net-re-publica.com-inf-20240114-074821-chhic-wordpress+drupal+google+wix.txt-shallow-20240408-193820-2w20p-00001.warc.gz	5369013302	download
urls-storage.scenariopla.net-re-publica.com-inf-20240114-074821-chhic-wordpress+drupal+google+wix.txt-shallow-20240408-193820-2w20p-00001.warc.os.cdx.gz	818601	download
urls-storage.scenariopla.net-www.stevanpaul.de-inf-20240113-125902-7uvpl-wordpress+drupal+google+wix.txt-shallow-20240408-194102-80nh0-00001.warc.gz	5370099392	download
urls-storage.scenariopla.net-www.stevanpaul.de-inf-20240113-125902-7uvpl-wordpress+drupal+google+wix.txt-shallow-20240408-194102-80nh0-00001.warc.os.cdx.gz	621038	download
www.flickr.com-inf-20240408-152737-6i2sn-00014.warc.gz	5368921872	download job
www.flickr.com-inf-20240408-152737-6i2sn-00014.warc.os.cdx.gz	599935	download
www.flickr.com-inf-20240408-152737-6i2sn-00015.warc.gz	5376444791	download job
www.flickr.com-inf-20240408-152737-6i2sn-00015.warc.os.cdx.gz	369804	download
www.ictp.tv-inf-20240229-174550-7nypw-00378.warc.gz	5596458296	download job
www.ictp.tv-inf-20240229-174550-7nypw-00378.warc.os.cdx.gz	2135	download
www.ni.com-inf-20240319-183623-320jn-00057.warc.gz	7703044624	download job
www.ni.com-inf-20240319-183623-320jn-00057.warc.os.cdx.gz	14895	download
www.polskieradio.pl-inf-20231221-075717-djrf2-01228.warc.gz	5451048492	download job
www.polskieradio.pl-inf-20231221-075717-djrf2-01228.warc.os.cdx.gz	25562	download