Item archiveteam_archivebot_go_20240408231632_5601517e

Filename	Size
2021jlid.de-inf-20240408-114545-2vwns-00006.warc.gz	5375538723	download job
2021jlid.de-inf-20240408-114545-2vwns-00006.warc.os.cdx.gz	2126074	download
archiveteam_archivebot_go_20240408231632_5601517e.cdx.gz	2071172	download
archiveteam_archivebot_go_20240408231632_5601517e.cdx.idx	2133	download
archiveteam_archivebot_go_20240408231632_5601517e_files.xml	0	download
archiveteam_archivebot_go_20240408231632_5601517e_meta.sqlite	32768	download
archiveteam_archivebot_go_20240408231632_5601517e_meta.xml	1046	download
development.truthout.org-inf-20240408-171110-46zej-00004.warc.gz	5383550374	download job
development.truthout.org-inf-20240408-171110-46zej-00004.warc.os.cdx.gz	182219	download
ffmpeg.org-inf-20240405-045344-9iix9-00046.warc.gz	5894382434	download job
ffmpeg.org-inf-20240405-045344-9iix9-00046.warc.os.cdx.gz	247802	download
fivethirtyeight.com-inf-20240408-172625-aggl8-00011.warc.gz	5495304396	download job
fivethirtyeight.com-inf-20240408-172625-aggl8-00011.warc.os.cdx.gz	578917	download
jacebeleren.tumblr.com-inf-20240407-183358-9fp1s-00067.warc.gz	5370758792	download job
jacebeleren.tumblr.com-inf-20240407-183358-9fp1s-00067.warc.os.cdx.gz	6787741	download
repositoriodocumental.ine.mx-inf-20240329-160658-214oh-00305.warc.gz	5746716587	download job
repositoriodocumental.ine.mx-inf-20240329-160658-214oh-00305.warc.os.cdx.gz	5120	download
scholarworks.umass.edu-inf-20240406-153438-bc7j1-00049.warc.gz	5373925576	download job
scholarworks.umass.edu-inf-20240406-153438-bc7j1-00049.warc.os.cdx.gz	140373	download
storage.googleapis.com-inf-20240301-202801-5jgg7-03736.warc.gz	5491824657	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-03736.warc.os.cdx.gz	603	download
storage.googleapis.com-inf-20240301-202801-5jgg7-03737.warc.gz	6039090248	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-03737.warc.os.cdx.gz	599	download
storage.googleapis.com-inf-20240301-202801-5jgg7-03738.warc.gz	6134840411	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-03738.warc.os.cdx.gz	652	download
thepostmillennial.com-inf-20240325-204021-4ss18-00509.warc.gz	5485428849	download job
thepostmillennial.com-inf-20240325-204021-4ss18-00509.warc.os.cdx.gz	179322	download
timeweb.com-inf-20240203-043853-erq28-00586.warc.gz	5368803456	download job
timeweb.com-inf-20240203-043853-erq28-00586.warc.os.cdx.gz	5086266	download
truthout.org-inf-20240408-165731-16a89-00005.warc.gz	5368843904	download job
truthout.org-inf-20240408-165731-16a89-00005.warc.os.cdx.gz	599040	download
urls-storage.scenariopla.net-re-publica.com-inf-20240114-074821-chhic-wordpress+drupal+google+wix.txt-shallow-20240408-193820-2w20p-00002.warc.gz	5832652798	download
urls-storage.scenariopla.net-re-publica.com-inf-20240114-074821-chhic-wordpress+drupal+google+wix.txt-shallow-20240408-193820-2w20p-00002.warc.os.cdx.gz	332186	download
urls-storage.scenariopla.net-re-publica.com-inf-20240114-074821-chhic-wordpress+drupal+google+wix.txt-shallow-20240408-193820-2w20p-00003.warc.gz	2613	download
urls-storage.scenariopla.net-re-publica.com-inf-20240114-074821-chhic-wordpress+drupal+google+wix.txt-shallow-20240408-193820-2w20p-00003.warc.os.cdx.gz	47	download
urls-storage.scenariopla.net-re-publica.com-inf-20240114-074821-chhic-wordpress+drupal+google+wix.txt-shallow-20240408-193820-2w20p-meta.warc.gz	1277559	download
urls-storage.scenariopla.net-re-publica.com-inf-20240114-074821-chhic-wordpress+drupal+google+wix.txt-shallow-20240408-193820-2w20p-meta.warc.os.cdx.gz	47	download
urls-storage.scenariopla.net-re-publica.com-inf-20240114-074821-chhic-wordpress+drupal+google+wix.txt-shallow-20240408-193820-2w20p-urls.txt	3556564	download
urls-storage.scenariopla.net-re-publica.com-inf-20240114-074821-chhic-wordpress+drupal+google+wix.txt-shallow-20240408-193820-2w20p.json	429	download
urls-transfer.archivete.am-2024-04-08_www.flickr.com-inf-20231127-001347-axxyp-meta_photo-urls-shallow-20240408-142737-6lvqq-00001.warc.gz	1818170584	download job
urls-transfer.archivete.am-2024-04-08_www.flickr.com-inf-20231127-001347-axxyp-meta_photo-urls-shallow-20240408-142737-6lvqq-00001.warc.os.cdx.gz	570417	download
urls-transfer.archivete.am-2024-04-08_www.flickr.com-inf-20231127-001347-axxyp-meta_photo-urls-shallow-20240408-142737-6lvqq-meta.warc.gz	12467483	download job
urls-transfer.archivete.am-2024-04-08_www.flickr.com-inf-20231127-001347-axxyp-meta_photo-urls-shallow-20240408-142737-6lvqq-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-2024-04-08_www.flickr.com-inf-20231127-001347-axxyp-meta_photo-urls-shallow-20240408-142737-6lvqq-urls.txt	2254927	download
urls-transfer.archivete.am-2024-04-08_www.flickr.com-inf-20231127-001347-axxyp-meta_photo-urls-shallow-20240408-142737-6lvqq.json	427	download job
vdare.com-inf-20240326-142830-2lyxh-00092.warc.gz	5372620881	download job
vdare.com-inf-20240326-142830-2lyxh-00092.warc.os.cdx.gz	516738	download
www.flickr.com-inf-20240408-152737-6i2sn-00017.warc.gz	5371851590	download job
www.flickr.com-inf-20240408-152737-6i2sn-00017.warc.os.cdx.gz	376701	download
www.flickr.com-inf-20240408-152737-6i2sn-00018.warc.gz	5372624102	download job
www.flickr.com-inf-20240408-152737-6i2sn-00018.warc.os.cdx.gz	475804	download
www.fredmiranda.com-inf-20240209-021150-e7ewv-00638.warc.gz	5369717385	download job
www.fredmiranda.com-inf-20240209-021150-e7ewv-00638.warc.os.cdx.gz	2101979	download
www.lpsg.com-inf-20240124-045020-97ypj-00214.warc.gz	5370703413	download job
www.lpsg.com-inf-20240124-045020-97ypj-00214.warc.os.cdx.gz	2481256	download
www.polskieradio.pl-inf-20231221-075717-djrf2-01229.warc.gz	5448502261	download job
www.polskieradio.pl-inf-20231221-075717-djrf2-01229.warc.os.cdx.gz	25802	download