Item archiveteam_archivebot_go_20200206010002

Filename	Size
archiveteam_archivebot_go_20200206010002.cdx.gz	40204131	download
archiveteam_archivebot_go_20200206010002.cdx.idx	40968	download
archiveteam_archivebot_go_20200206010002_files.xml	0	download
archiveteam_archivebot_go_20200206010002_meta.sqlite	150528	download
archiveteam_archivebot_go_20200206010002_meta.xml	1016	download
magamedia.org-inf-20200205-212208-4rk7a-00001.warc.gz	5393590218	download job
magamedia.org-inf-20200205-212208-4rk7a-00001.warc.os.cdx.gz	11321	download
magamedia.org-inf-20200205-212208-4rk7a-00002.warc.gz	5431099947	download job
magamedia.org-inf-20200205-212208-4rk7a-00002.warc.os.cdx.gz	1687751	download
magamedia.org-inf-20200205-212208-4rk7a-00003.warc.gz	5372856158	download job
magamedia.org-inf-20200205-212208-4rk7a-00003.warc.os.cdx.gz	564562	download
magamedia.org-inf-20200205-212208-4rk7a-00004.warc.gz	5563086590	download job
magamedia.org-inf-20200205-212208-4rk7a-00004.warc.os.cdx.gz	1308752	download
medium.com-inf-20200206-002200-dg5sa-00000.warc.gz	99007858	download job
medium.com-inf-20200206-002200-dg5sa-00000.warc.os.cdx.gz	152901	download
medium.com-inf-20200206-002200-dg5sa-meta.warc.gz	86392	download job
medium.com-inf-20200206-002200-dg5sa-meta.warc.os.cdx.gz	47	download
old.reddit.com-inf-20200205-181015-8k9oc-00002.warc.gz	1106994127	download job
old.reddit.com-inf-20200205-181015-8k9oc-00002.warc.os.cdx.gz	1037314	download
old.reddit.com-inf-20200205-181015-8k9oc-meta.warc.gz	6474225	download job
old.reddit.com-inf-20200205-181015-8k9oc-meta.warc.os.cdx.gz	47	download
old.reddit.com-inf-20200205-181015-8k9oc.json	254	download job
old.reddit.com-inf-20200205-184011-3g7ue-00005.warc.gz	5373893919	download job
old.reddit.com-inf-20200205-184011-3g7ue-00005.warc.os.cdx.gz	1687864	download
old.reddit.com-inf-20200205-184011-3g7ue-meta.warc.gz	5145008	download job
old.reddit.com-inf-20200205-184011-3g7ue-meta.warc.os.cdx.gz	47	download
old.reddit.com-inf-20200205-204619-a3zha-00000.warc.gz	5379009396	download job
old.reddit.com-inf-20200205-204619-a3zha-00000.warc.os.cdx.gz	3886395	download
old.reddit.com-inf-20200205-204631-7px4r-00000.warc.gz	2672383490	download job
old.reddit.com-inf-20200205-204631-7px4r-00000.warc.os.cdx.gz	2822274	download
old.reddit.com-inf-20200205-204631-7px4r.json	255	download job
podcasts.apple.com-shallow-20200205-205319-b1qmd-00000.warc.gz	3826123855	download job
podcasts.apple.com-shallow-20200205-205319-b1qmd-00000.warc.os.cdx.gz	59689	download
podcasts.apple.com-shallow-20200205-205319-b1qmd.json	291	download job
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00006.warc.gz	5371056470	download job
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00006.warc.os.cdx.gz	25978	download
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00007.warc.gz	5400081442	download job
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00007.warc.os.cdx.gz	28209	download
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00008.warc.gz	5376336026	download job
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00008.warc.os.cdx.gz	41754	download
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00009.warc.gz	5409318182	download job
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00009.warc.os.cdx.gz	20555	download
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00010.warc.gz	5385383689	download job
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00010.warc.os.cdx.gz	18180	download
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00011.warc.gz	5381355768	download job
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00011.warc.os.cdx.gz	19831	download
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00012.warc.gz	5422274294	download job
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00012.warc.os.cdx.gz	26402	download
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00013.warc.gz	2001643898	download job
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-00013.warc.os.cdx.gz	56158	download
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-meta.warc.gz	475683	download job
rebelnews.fireside.fm-inf-20200205-205255-3z3oq-meta.warc.os.cdx.gz	47	download
rebelnews.fireside.fm-inf-20200205-205255-3z3oq.json	251	download job
results.thecaucuses.org-shallow-20200205-225349-jcso2-meta.warc.gz	4077	download job
results.thecaucuses.org-shallow-20200205-225349-jcso2-meta.warc.os.cdx.gz	47	download
spotlight.nudge.ai-inf-20200123-185237-d8fjm-00053.warc.gz	5376995349	download job
spotlight.nudge.ai-inf-20200123-185237-d8fjm-00053.warc.os.cdx.gz	2580213	download
urls-transfer.notkiska.pw-facebook-@Aiena-Association-of-Indian-Entomologists-in-North-America-170198409665225-shallow-20200205-222420-dzwgj-urls.txt	1764	download
urls-transfer.notkiska.pw-facebook-@WeAreAPW-shallow-20200205-213428-8g4j5-00000.warc.gz	577415380	download job
urls-transfer.notkiska.pw-facebook-@WeAreAPW-shallow-20200205-213428-8g4j5-00000.warc.os.cdx.gz	751046	download
urls-transfer.notkiska.pw-facebook-@WeAreAPW-shallow-20200205-213428-8g4j5-meta.warc.gz	483387	download job
urls-transfer.notkiska.pw-facebook-@WeAreAPW-shallow-20200205-213428-8g4j5-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-facebook-@WeAreAPW-shallow-20200205-213428-8g4j5-urls.txt	60404	download
urls-transfer.notkiska.pw-facebook-@WeAreAPW-shallow-20200205-213428-8g4j5.json	330	download job
urls-transfer.notkiska.pw-facebook-@jointherebel-shallow-20200205-203906-9xyfy-00000.warc.gz	975091670	download job
urls-transfer.notkiska.pw-facebook-@jointherebel-shallow-20200205-203906-9xyfy-00000.warc.os.cdx.gz	1088789	download
urls-transfer.notkiska.pw-facebook-@jointherebel-shallow-20200205-203906-9xyfy-meta.warc.gz	692131	download job
urls-transfer.notkiska.pw-facebook-@jointherebel-shallow-20200205-203906-9xyfy-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-fs.net-film.ru-video-redirect-links-10-thru-104689-shallow-20200120-185005-6nodk-00177.warc.gz	5384027183	download job
urls-transfer.notkiska.pw-fs.net-film.ru-video-redirect-links-10-thru-104689-shallow-20200120-185005-6nodk-00177.warc.os.cdx.gz	22346	download
urls-transfer.notkiska.pw-fs.net-film.ru-video-redirect-links-10-thru-104689-shallow-20200120-185005-6nodk-00178.warc.gz	5385514750	download job
urls-transfer.notkiska.pw-fs.net-film.ru-video-redirect-links-10-thru-104689-shallow-20200120-185005-6nodk-00178.warc.os.cdx.gz	10749	download
urls-transfer.notkiska.pw-fs.net-film.ru-video-redirect-links-10-thru-104689-shallow-20200120-185005-6nodk-00179.warc.gz	5384441241	download job
urls-transfer.notkiska.pw-fs.net-film.ru-video-redirect-links-10-thru-104689-shallow-20200120-185005-6nodk-00179.warc.os.cdx.gz	15945	download
urls-transfer.notkiska.pw-house.gov-representatives-websites-inf-20200110-171507-ajhnt-00166.warc.gz	5588335792	download job
urls-transfer.notkiska.pw-house.gov-representatives-websites-inf-20200110-171507-ajhnt-00166.warc.os.cdx.gz	907577	download
urls-transfer.notkiska.pw-twitter-%23HongKong-shallow-20191011-144913-dze3i-00079.warc.gz	5377983786	download job
urls-transfer.notkiska.pw-twitter-%23HongKong-shallow-20191011-144913-dze3i-00079.warc.os.cdx.gz	22862	download
urls-transfer.notkiska.pw-twitter-@MagaMedia_LLC-shallow-20200205-212601-cavy5-urls.txt	217285	download
urls-transfer.notkiska.pw-twitter-@MagaMedia_LLC-shallow-20200205-212601-cavy5.json	338	download job
urls-transfer.notkiska.pw-twitter-@NYCPBA-shallow-20200205-224353-c0puc-00000.warc.gz	613343969	download job
urls-transfer.notkiska.pw-twitter-@NYCPBA-shallow-20200205-224353-c0puc-00000.warc.os.cdx.gz	1144351	download
urls-transfer.notkiska.pw-twitter-@NYCPBA-shallow-20200205-224353-c0puc-meta.warc.gz	686979	download job
urls-transfer.notkiska.pw-twitter-@NYCPBA-shallow-20200205-224353-c0puc-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-@NYCPBA-shallow-20200205-224353-c0puc-urls.txt	132066	download
urls-transfer.notkiska.pw-twitter-@NYCPBA-shallow-20200205-224353-c0puc.json	324	download job
vice-sundry-assets-cdn.vice.com-shallow-20200205-225827-2qyu5.json	306	download job
www.aeaq.ca-inf-20200206-003708-78v8j-meta.warc.gz	204069	download job
www.aeaq.ca-inf-20200206-003708-78v8j-meta.warc.os.cdx.gz	47	download
www.aeaq.ca-inf-20200206-003708-78v8j.json	240	download job
www.arge-helep.de-inf-20200205-231025-enyxx-00000.warc.gz	300922040	download job
www.arge-helep.de-inf-20200205-231025-enyxx-00000.warc.os.cdx.gz	278550	download
www.arge-helep.de-inf-20200205-231025-enyxx-meta.warc.gz	167762	download job
www.arge-helep.de-inf-20200205-231025-enyxx-meta.warc.os.cdx.gz	47	download
www.arge-helep.de-inf-20200205-231025-enyxx.json	246	download job
www.bjnews.com.cn-inf-20200131-153934-dfgnl-00035.warc.gz	5369663299	download job
www.bjnews.com.cn-inf-20200131-153934-dfgnl-00035.warc.os.cdx.gz	361294	download
www.blackentomologists.org-inf-20200205-222101-c74p4-00000.warc.gz	507598644	download job
www.blackentomologists.org-inf-20200205-222101-c74p4-00000.warc.os.cdx.gz	525661	download
www.blackentomologists.org-inf-20200205-222101-c74p4.json	255	download job
www.butterflysocietyofva.org-inf-20200205-220959-f2zbf-meta.warc.gz	86021	download job
www.butterflysocietyofva.org-inf-20200205-220959-f2zbf-meta.warc.os.cdx.gz	47	download
www.butterflysocietyofva.org-inf-20200205-220959-f2zbf.json	258	download job
www.entomologie.org-inf-20200206-004132-bdhso-00000.warc.gz	311816476	download job
www.entomologie.org-inf-20200206-004132-bdhso-00000.warc.os.cdx.gz	207972	download
www.kavala2013.entsoc.gr-inf-20200205-232520-7go4k-00000.warc.gz	10901	download job
www.kavala2013.entsoc.gr-inf-20200205-232520-7go4k-00000.warc.os.cdx.gz	331	download
www.kavala2013.entsoc.gr-inf-20200205-232520-7go4k-meta.warc.gz	3603	download job
www.kavala2013.entsoc.gr-inf-20200205-232520-7go4k-meta.warc.os.cdx.gz	47	download
www.kavala2013.entsoc.gr-inf-20200205-232520-7go4k.json	253	download job
www.repubblica.it-inf-20191204-092043-6wowf-00212.warc.gz	5368714482	download job
www.repubblica.it-inf-20191204-092043-6wowf-00212.warc.os.cdx.gz	1381955	download
www.spin.com-inf-20200126-235314-465ro-00164.warc.gz	5554512447	download job
www.spin.com-inf-20200126-235314-465ro-00164.warc.os.cdx.gz	4330375	download
www.studiodaily.com-inf-20200126-092845-djwqb-00053.warc.gz	5370818994	download job
www.studiodaily.com-inf-20200126-092845-djwqb-00053.warc.os.cdx.gz	1321813	download
www.supervinx.com-inf-20200205-174327-5o39d-00002.warc.gz	3749595348	download job
www.supervinx.com-inf-20200205-174327-5o39d-00002.warc.os.cdx.gz	215278	download
www.supervinx.com-inf-20200205-174327-5o39d-meta.warc.gz	755843	download job
www.supervinx.com-inf-20200205-174327-5o39d-meta.warc.os.cdx.gz	47	download
www.theculture.org-inf-20200205-173142-e5cuh-00000.warc.gz	2929679715	download job
www.theculture.org-inf-20200205-173142-e5cuh-00000.warc.os.cdx.gz	2016010	download
www.theculture.org-inf-20200205-173142-e5cuh.json	242	download job
www.trailrunproject.com-inf-20200202-185028-dfxyw-00013.warc.gz	5369705222	download job
www.trailrunproject.com-inf-20200202-185028-dfxyw-00013.warc.os.cdx.gz	3769095	download
www.tvhistory.tv-inf-20200205-181744-dvmt0-00000.warc.gz	1340197815	download job
www.tvhistory.tv-inf-20200205-181744-dvmt0-00000.warc.os.cdx.gz	1682888	download
www.tvhistory.tv-inf-20200205-181744-dvmt0-meta.warc.gz	1112602	download job
www.tvhistory.tv-inf-20200205-181744-dvmt0-meta.warc.os.cdx.gz	47	download
www.tvhistory.tv-inf-20200205-181744-dvmt0.json	240	download job
www.twainquotes.com-inf-20200205-181616-bx8t8-00000.warc.gz	573064951	download job
www.twainquotes.com-inf-20200205-181616-bx8t8-00000.warc.os.cdx.gz	1187206	download
www.twainquotes.com-inf-20200205-181616-bx8t8-meta.warc.gz	807136	download job
www.twainquotes.com-inf-20200205-181616-bx8t8-meta.warc.os.cdx.gz	47	download
www.twainquotes.com-inf-20200205-181616-bx8t8.json	243	download job
www.usshelena.org-inf-20200205-161105-1wgo9-00000.warc.gz	3358095186	download job
www.usshelena.org-inf-20200205-161105-1wgo9-00000.warc.os.cdx.gz	2219633	download
www.usshelena.org-inf-20200205-161105-1wgo9-meta.warc.gz	1320512	download job
www.usshelena.org-inf-20200205-161105-1wgo9-meta.warc.os.cdx.gz	47	download
www.usshelena.org-inf-20200205-161105-1wgo9.json	241	download job
www.whoosh.org-inf-20200205-063016-fa9l9-00000.warc.gz	3768591299	download job
www.whoosh.org-inf-20200205-063016-fa9l9-00000.warc.os.cdx.gz	3849970	download
www.whoosh.org-inf-20200205-063016-fa9l9-meta.warc.gz	2560904	download job
www.whoosh.org-inf-20200205-063016-fa9l9-meta.warc.os.cdx.gz	47	download
www.whoosh.org-inf-20200205-063016-fa9l9.json	238	download job
www.windweaver.com-inf-20200205-062652-22011-meta.warc.gz	2646311	download job
www.windweaver.com-inf-20200205-062652-22011-meta.warc.os.cdx.gz	47	download
www.windweaver.com-inf-20200205-062652-22011.json	242	download job