Item archiveteam_archivebot_go_20171104070001

Filename	Size
ads.citypaper.com-inf-20171103-233908-3m0bu-00000.warc.gz	59472753	download job
ads.citypaper.com-inf-20171103-233908-3m0bu-00000.warc.os.cdx.gz	97765	download
ads.citypaper.com-inf-20171103-233908-3m0bu-meta.warc.gz	65609	download job
ads.citypaper.com-inf-20171103-233908-3m0bu-meta.warc.os.cdx.gz	47	download
ads.citypaper.com-inf-20171103-233908-3m0bu.json	241	download job
allsurfmagazines.com-inf-20171103-234609-cgm5s-00000.warc.gz	2674269393	download job
allsurfmagazines.com-inf-20171103-234609-cgm5s-00000.warc.os.cdx.gz	2374920	download
allsurfmagazines.com-inf-20171103-234609-cgm5s-meta.warc.gz	1287242	download job
allsurfmagazines.com-inf-20171103-234609-cgm5s-meta.warc.os.cdx.gz	47	download
allsurfmagazines.com-inf-20171103-234609-cgm5s.json	247	download job
archive.randi.org-shallow-20171104-060502-d2sfv-00000.warc.gz	276265	download job
archive.randi.org-shallow-20171104-060502-d2sfv-00000.warc.os.cdx.gz	1712	download
archive.randi.org-shallow-20171104-060502-d2sfv-meta.warc.gz	4427	download job
archive.randi.org-shallow-20171104-060502-d2sfv-meta.warc.os.cdx.gz	47	download
archive.randi.org-shallow-20171104-060502-d2sfv.json	303	download job
archiveteam_archivebot_go_20171104070001.cdx.gz	97128196	download
archiveteam_archivebot_go_20171104070001.cdx.idx	97251	download
archiveteam_archivebot_go_20171104070001_archive.torrent	1602948	download
archiveteam_archivebot_go_20171104070001_files.xml	0	download
archiveteam_archivebot_go_20171104070001_meta.sqlite	180224	download
archiveteam_archivebot_go_20171104070001_meta.xml	1009	download
arstechnica.com-shallow-20171104-032655-b5cne-00000.warc.gz	1668912	download job
arstechnica.com-shallow-20171104-032655-b5cne-00000.warc.os.cdx.gz	9720	download
arstechnica.com-shallow-20171104-032655-b5cne-meta.warc.gz	9645	download job
arstechnica.com-shallow-20171104-032655-b5cne-meta.warc.os.cdx.gz	47	download
arstechnica.com-shallow-20171104-032655-b5cne.json	311	download job
b.hatena.ne.jp-shallow-20171104-073554-ahf1f.json	306	download job
consumerist.com-inf-20171030-235804-4xyuq-00027.warc.gz	5369229443	download job
consumerist.com-inf-20171030-235804-4xyuq-00027.warc.os.cdx.gz	1211874	download
consumerist.com-inf-20171030-235804-4xyuq-00028.warc.gz	5375547150	download job
consumerist.com-inf-20171030-235804-4xyuq-00028.warc.os.cdx.gz	1670707	download
consumerist.com-inf-20171030-235804-4xyuq-00029.warc.gz	5379994874	download job
consumerist.com-inf-20171030-235804-4xyuq-00029.warc.os.cdx.gz	1036560	download
consumerist.com-inf-20171030-235804-4xyuq-00030.warc.gz	5370577643	download job
consumerist.com-inf-20171030-235804-4xyuq-00030.warc.os.cdx.gz	1388447	download
consumerist.com-inf-20171030-235804-4xyuq-00031.warc.gz	5369837270	download job
consumerist.com-inf-20171030-235804-4xyuq-00031.warc.os.cdx.gz	1080649	download
consumerist.com-inf-20171030-235804-4xyuq-00032.warc.gz	5368824876	download job
consumerist.com-inf-20171030-235804-4xyuq-00032.warc.os.cdx.gz	2184872	download
consumerist.com-inf-20171030-235804-4xyuq-00033.warc.gz	5369497478	download job
consumerist.com-inf-20171030-235804-4xyuq-00033.warc.os.cdx.gz	1428377	download
download.unirc.eu-inf-20171030-225936-5to3m-00010.warc.gz	5371099241	download job
download.unirc.eu-inf-20171030-225936-5to3m-00010.warc.os.cdx.gz	414078	download
download.unirc.eu-inf-20171030-225936-5to3m-00011.warc.gz	5370113009	download job
download.unirc.eu-inf-20171030-225936-5to3m-00011.warc.os.cdx.gz	580832	download
filmschoolrejects.com-shallow-20171103-225919-7eqog-00000.warc.gz	3632001	download job
filmschoolrejects.com-shallow-20171103-225919-7eqog-00000.warc.os.cdx.gz	7232	download
filmschoolrejects.com-shallow-20171103-225919-7eqog-meta.warc.gz	8420	download job
filmschoolrejects.com-shallow-20171103-225919-7eqog-meta.warc.os.cdx.gz	47	download
filmschoolrejects.com-shallow-20171103-225919-7eqog.json	289	download job
mediaarea.net-inf-20171104-023448-9w78y-00000.warc.gz	5370258626	download job
mediaarea.net-inf-20171104-023448-9w78y-00000.warc.os.cdx.gz	1799204	download
mediaarea.net-inf-20171104-023448-9w78y-00001.warc.gz	5370253881	download job
mediaarea.net-inf-20171104-023448-9w78y-00001.warc.os.cdx.gz	109488	download
mediaarea.net-inf-20171104-023448-9w78y-00002.warc.gz	5370044212	download job
mediaarea.net-inf-20171104-023448-9w78y-00002.warc.os.cdx.gz	90646	download
mediaarea.net-inf-20171104-023448-9w78y-00004.warc.gz	5441186920	download job
mediaarea.net-inf-20171104-023448-9w78y-00004.warc.os.cdx.gz	238925	download
money.cnn.com-shallow-20171104-054007-2g2gg-00000.warc.gz	4697262	download job
money.cnn.com-shallow-20171104-054007-2g2gg-00000.warc.os.cdx.gz	13046	download
money.cnn.com-shallow-20171104-054007-2g2gg-meta.warc.gz	11926	download job
money.cnn.com-shallow-20171104-054007-2g2gg-meta.warc.os.cdx.gz	47	download
money.cnn.com-shallow-20171104-054007-2g2gg.json	307	download job
origin-www.sears.ca-inf-20171021-174356-eq7hs-00003.warc.gz	5368711577	download job
origin-www.sears.ca-inf-20171021-174356-eq7hs-00003.warc.os.cdx.gz	8931269	download
ponsati.iae-csic.org-inf-20171103-175323-9yfmv-00000.warc.gz	27255493	download job
ponsati.iae-csic.org-inf-20171103-175323-9yfmv-00000.warc.os.cdx.gz	39246	download
ponsati.iae-csic.org-inf-20171103-175323-9yfmv-meta.warc.gz	26480	download job
ponsati.iae-csic.org-inf-20171103-175323-9yfmv-meta.warc.os.cdx.gz	47	download
ponsati.iae-csic.org-inf-20171103-175323-9yfmv.json	249	download job
tcomin.blogspot.com.es-inf-20171103-175534-19y0w-00000.warc.gz	200326770	download job
tcomin.blogspot.com.es-inf-20171103-175534-19y0w-00000.warc.os.cdx.gz	465316	download
tcomin.blogspot.com.es-inf-20171103-175534-19y0w-meta.warc.gz	274826	download job
tcomin.blogspot.com.es-inf-20171103-175534-19y0w-meta.warc.os.cdx.gz	47	download
tcomin.blogspot.com.es-inf-20171103-175534-19y0w.json	251	download job
theralphretort.com-inf-20171103-204702-3qxv8-00000.warc.gz	5372390089	download job
theralphretort.com-inf-20171103-204702-3qxv8-00000.warc.os.cdx.gz	4938474	download
thewavsite.com-inf-20171103-182504-cngij-00000.warc.gz	490546628	download job
thewavsite.com-inf-20171103-182504-cngij-00000.warc.os.cdx.gz	144819	download
thewavsite.com-inf-20171103-182504-cngij-meta.warc.gz	82101	download job
thewavsite.com-inf-20171103-182504-cngij-meta.warc.os.cdx.gz	47	download
thewavsite.com-inf-20171103-182504-cngij.json	243	download job
twitter.com-shallow-20171104-054341-9pimr-00000.warc.gz	2355635	download job
twitter.com-shallow-20171104-054341-9pimr-00000.warc.os.cdx.gz	5166	download
twitter.com-shallow-20171104-054341-9pimr-meta.warc.gz	6791	download job
twitter.com-shallow-20171104-054341-9pimr-meta.warc.os.cdx.gz	47	download
twitter.com-shallow-20171104-054341-9pimr.json	254	download job
urls-a.uguu.se-8Gp1zZsA4lA1_nn.txt-shallow-20171103-114418-at2ip-00000.warc.gz	5368974743	download job
urls-a.uguu.se-8Gp1zZsA4lA1_nn.txt-shallow-20171103-114418-at2ip-00000.warc.os.cdx.gz	5805345	download
urls-a.uguu.se-8Gp1zZsA4lA1_nn.txt-shallow-20171103-114418-at2ip-00001.warc.gz	5369054201	download job
urls-a.uguu.se-8Gp1zZsA4lA1_nn.txt-shallow-20171103-114418-at2ip-00001.warc.os.cdx.gz	3212341	download
urls-a.uguu.se-8Gp1zZsA4lA1_nn.txt-shallow-20171103-114418-at2ip-00002.warc.gz	1198414157	download job
urls-a.uguu.se-8Gp1zZsA4lA1_nn.txt-shallow-20171103-114418-at2ip-00002.warc.os.cdx.gz	1117124	download
urls-a.uguu.se-8Gp1zZsA4lA1_nn.txt-shallow-20171103-114418-at2ip-meta.warc.gz	6330163	download job
urls-a.uguu.se-8Gp1zZsA4lA1_nn.txt-shallow-20171103-114418-at2ip-meta.warc.os.cdx.gz	47	download
urls-a.uguu.se-8Gp1zZsA4lA1_nn.txt-shallow-20171103-114418-at2ip-urls.txt	1650000	download
urls-a.uguu.se-8Gp1zZsA4lA1_nn.txt-shallow-20171103-114418-at2ip.json	294	download job
urls-a.uguu.se-dzckL2ga5oqp_nn.txt-shallow-20171103-195917-5r0sp-00000.warc.gz	5368722788	download job
urls-a.uguu.se-dzckL2ga5oqp_nn.txt-shallow-20171103-195917-5r0sp-00000.warc.os.cdx.gz	5720882	download
urls-a.uguu.se-dzckL2ga5oqp_nn.txt-shallow-20171103-195917-5r0sp-00001.warc.gz	5369194266	download job
urls-a.uguu.se-dzckL2ga5oqp_nn.txt-shallow-20171103-195917-5r0sp-00001.warc.os.cdx.gz	3178472	download
urls-a.uguu.se-dzckL2ga5oqp_nn.txt-shallow-20171103-195917-5r0sp-00002.warc.gz	503165501	download job
urls-a.uguu.se-dzckL2ga5oqp_nn.txt-shallow-20171103-195917-5r0sp-00002.warc.os.cdx.gz	703472	download
urls-a.uguu.se-dzckL2ga5oqp_nn.txt-shallow-20171103-195917-5r0sp-meta.warc.gz	6015849	download job
urls-a.uguu.se-dzckL2ga5oqp_nn.txt-shallow-20171103-195917-5r0sp-meta.warc.os.cdx.gz	47	download
urls-a.uguu.se-dzckL2ga5oqp_nn.txt-shallow-20171103-195917-5r0sp-urls.txt	1650000	download
urls-a.uguu.se-dzckL2ga5oqp_nn.txt-shallow-20171103-195917-5r0sp.json	294	download job
urls-gist.githubusercontent.com-fcbarcelona-websites-inf-20171031-101030-d6okg-00009.warc.gz	5370791224	download job
urls-gist.githubusercontent.com-fcbarcelona-websites-inf-20171031-101030-d6okg-00009.warc.os.cdx.gz	3612574	download
urls-gist.githubusercontent.com-fcbarcelona-websites-inf-20171031-101030-d6okg-00010.warc.gz	5368747203	download job
urls-gist.githubusercontent.com-fcbarcelona-websites-inf-20171031-101030-d6okg-00010.warc.os.cdx.gz	3894810	download
urls-gist.githubusercontent.com-thebore.com-topic-44500-shallow-20171103-165941-dzbmh-00000.warc.gz	768403124	download job
urls-gist.githubusercontent.com-thebore.com-topic-44500-shallow-20171103-165941-dzbmh-00000.warc.os.cdx.gz	440121	download
urls-gist.githubusercontent.com-thebore.com-topic-44500-shallow-20171103-165941-dzbmh-meta.warc.gz	270297	download job
urls-gist.githubusercontent.com-thebore.com-topic-44500-shallow-20171103-165941-dzbmh-meta.warc.os.cdx.gz	47	download
urls-gist.githubusercontent.com-thebore.com-topic-44500-shallow-20171103-165941-dzbmh-urls.txt	27400	download
urls-gist.githubusercontent.com-thebore.com-topic-44500-shallow-20171103-165941-dzbmh.json	510	download job
webcache.googleusercontent.com-shallow-20171104-072123-6o1lk-00000.warc.gz	703222	download job
webcache.googleusercontent.com-shallow-20171104-072123-6o1lk-00000.warc.os.cdx.gz	5622	download
webcache.googleusercontent.com-shallow-20171104-072657-3yz4i-00000.warc.gz	697200	download job
webcache.googleusercontent.com-shallow-20171104-072657-3yz4i-00000.warc.os.cdx.gz	5616	download
webcache.googleusercontent.com-shallow-20171104-072821-rnqjd.json	362	download job
webcache.googleusercontent.com-shallow-20171104-073321-6uqgs-00000.warc.gz	10225	download job
webcache.googleusercontent.com-shallow-20171104-073321-6uqgs-00000.warc.os.cdx.gz	402	download
webcache.googleusercontent.com-shallow-20171104-073321-6uqgs-meta.warc.gz	3721	download job
webcache.googleusercontent.com-shallow-20171104-073321-6uqgs-meta.warc.os.cdx.gz	47	download
webcache.googleusercontent.com-shallow-20171104-073446-1x3x4-meta.warc.gz	3718	download job
webcache.googleusercontent.com-shallow-20171104-073446-1x3x4-meta.warc.os.cdx.gz	47	download
webcache.googleusercontent.com-shallow-20171104-073446-1x3x4.json	440	download job
www.cia.gov-shallow-20171104-071519-az9e2-00000.warc.gz	4011	download job
www.cia.gov-shallow-20171104-071519-az9e2-00000.warc.os.cdx.gz	295	download
www.cia.gov-shallow-20171104-071519-az9e2-meta.warc.gz	3557	download job
www.cia.gov-shallow-20171104-071519-az9e2-meta.warc.os.cdx.gz	47	download
www.cia.gov-shallow-20171104-071852-2ecss-meta.warc.gz	3630	download job
www.cia.gov-shallow-20171104-071852-2ecss-meta.warc.os.cdx.gz	47	download
www.cia.gov-shallow-20171104-072410-4y0zh-00000.warc.gz	4135	download job
www.cia.gov-shallow-20171104-072410-4y0zh-00000.warc.os.cdx.gz	363	download
www.cia.gov-shallow-20171104-072410-4y0zh-meta.warc.gz	3666	download job
www.cia.gov-shallow-20171104-072410-4y0zh-meta.warc.os.cdx.gz	47	download
www.citypaper.com-inf-20171102-233207-at569-00005.warc.gz	5368715938	download job
www.citypaper.com-inf-20171102-233207-at569-00005.warc.os.cdx.gz	3057129	download
www.citypaper.com-inf-20171102-233207-at569-00006.warc.gz	5369037557	download job
www.citypaper.com-inf-20171102-233207-at569-00006.warc.os.cdx.gz	3319437	download
www.filmarchivesonline.com-inf-20171103-183533-82csz-00000.warc.gz	18899824	download job
www.filmarchivesonline.com-inf-20171103-183533-82csz-00000.warc.os.cdx.gz	79685	download
www.filmarchivesonline.com-inf-20171103-183533-82csz-meta.warc.gz	49514	download job
www.filmarchivesonline.com-inf-20171103-183533-82csz-meta.warc.os.cdx.gz	47	download
www.filmarchivesonline.com-inf-20171103-183533-82csz.json	253	download job
www.hollywoodreporter.com-shallow-20171104-055806-djsr1-00000.warc.gz	2960320	download job
www.hollywoodreporter.com-shallow-20171104-055806-djsr1-00000.warc.os.cdx.gz	6790	download
www.hollywoodreporter.com-shallow-20171104-055806-djsr1-meta.warc.gz	7925	download job
www.hollywoodreporter.com-shallow-20171104-055806-djsr1-meta.warc.os.cdx.gz	47	download
www.hollywoodreporter.com-shallow-20171104-055806-djsr1.json	318	download job
www.kevinspacey.com-inf-20171103-184016-3pbqk-00000.warc.gz	590408713	download job
www.kevinspacey.com-inf-20171103-184016-3pbqk-00000.warc.os.cdx.gz	795146	download
www.kevinspacey.com-inf-20171103-184016-3pbqk-meta.warc.gz	501271	download job
www.kevinspacey.com-inf-20171103-184016-3pbqk-meta.warc.os.cdx.gz	47	download
www.kevinspacey.com-inf-20171103-184016-3pbqk.json	244	download job
www.meritxellborras.cat-inf-20171103-122957-7xglm-00002.warc.gz	3623426494	download job
www.meritxellborras.cat-inf-20171103-122957-7xglm-00002.warc.os.cdx.gz	1657013	download
www.meritxellborras.cat-inf-20171103-122957-7xglm-meta.warc.gz	1861880	download job
www.meritxellborras.cat-inf-20171103-122957-7xglm-meta.warc.os.cdx.gz	47	download
www.meritxellborras.cat-inf-20171103-122957-7xglm.json	252	download job
www.naciodigital.cat-inf-20170919-214300-247yw-00077.warc.gz	5369113796	download job
www.naciodigital.cat-inf-20170919-214300-247yw-00077.warc.os.cdx.gz	3840408	download
www.nuet.cat-inf-20171103-020537-83uxl-00001.warc.gz	4933499962	download job
www.nuet.cat-inf-20171103-020537-83uxl-00001.warc.os.cdx.gz	9661218	download
www.nuet.cat-inf-20171103-020537-83uxl-meta.warc.gz	13561075	download job
www.nuet.cat-inf-20171103-020537-83uxl-meta.warc.os.cdx.gz	47	download
www.nuet.cat-inf-20171103-020537-83uxl.json	242	download job
www.nytimes.com-shallow-20171104-062425-1bo0q-00000.warc.gz	12027890	download job
www.nytimes.com-shallow-20171104-062425-1bo0q-00000.warc.os.cdx.gz	34571	download
www.nytimes.com-shallow-20171104-062425-1bo0q-meta.warc.gz	25419	download job
www.nytimes.com-shallow-20171104-062425-1bo0q-meta.warc.os.cdx.gz	47	download
www.nytimes.com-shallow-20171104-062425-1bo0q.json	289	download job
www.periskopia.cat-inf-20171103-171442-8zs81-00000.warc.gz	543073963	download job
www.periskopia.cat-inf-20171103-171442-8zs81-00000.warc.os.cdx.gz	755568	download
www.periskopia.cat-inf-20171103-171442-8zs81-meta.warc.gz	487769	download job
www.periskopia.cat-inf-20171103-171442-8zs81-meta.warc.os.cdx.gz	47	download
www.periskopia.cat-inf-20171103-171442-8zs81.json	247	download job
www.reddit.com-inf-20171103-193127-99hi6-00000.warc.gz	3112007592	download job
www.reddit.com-inf-20171103-193127-99hi6-00000.warc.os.cdx.gz	1907407	download
www.reddit.com-inf-20171103-193127-99hi6-meta.warc.gz	15063057	download job
www.reddit.com-inf-20171103-193127-99hi6-meta.warc.os.cdx.gz	47	download
www.reddit.com-inf-20171103-193127-99hi6.json	258	download job
www.santivila.cat-inf-20171103-095319-2wj9z-00000.warc.gz	3127927363	download job
www.santivila.cat-inf-20171103-095319-2wj9z-00000.warc.os.cdx.gz	4045326	download
www.santivila.cat-inf-20171103-095319-2wj9z-meta.warc.gz	2687463	download job
www.santivila.cat-inf-20171103-095319-2wj9z-meta.warc.os.cdx.gz	47	download
www.santivila.cat-inf-20171103-095319-2wj9z.json	247	download job
www.theverge.com-shallow-20171104-054234-eyaky-00000.warc.gz	16146128	download job
www.theverge.com-shallow-20171104-054234-eyaky-00000.warc.os.cdx.gz	10036	download
www.theverge.com-shallow-20171104-054234-eyaky-meta.warc.gz	10019	download job
www.theverge.com-shallow-20171104-054234-eyaky-meta.warc.os.cdx.gz	47	download
www.theverge.com-shallow-20171104-054234-eyaky.json	308	download job
www.wiocha.pl-inf-20171018-113215-2i2w3-00039.warc.gz	5368715573	download job
www.wiocha.pl-inf-20171018-113215-2i2w3-00039.warc.os.cdx.gz	5899803	download
www.wiocha.pl-inf-20171018-113215-2i2w3-00040.warc.gz	5368977704	download job
www.wiocha.pl-inf-20171018-113215-2i2w3-00040.warc.os.cdx.gz	8773974	download