Item archiveteam_archivebot_go_20160728190001

Filename	Size
about.yahoo.com-inf-20160728-025112-cy3tj.json	242	download job
advertising.yahoo.com-inf-20160728-032414-8388i.json	248	download job
archiveteam_archivebot_go_20160728190001.cdx.gz	27389742	download
archiveteam_archivebot_go_20160728190001.cdx.idx	27738	download
archiveteam_archivebot_go_20160728190001_archive.torrent	589830	download
archiveteam_archivebot_go_20160728190001_files.xml	0	download
archiveteam_archivebot_go_20160728190001_meta.sqlite	222208	download
archiveteam_archivebot_go_20160728190001_meta.xml	1003	download
arstechnica.com-shallow-20160727-203646-83cc7-00000.warc.gz	1293589	download job
arstechnica.com-shallow-20160727-203646-83cc7-00000.warc.os.cdx.gz	7754	download
arstechnica.com-shallow-20160727-203646-83cc7-meta.warc.gz	8296	download job
arstechnica.com-shallow-20160727-203646-83cc7-meta.warc.os.cdx.gz	47	download
arstechnica.com-shallow-20160727-203646-83cc7.json	341	download job
att.yahoo.com-shallow-20160727-134159-7el1z-00000.warc.gz	3273854	download job
att.yahoo.com-shallow-20160727-134159-7el1z-00000.warc.os.cdx.gz	16490	download
att.yahoo.com-shallow-20160727-134159-7el1z-meta.warc.gz	13278	download job
att.yahoo.com-shallow-20160727-134159-7el1z-meta.warc.os.cdx.gz	47	download
att.yahoo.com-shallow-20160727-134159-7el1z.json	244	download job
blog.lastpass.com-shallow-20160727-210523-4b3ae-00000.warc.gz	2564298	download job
blog.lastpass.com-shallow-20160727-210523-4b3ae-00000.warc.os.cdx.gz	9479	download
blog.lastpass.com-shallow-20160727-210523-4b3ae-meta.warc.gz	9008	download job
blog.lastpass.com-shallow-20160727-210523-4b3ae-meta.warc.os.cdx.gz	47	download
blog.lastpass.com-shallow-20160727-210523-4b3ae.json	286	download job
blog.torproject.org-shallow-20160727-141023-3y6a8-00000.warc.gz	130898	download job
blog.torproject.org-shallow-20160727-141023-3y6a8-00000.warc.os.cdx.gz	2424	download
blog.torproject.org-shallow-20160727-141023-3y6a8-meta.warc.gz	4382	download job
blog.torproject.org-shallow-20160727-141023-3y6a8-meta.warc.os.cdx.gz	47	download
blog.torproject.org-shallow-20160727-141023-3y6a8.json	270	download job
blog.vizio.com-inf-20160728-082435-62otd.json	244	download job
ca.yahoo.com-shallow-20160727-132515-f19qe-00000.warc.gz	4297659	download job
ca.yahoo.com-shallow-20160727-132515-f19qe-00000.warc.os.cdx.gz	21746	download
ca.yahoo.com-shallow-20160727-132515-f19qe-meta.warc.gz	16787	download job
ca.yahoo.com-shallow-20160727-132515-f19qe-meta.warc.os.cdx.gz	47	download
ca.yahoo.com-shallow-20160727-132515-f19qe.json	243	download job
cryptome.thecthulhu.com-shallow-20160727-031846-5vjgm-00000.warc.gz	4397	download job
cryptome.thecthulhu.com-shallow-20160727-031846-5vjgm-00000.warc.os.cdx.gz	47	download
cryptome.thecthulhu.com-shallow-20160727-031846-5vjgm-meta.warc.gz	3256	download job
cryptome.thecthulhu.com-shallow-20160727-031846-5vjgm-meta.warc.os.cdx.gz	47	download
cryptome.thecthulhu.com-shallow-20160727-031846-5vjgm.json	292	download job
decorrespondent.nl-shallow-20160727-192316-dvwrr.json	334	download job
dmca.ucr.edu-inf-20160728-032926-3agdk.json	242	download job
downloads.yahoo.com-inf-20160727-191613-1vl7n.json	246	download job
e-shuushuu.net-inf-20160728-170103-3kj26-00000.warc.gz	405938	download job
e-shuushuu.net-inf-20160728-170103-3kj26-00000.warc.os.cdx.gz	1190	download
e-shuushuu.net-inf-20160728-170103-3kj26-meta.warc.gz	3917	download job
e-shuushuu.net-inf-20160728-170103-3kj26-meta.warc.os.cdx.gz	47	download
e-shuushuu.net-inf-20160728-170103-3kj26.json	255	download job
e-shuushuu.net-shallow-20160728-125940-bhm2y-00000.warc.gz	416235	download job
e-shuushuu.net-shallow-20160728-125940-bhm2y-00000.warc.os.cdx.gz	1164	download
e-shuushuu.net-shallow-20160728-125940-bhm2y-meta.warc.gz	3856	download job
e-shuushuu.net-shallow-20160728-125940-bhm2y-meta.warc.os.cdx.gz	47	download
e-shuushuu.net-shallow-20160728-125940-bhm2y.json	259	download job
everything.yahoo.com-inf-20160727-192427-dfv2u.json	247	download job
facepunch.com-inf-20160725-050101-enqrg-00003.warc.gz	5378678938	download job
facepunch.com-inf-20160725-050101-enqrg-00003.warc.os.cdx.gz	5133068	download
gma.yahoo.com-shallow-20160727-134300-a8d77-00000.warc.gz	2433334	download job
gma.yahoo.com-shallow-20160727-134300-a8d77-00000.warc.os.cdx.gz	16714	download
gma.yahoo.com-shallow-20160727-134300-a8d77-meta.warc.gz	13544	download job
gma.yahoo.com-shallow-20160727-134300-a8d77-meta.warc.os.cdx.gz	47	download
gma.yahoo.com-shallow-20160727-134300-a8d77.json	244	download job
i-style.surpara.com-inf-20160727-233912-1mkdc.json	258	download job
image.vizio.com-inf-20160728-084643-d6ktr.json	245	download job
images.vizio.com-inf-20160728-084925-cibbp.json	246	download job
katahiromz.web.fc2.com-inf-20160728-065424-3mbw5.json	251	download job
katcr.co-inf-20160728-022117-5rbk7.json	237	download job
lars.ingebrigtsen.no-shallow-20160728-124025-dy2la-00000.warc.gz	2433917	download job
lars.ingebrigtsen.no-shallow-20160728-124025-dy2la-00000.warc.os.cdx.gz	11014	download
lars.ingebrigtsen.no-shallow-20160728-124025-dy2la-meta.warc.gz	9441	download job
lars.ingebrigtsen.no-shallow-20160728-124025-dy2la-meta.warc.os.cdx.gz	47	download
lars.ingebrigtsen.no-shallow-20160728-124025-dy2la.json	281	download job
medium.com-shallow-20160728-115437-68fh1-00000.warc.gz	9882839	download job
medium.com-shallow-20160728-115437-68fh1-00000.warc.os.cdx.gz	9898	download
medium.com-shallow-20160728-115437-68fh1-meta.warc.gz	9305	download job
medium.com-shallow-20160728-115437-68fh1-meta.warc.os.cdx.gz	47	download
medium.com-shallow-20160728-115437-68fh1.json	344	download job
messenger.yahoo.com-inf-20160727-194841-emgpu.json	246	download job
mobile.nytimes.com-shallow-20160727-140822-6lujs-00000.warc.gz	1629165	download job
mobile.nytimes.com-shallow-20160727-140822-6lujs-00000.warc.os.cdx.gz	7939	download
mobile.nytimes.com-shallow-20160727-140822-6lujs-meta.warc.gz	8556	download job
mobile.nytimes.com-shallow-20160727-140822-6lujs-meta.warc.os.cdx.gz	47	download
mobile.nytimes.com-shallow-20160727-140822-6lujs.json	306	download job
mobile.yahoo.com-inf-20160728-024732-8fft1.json	243	download job
my.yahoo.com-shallow-20160727-134508-dg1sg-00000.warc.gz	1310281	download job
my.yahoo.com-shallow-20160727-134508-dg1sg-00000.warc.os.cdx.gz	13324	download
my.yahoo.com-shallow-20160727-134508-dg1sg-meta.warc.gz	10993	download job
my.yahoo.com-shallow-20160727-134508-dg1sg-meta.warc.os.cdx.gz	47	download
my.yahoo.com-shallow-20160727-134508-dg1sg.json	243	download job
news.ycombinator.com-shallow-20160728-015133-a2yqr-00000.warc.gz	30888	download job
news.ycombinator.com-shallow-20160728-015133-a2yqr-00000.warc.os.cdx.gz	646	download
news.ycombinator.com-shallow-20160728-015133-a2yqr-meta.warc.gz	3413	download job
news.ycombinator.com-shallow-20160728-015133-a2yqr-meta.warc.os.cdx.gz	47	download
news.ycombinator.com-shallow-20160728-015133-a2yqr.json	268	download job
nheasy.nh.gov-shallow-20160728-015343-4dz1k-00000.warc.gz	4041	download job
nheasy.nh.gov-shallow-20160728-015343-4dz1k-00000.warc.os.cdx.gz	209	download
nheasy.nh.gov-shallow-20160728-015343-4dz1k-meta.warc.gz	3115	download job
nheasy.nh.gov-shallow-20160728-015343-4dz1k-meta.warc.os.cdx.gz	47	download
nheasy.nh.gov-shallow-20160728-015343-4dz1k.json	247	download job
np.reddit.com-shallow-20160727-211445-27fc5-00000.warc.gz	2429967	download job
np.reddit.com-shallow-20160727-211445-27fc5-00000.warc.os.cdx.gz	7738	download
np.reddit.com-shallow-20160727-211445-27fc5-meta.warc.gz	7599	download job
np.reddit.com-shallow-20160727-211445-27fc5-meta.warc.os.cdx.gz	47	download
np.reddit.com-shallow-20160727-211445-27fc5.json	320	download job
perfectionkills.com-shallow-20160728-080407-7cqdp-00000.warc.gz	43260	download job
perfectionkills.com-shallow-20160728-080407-7cqdp-00000.warc.os.cdx.gz	659	download
perfectionkills.com-shallow-20160728-080407-7cqdp-meta.warc.gz	3579	download job
perfectionkills.com-shallow-20160728-080407-7cqdp-meta.warc.os.cdx.gz	47	download
perfectionkills.com-shallow-20160728-080407-7cqdp.json	273	download job
precip.gsfc.nasa.gov-inf-20160728-115132-2fleh-00000.warc.gz	34834367	download job
precip.gsfc.nasa.gov-inf-20160728-115132-2fleh-00000.warc.os.cdx.gz	33826	download
precip.gsfc.nasa.gov-inf-20160728-115132-2fleh-meta.warc.gz	24255	download job
precip.gsfc.nasa.gov-inf-20160728-115132-2fleh-meta.warc.os.cdx.gz	47	download
precip.gsfc.nasa.gov-inf-20160728-115132-2fleh.json	245	download job
prettygoodmovieride.com-inf-20160728-054350-842xt.json	251	download job
qz.com-inf-20160728-064749-4i12s.json	330	download job
randomwaffle.gbs.fm-inf-20160707-131226-93i4t-00039.warc.gz	5368728720	download job
randomwaffle.gbs.fm-inf-20160707-131226-93i4t-00039.warc.os.cdx.gz	3615757	download
randomwaffle.gbs.fm-inf-20160707-131226-93i4t-00040.warc.gz	5369283318	download job
randomwaffle.gbs.fm-inf-20160707-131226-93i4t-00040.warc.os.cdx.gz	3605098	download
reddit.com-shallow-20160727-211457-5qrcn-00000.warc.gz	2430012	download job
reddit.com-shallow-20160727-211457-5qrcn-00000.warc.os.cdx.gz	7778	download
reddit.com-shallow-20160727-211457-5qrcn-meta.warc.gz	7605	download job
reddit.com-shallow-20160727-211457-5qrcn-meta.warc.os.cdx.gz	47	download
reddit.com-shallow-20160727-211457-5qrcn.json	317	download job
saynotograndpajoe.com-inf-20160728-023214-ns8xu.json	247	download job
search.yahoo.com-inf-20160727-192722-bscup-aborted.json	242	download job
search.yahoo.com-shallow-20160727-132615-ana09-00000.warc.gz	810973	download job
search.yahoo.com-shallow-20160727-132615-ana09-00000.warc.os.cdx.gz	4802	download
search.yahoo.com-shallow-20160727-132615-ana09-meta.warc.gz	5983	download job
search.yahoo.com-shallow-20160727-132615-ana09-meta.warc.os.cdx.gz	47	download
search.yahoo.com-shallow-20160727-132615-ana09.json	261	download job
smarttv.yahoo.com-inf-20160727-193802-bm0ak.json	244	download job
sonsoflibertymedia.com-inf-20160719-054605-2wk8r-00005.warc.gz	5374052278	download job
sonsoflibertymedia.com-inf-20160719-054605-2wk8r-00005.warc.os.cdx.gz	3594778	download
sonsoflibertymedia.com-inf-20160719-054605-2wk8r-00006.warc.gz	1414030183	download job
sonsoflibertymedia.com-inf-20160719-054605-2wk8r-00006.warc.os.cdx.gz	554620	download
sonsoflibertymedia.com-inf-20160719-054605-2wk8r.json	248	download job
status.github.com-shallow-20160728-012827-7caqb-00000.warc.gz	163176	download job
status.github.com-shallow-20160728-012827-7caqb-00000.warc.os.cdx.gz	943	download
status.github.com-shallow-20160728-012827-7caqb-meta.warc.gz	3553	download job
status.github.com-shallow-20160728-012827-7caqb-meta.warc.os.cdx.gz	47	download
status.github.com-shallow-20160728-012827-7caqb.json	257	download job
time.com-shallow-20160728-004942-3blk6-00000.warc.gz	1147488	download job
time.com-shallow-20160728-004942-3blk6-00000.warc.os.cdx.gz	8682	download
time.com-shallow-20160728-004942-3blk6-meta.warc.gz	9323	download job
time.com-shallow-20160728-004942-3blk6-meta.warc.os.cdx.gz	47	download
time.com-shallow-20160728-004942-3blk6.json	275	download job
toolbar.yahoo.com-inf-20160727-191602-3wei6.json	244	download job
twitter.com-inf-20160727-011821-f015f-00000.warc.gz	336262577	download job
twitter.com-inf-20160727-011821-f015f-00000.warc.os.cdx.gz	353406	download
twitter.com-inf-20160727-011821-f015f.json	280	download job
twitter.com-shallow-20160728-035514-817jn-00000.warc.gz	4485295	download job
twitter.com-shallow-20160728-035514-817jn-00000.warc.os.cdx.gz	8288	download
twitter.com-shallow-20160728-035514-817jn-meta.warc.gz	8751	download job
twitter.com-shallow-20160728-035514-817jn-meta.warc.os.cdx.gz	47	download
twitter.com-shallow-20160728-035514-817jn.json	275	download job
uk.mail.yahoo.com-inf-20160728-030305-ctkxz.json	244	download job
urls-ddl2.data.hu-kepfeltoltes_hu_images_2016_01-shallow-20160725-051332-a4tl8-00008.warc.gz	2536111122	download job
urls-ddl2.data.hu-kepfeltoltes_hu_images_2016_01-shallow-20160725-051332-a4tl8-00008.warc.os.cdx.gz	4240217	download
urls-ddl2.data.hu-kepfeltoltes_hu_images_2016_01-shallow-20160725-051332-a4tl8-meta.warc.gz	7407531	download job
urls-ddl2.data.hu-kepfeltoltes_hu_images_2016_01-shallow-20160725-051332-a4tl8-meta.warc.os.cdx.gz	47	download
urls-ddl2.data.hu-kepfeltoltes_hu_images_2016_01-shallow-20160725-051332-a4tl8-urls.txt	15506594	download
urls-ddl2.data.hu-kepfeltoltes_hu_images_2016_01-shallow-20160725-051332-a4tl8.json	348	download job
urls-pastebin.com-AiMKP9Ga-shallow-20160727-123139-1jy2i-00000.warc.gz	836822270	download job
urls-pastebin.com-AiMKP9Ga-shallow-20160727-123139-1jy2i-00000.warc.os.cdx.gz	144107	download
urls-pastebin.com-AiMKP9Ga-shallow-20160727-123139-1jy2i-meta.warc.gz	101599	download job
urls-pastebin.com-AiMKP9Ga-shallow-20160727-123139-1jy2i-meta.warc.os.cdx.gz	47	download
urls-pastebin.com-AiMKP9Ga-shallow-20160727-123139-1jy2i-urls.txt	3508	download
urls-pastebin.com-AiMKP9Ga-shallow-20160727-123139-1jy2i.json	286	download job
urls-pastebin.com-Jkk4h27j-shallow-20160728-005642-b6sts-00000.warc.gz	943951	download job
urls-pastebin.com-Jkk4h27j-shallow-20160728-005642-b6sts-00000.warc.os.cdx.gz	10028	download
urls-pastebin.com-Jkk4h27j-shallow-20160728-005642-b6sts-meta.warc.gz	9005	download job
urls-pastebin.com-Jkk4h27j-shallow-20160728-005642-b6sts-meta.warc.os.cdx.gz	47	download
urls-pastebin.com-Jkk4h27j-shallow-20160728-005642-b6sts-urls.txt	637	download
urls-pastebin.com-Jkk4h27j-shallow-20160728-005642-b6sts.json	286	download job
us.mail.yahoo.com-inf-20160728-033944-axx6x.json	244	download job
usatoday30.usatoday.com-shallow-20160727-174630-c7uqc-00000.warc.gz	3296132	download job
usatoday30.usatoday.com-shallow-20160727-174630-c7uqc-00000.warc.os.cdx.gz	11345	download
usatoday30.usatoday.com-shallow-20160727-174630-c7uqc-meta.warc.gz	11484	download job
usatoday30.usatoday.com-shallow-20160727-174630-c7uqc-meta.warc.os.cdx.gz	47	download
usatoday30.usatoday.com-shallow-20160727-174630-c7uqc.json	299	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00018.warc.gz	5369081966	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00018.warc.os.cdx.gz	92595	download
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00019.warc.gz	5369922632	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00019.warc.os.cdx.gz	66371	download
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00020.warc.gz	5378951410	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00020.warc.os.cdx.gz	47275	download
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00021.warc.gz	5369315302	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00021.warc.os.cdx.gz	25995	download
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00022.warc.gz	5372094648	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00022.warc.os.cdx.gz	59933	download
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00023.warc.gz	5371000590	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00023.warc.os.cdx.gz	43460	download
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00024.warc.gz	5380300953	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00024.warc.os.cdx.gz	52364	download
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00025.warc.gz	5369863306	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00025.warc.os.cdx.gz	46382	download
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00026.warc.gz	5370033982	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00026.warc.os.cdx.gz	41483	download
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00027.warc.gz	5375070905	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00027.warc.os.cdx.gz	67374	download
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00028.warc.gz	5370595463	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00028.warc.os.cdx.gz	24916	download
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00029.warc.gz	5372669500	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00029.warc.os.cdx.gz	62956	download
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00030.warc.gz	1998373384	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-00030.warc.os.cdx.gz	42546	download
www.americanradiohistory.com-inf-20160725-232843-6yc2e-aborted.json	284	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-meta.warc.gz	926885	download job
www.americanradiohistory.com-inf-20160725-232843-6yc2e-meta.warc.os.cdx.gz	47	download
www.americanradiohistory.com-inf-20160728-162321-whtbk-00000.warc.gz	3256343634	download job
www.americanradiohistory.com-inf-20160728-162321-whtbk-00000.warc.os.cdx.gz	61814	download
www.americanradiohistory.com-inf-20160728-162321-whtbk.json	256	download job
www.barackobamafoundation.org-inf-20160728-043604-dejzv.json	255	download job
www.bloomberg.com-inf-20160728-061533-cfjb1.json	318	download job
www.bloomberg.com-shallow-20160728-001829-c7ayo-00000.warc.gz	5288726	download job
www.bloomberg.com-shallow-20160728-001829-c7ayo-00000.warc.os.cdx.gz	12320	download
www.bloomberg.com-shallow-20160728-001829-c7ayo-meta.warc.gz	10487	download job
www.bloomberg.com-shallow-20160728-001829-c7ayo-meta.warc.os.cdx.gz	47	download
www.bloomberg.com-shallow-20160728-001829-c7ayo.json	319	download job
www.change.org-shallow-20160728-034702-3fbs8-00000.warc.gz	12144326	download job
www.change.org-shallow-20160728-034702-3fbs8-00000.warc.os.cdx.gz	55340	download
www.change.org-shallow-20160728-034702-3fbs8-meta.warc.gz	34132	download job
www.change.org-shallow-20160728-034702-3fbs8-meta.warc.os.cdx.gz	47	download
www.change.org-shallow-20160728-034702-3fbs8.json	342	download job
www.donaldjtrump.com-inf-20160728-065009-4rgag.json	280	download job
www.facebook.com-shallow-20160728-095542-a7tge.json	289	download job
www.facebook.com-shallow-20160728-103351-9ow4n-00000.warc.gz	3630967	download job
www.facebook.com-shallow-20160728-103351-9ow4n-00000.warc.os.cdx.gz	29822	download
www.facebook.com-shallow-20160728-103351-9ow4n-meta.warc.gz	21287	download job
www.facebook.com-shallow-20160728-103351-9ow4n-meta.warc.os.cdx.gz	47	download
www.facebook.com-shallow-20160728-103351-9ow4n.json	285	download job
www.gaelco.com-shallow-20160728-141924-5lyln-00000.warc.gz	8441227	download job
www.gaelco.com-shallow-20160728-141924-5lyln-00000.warc.os.cdx.gz	6088	download
www.gaelco.com-shallow-20160728-141924-5lyln-meta.warc.gz	6492	download job
www.gaelco.com-shallow-20160728-141924-5lyln-meta.warc.os.cdx.gz	47	download
www.gaelco.com-shallow-20160728-141924-5lyln.json	265	download job
www.reddit.com-inf-20160726-085946-6tw82-00001.warc.gz	5368730897	download job
www.reddit.com-inf-20160726-085946-6tw82-00001.warc.os.cdx.gz	2942305	download
www.reddit.com-inf-20160726-085946-6tw82-00002.warc.gz	5376583361	download job
www.reddit.com-inf-20160726-085946-6tw82-00002.warc.os.cdx.gz	2747005	download
www.reddit.com-inf-20160728-005251-8w9px.json	321	download job
www.rtlz.nl-shallow-20160728-061734-25l45-00000.warc.gz	3853042	download job
www.rtlz.nl-shallow-20160728-061734-25l45-00000.warc.os.cdx.gz	14872	download
www.rtlz.nl-shallow-20160728-061734-25l45-meta.warc.gz	12036	download job
www.rtlz.nl-shallow-20160728-061734-25l45-meta.warc.os.cdx.gz	47	download
www.rtlz.nl-shallow-20160728-061734-25l45.json	297	download job
www.theblaze.com-shallow-20160727-191441-dz2y8-00000.warc.gz	3551221	download job
www.theblaze.com-shallow-20160727-191441-dz2y8-00000.warc.os.cdx.gz	12558	download
www.theblaze.com-shallow-20160727-191441-dz2y8-meta.warc.gz	11306	download job
www.theblaze.com-shallow-20160727-191441-dz2y8-meta.warc.os.cdx.gz	47	download
www.theblaze.com-shallow-20160727-191441-dz2y8.json	337	download job
www.un.org-inf-20160728-020914-5qe6y.json	244	download job
www.vocativ.com-shallow-20160727-153949-5ji5d-00000.warc.gz	54597994	download job
www.vocativ.com-shallow-20160727-153949-5ji5d-00000.warc.os.cdx.gz	16406	download
www.vocativ.com-shallow-20160727-153949-5ji5d-meta.warc.gz	13152	download job
www.vocativ.com-shallow-20160727-153949-5ji5d-meta.warc.os.cdx.gz	47	download
www.vocativ.com-shallow-20160727-153949-5ji5d.json	278	download job
www.watermelon.nl-inf-20160728-135929-58u5c.json	247	download job
www.yahoo.com-inf-20160727-194907-8e64r.json	255	download job
www.yahoo.com-shallow-20160727-132525-4z02r-00000.warc.gz	4688722	download job
www.yahoo.com-shallow-20160727-132525-4z02r-00000.warc.os.cdx.gz	18435	download
www.yahoo.com-shallow-20160727-132525-4z02r-meta.warc.gz	14791	download job
www.yahoo.com-shallow-20160727-132525-4z02r-meta.warc.os.cdx.gz	47	download
www.yahoo.com-shallow-20160727-132525-4z02r.json	244	download job