Item archiveteam_archivebot_go_20200117200003

Filename	Size
8tracks.com-inf-20191228-013657-daow6-00050.warc.gz	5368712555	download job
8tracks.com-inf-20191228-013657-daow6-00050.warc.os.cdx.gz	5126892	download
9to5mac.com-shallow-20200117-193622-354l7-00000.warc.gz	49178662	download job
9to5mac.com-shallow-20200117-193622-354l7-00000.warc.os.cdx.gz	17079	download
9to5mac.com-shallow-20200117-193622-354l7.json	301	download job
archiveteam_archivebot_go_20200117200003.cdx.gz	82310307	download
archiveteam_archivebot_go_20200117200003.cdx.idx	78744	download
archiveteam_archivebot_go_20200117200003_files.xml	0	download
archiveteam_archivebot_go_20200117200003_meta.sqlite	268288	download
archiveteam_archivebot_go_20200117200003_meta.xml	1018	download
arizonapoet.com-inf-20200117-183010-9yt8u-00000.warc.gz	189709400	download job
arizonapoet.com-inf-20200117-183010-9yt8u-00000.warc.os.cdx.gz	216197	download
arizonapoet.com-inf-20200117-183010-9yt8u-meta.warc.gz	126727	download job
arizonapoet.com-inf-20200117-183010-9yt8u-meta.warc.os.cdx.gz	47	download
arizonapoet.com-inf-20200117-183010-9yt8u.json	251	download job
bigburgerv.net-inf-20200117-194858-3ljka-meta.warc.gz	6272	download job
bigburgerv.net-inf-20200117-194858-3ljka-meta.warc.os.cdx.gz	47	download
bigburgerv.net-inf-20200117-194858-3ljka.json	242	download job
delusionland.com-inf-20200117-180814-2zbdl-00000.warc.gz	164090027	download job
delusionland.com-inf-20200117-180814-2zbdl-00000.warc.os.cdx.gz	241941	download
delusionland.com-inf-20200117-180814-2zbdl-meta.warc.gz	159506	download job
delusionland.com-inf-20200117-180814-2zbdl-meta.warc.os.cdx.gz	47	download
delusionland.com-inf-20200117-180814-2zbdl.json	244	download job
dreamhousepress.blogspot.com-inf-20200117-184004-f2dxv-00000.warc.gz	10273077	download job
dreamhousepress.blogspot.com-inf-20200117-184004-f2dxv-00000.warc.os.cdx.gz	47047	download
dreamhousepress.blogspot.com-inf-20200117-184004-f2dxv-meta.warc.gz	32618	download job
dreamhousepress.blogspot.com-inf-20200117-184004-f2dxv-meta.warc.os.cdx.gz	47	download
dreamhousepress.blogspot.com-inf-20200117-184004-f2dxv.json	253	download job
flipboard.com-inf-20190530-021845-a9z36-01408.warc.gz	5394543948	download job
flipboard.com-inf-20190530-021845-a9z36-01408.warc.os.cdx.gz	602157	download
github.com-inf-20200117-175002-4c83p-00000.warc.gz	90509296	download job
github.com-inf-20200117-175002-4c83p-00000.warc.os.cdx.gz	148701	download
github.com-inf-20200117-175002-4c83p-meta.warc.gz	141378	download job
github.com-inf-20200117-175002-4c83p-meta.warc.os.cdx.gz	47	download
github.com-inf-20200117-175002-4c83p.json	257	download job
github.com-shallow-20200117-175040-etudq-00000.warc.gz	442554	download job
github.com-shallow-20200117-175040-etudq-00000.warc.os.cdx.gz	310	download
github.com-shallow-20200117-175040-etudq-meta.warc.gz	3555	download job
github.com-shallow-20200117-175040-etudq-meta.warc.os.cdx.gz	47	download
github.com-shallow-20200117-175040-etudq.json	282	download job
github.com-shallow-20200117-175432-cl5p6-00000.warc.gz	1754324	download job
github.com-shallow-20200117-175432-cl5p6-00000.warc.os.cdx.gz	6636	download
github.com-shallow-20200117-175432-cl5p6-meta.warc.gz	7450	download job
github.com-shallow-20200117-175432-cl5p6-meta.warc.os.cdx.gz	47	download
github.com-shallow-20200117-175432-cl5p6.json	269	download job
github.com-shallow-20200117-175507-671ny-00000.warc.gz	1620402	download job
github.com-shallow-20200117-175507-671ny-00000.warc.os.cdx.gz	4324	download
history/files/www.ninersnation.com-inf-20191224-082402-8nweq-00236.warc.gz.~1~	5372492958	download
history/files/www.parliran.ir-inf-20200104-222244-8qwn2-00021.warc.gz.~1~	5382809251	download
i.imgur.com-shallow-20200117-193624-a97tg-00000.warc.gz	148341	download job
i.imgur.com-shallow-20200117-193624-a97tg-00000.warc.os.cdx.gz	223	download
i.imgur.com-shallow-20200117-193624-a97tg-meta.warc.gz	3455	download job
i.imgur.com-shallow-20200117-193624-a97tg-meta.warc.os.cdx.gz	47	download
i.imgur.com-shallow-20200117-193624-a97tg.json	257	download job
i.imgur.com-shallow-20200117-193628-86470-00000.warc.gz	89557	download job
i.imgur.com-shallow-20200117-193628-86470-00000.warc.os.cdx.gz	224	download
i.imgur.com-shallow-20200117-193628-86470-meta.warc.gz	3404	download job
i.imgur.com-shallow-20200117-193628-86470-meta.warc.os.cdx.gz	47	download
i.imgur.com-shallow-20200117-193628-86470.json	257	download job
jayito.com-inf-20200117-182835-5g33n-00000.warc.gz	845424148	download job
jayito.com-inf-20200117-182835-5g33n-00000.warc.os.cdx.gz	51270	download
jayito.com-inf-20200117-182835-5g33n-meta.warc.gz	39177	download job
jayito.com-inf-20200117-182835-5g33n-meta.warc.os.cdx.gz	47	download
jayito.com-inf-20200117-182835-5g33n.json	238	download job
memoriahistorica.org.es-inf-20200117-142112-wlzo4-00001.warc.gz	5368720312	download job
memoriahistorica.org.es-inf-20200117-142112-wlzo4-00001.warc.os.cdx.gz	823035	download
myhomemadedolly.com-inf-20200117-181949-16zbj-00000.warc.gz	16733698	download job
myhomemadedolly.com-inf-20200117-181949-16zbj-00000.warc.os.cdx.gz	53627	download
myhomemadedolly.com-inf-20200117-181949-16zbj-meta.warc.gz	35158	download job
myhomemadedolly.com-inf-20200117-181949-16zbj-meta.warc.os.cdx.gz	47	download
myhomemadedolly.com-inf-20200117-181949-16zbj.json	247	download job
nintendocavy.blogspot.com-inf-20200117-180311-8ogps-00000.warc.gz	9786147	download job
nintendocavy.blogspot.com-inf-20200117-180311-8ogps-00000.warc.os.cdx.gz	32703	download
nintendocavy.blogspot.com-inf-20200117-180311-8ogps-meta.warc.gz	23759	download job
nintendocavy.blogspot.com-inf-20200117-180311-8ogps-meta.warc.os.cdx.gz	47	download
nintendocavy.blogspot.com-inf-20200117-180311-8ogps.json	253	download job
old.reddit.com-shallow-20200117-175129-9pseq-00000.warc.gz	5160789	download job
old.reddit.com-shallow-20200117-175129-9pseq-00000.warc.os.cdx.gz	9372	download
old.reddit.com-shallow-20200117-193621-ea0ge-00000.warc.gz	5176866	download job
old.reddit.com-shallow-20200117-193621-ea0ge-00000.warc.os.cdx.gz	9267	download
old.reddit.com-shallow-20200117-193621-ea0ge-meta.warc.gz	8688	download job
old.reddit.com-shallow-20200117-193621-ea0ge-meta.warc.os.cdx.gz	47	download
old.reddit.com-shallow-20200117-194213-43i86-00000.warc.gz	5070962	download job
old.reddit.com-shallow-20200117-194213-43i86-00000.warc.os.cdx.gz	8629	download
sana.sy-inf-20200112-134319-djgau-00015.warc.gz	5368798165	download job
sana.sy-inf-20200112-134319-djgau-00015.warc.os.cdx.gz	6371597	download
survivalblog.com-inf-20200111-040238-3gnon-00053.warc.gz	5368733018	download job
survivalblog.com-inf-20200111-040238-3gnon-00053.warc.os.cdx.gz	5666379	download
twitter.com-shallow-20200117-193629-2w73e-00000.warc.gz	2650962	download job
twitter.com-shallow-20200117-193629-2w73e-00000.warc.os.cdx.gz	5447	download
twitter.com-shallow-20200117-193629-2w73e-meta.warc.gz	6731	download job
twitter.com-shallow-20200117-193629-2w73e-meta.warc.os.cdx.gz	47	download
twitter.com-shallow-20200117-193629-2w73e.json	258	download job
urls-transfer.notkiska.pw-senate.gov-senators-websites-inf-20200110-173327-5e2rb-00034.warc.gz	5368904894	download job
urls-transfer.notkiska.pw-senate.gov-senators-websites-inf-20200110-173327-5e2rb-00034.warc.os.cdx.gz	6525995	download
urls-transfer.notkiska.pw-twitter-%23MacronDemission-shallow-20200116-204259-3eufy-meta.warc.gz	22059867	download job
urls-transfer.notkiska.pw-twitter-%23MacronDemission-shallow-20200116-204259-3eufy-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-%23MacronDemission-shallow-20200116-204259-3eufy-urls.txt	7442653	download
urls-transfer.notkiska.pw-twitter-%23PoliceBrutality-shallow-20200112-163831-3ird6-00083.warc.gz	5968428157	download job
urls-transfer.notkiska.pw-twitter-%23PoliceBrutality-shallow-20200112-163831-3ird6-00083.warc.os.cdx.gz	52676	download
urls-transfer.notkiska.pw-twitter-%23PoliceBrutality-shallow-20200112-163831-3ird6-00084.warc.gz	5794483556	download job
urls-transfer.notkiska.pw-twitter-%23PoliceBrutality-shallow-20200112-163831-3ird6-00084.warc.os.cdx.gz	593114	download
urls-transfer.notkiska.pw-twitter-%23PoliceBrutality-shallow-20200112-163831-3ird6-00085.warc.gz	5396740119	download job
urls-transfer.notkiska.pw-twitter-%23PoliceBrutality-shallow-20200112-163831-3ird6-00085.warc.os.cdx.gz	321886	download
urls-transfer.notkiska.pw-twitter-%23PoliceBrutality-shallow-20200112-163831-3ird6-00086.warc.gz	5380036510	download job
urls-transfer.notkiska.pw-twitter-%23PoliceBrutality-shallow-20200112-163831-3ird6-00086.warc.os.cdx.gz	250182	download
urls-transfer.notkiska.pw-twitter-%23PoliceBrutality-shallow-20200112-163831-3ird6-00087.warc.gz	5512409691	download job
urls-transfer.notkiska.pw-twitter-%23PoliceBrutality-shallow-20200112-163831-3ird6-00087.warc.os.cdx.gz	28628	download
urls-transfer.notkiska.pw-twitter-%23torreon-shallow-20200111-031907-8m5in-00029.warc.gz	5368994418	download job
urls-transfer.notkiska.pw-twitter-%23torreon-shallow-20200111-031907-8m5in-00029.warc.os.cdx.gz	1144109	download
urls-transfer.notkiska.pw-twitter-%23torreon-shallow-20200111-031907-8m5in-00030.warc.gz	5375885359	download job
urls-transfer.notkiska.pw-twitter-%23torreon-shallow-20200111-031907-8m5in-00030.warc.os.cdx.gz	1380115	download
urls-transfer.notkiska.pw-twitter-@RadioRelojCuba-shallow-20200116-174809-c8hn6-00001.warc.gz	2118243095	download job
urls-transfer.notkiska.pw-twitter-@RadioRelojCuba-shallow-20200116-174809-c8hn6-00001.warc.os.cdx.gz	2520828	download
urls-transfer.notkiska.pw-twitter-@RadioRelojCuba-shallow-20200116-174809-c8hn6-meta.warc.gz	8904181	download job
urls-transfer.notkiska.pw-twitter-@RadioRelojCuba-shallow-20200116-174809-c8hn6-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-@RadioRelojCuba-shallow-20200116-174809-c8hn6-urls.txt	6113300	download
urls-transfer.notkiska.pw-twitter-@RadioRelojCuba-shallow-20200116-174809-c8hn6.json	340	download job
urls-transfer.notkiska.pw-twitter-@Sahara_1951-shallow-20200114-223719-eznxb-00009.warc.gz	5895225749	download job
urls-transfer.notkiska.pw-twitter-@Sahara_1951-shallow-20200114-223719-eznxb-00009.warc.os.cdx.gz	8440506	download
urls-transfer.notkiska.pw-twitter-@Sahara_1951-shallow-20200114-223719-eznxb-meta.warc.gz	44916948	download job
urls-transfer.notkiska.pw-twitter-@Sahara_1951-shallow-20200114-223719-eznxb-meta.warc.os.cdx.gz	47	download
www.anywherecool.com-inf-20200117-172719-8v4b1-00000.warc.gz	7631202	download job
www.anywherecool.com-inf-20200117-172719-8v4b1-00000.warc.os.cdx.gz	5146	download
www.baylys.com-inf-20200117-170928-cummu-00000.warc.gz	195493722	download job
www.baylys.com-inf-20200117-170928-cummu-00000.warc.os.cdx.gz	263855	download
www.baylys.com-inf-20200117-170928-cummu-meta.warc.gz	178816	download job
www.baylys.com-inf-20200117-170928-cummu-meta.warc.os.cdx.gz	47	download
www.baylys.com-inf-20200117-170928-cummu.json	242	download job
www.chinadaily.com.cn-inf-20190927-102302-505np-00115.warc.gz	1073745448	download job
www.chinadaily.com.cn-inf-20190927-102302-505np-00115.warc.os.cdx.gz	1402969	download
www.eastsidedreams.com-inf-20200117-183610-55yaz-00000.warc.gz	3659329	download job
www.eastsidedreams.com-inf-20200117-183610-55yaz-00000.warc.os.cdx.gz	12680	download
www.eastsidedreams.com-inf-20200117-183610-55yaz-meta.warc.gz	10777	download job
www.eastsidedreams.com-inf-20200117-183610-55yaz-meta.warc.os.cdx.gz	47	download
www.eastsidedreams.com-inf-20200117-183610-55yaz.json	251	download job
www.gloriatayloredwards.com-inf-20200117-182510-dplm4-00000.warc.gz	2031635285	download job
www.gloriatayloredwards.com-inf-20200117-182510-dplm4-00000.warc.os.cdx.gz	774277	download
www.gloriatayloredwards.com-inf-20200117-182510-dplm4-meta.warc.gz	469044	download job
www.gloriatayloredwards.com-inf-20200117-182510-dplm4-meta.warc.os.cdx.gz	47	download
www.guitarfreescores.com-inf-20200117-180429-8bcue-00000.warc.gz	2825041999	download job
www.guitarfreescores.com-inf-20200117-180429-8bcue-00000.warc.os.cdx.gz	394609	download
www.guitarfreescores.com-inf-20200117-180429-8bcue-meta.warc.gz	255068	download job
www.guitarfreescores.com-inf-20200117-180429-8bcue-meta.warc.os.cdx.gz	47	download
www.guitarfreescores.com-inf-20200117-180429-8bcue.json	253	download job
www.kims-angelic-creations.com-inf-20200117-182131-36uuk-00000.warc.gz	5279614	download job
www.kims-angelic-creations.com-inf-20200117-182131-36uuk-00000.warc.os.cdx.gz	16687	download
www.kims-angelic-creations.com-inf-20200117-182131-36uuk-meta.warc.gz	14420	download job
www.kims-angelic-creations.com-inf-20200117-182131-36uuk-meta.warc.os.cdx.gz	47	download
www.kims-angelic-creations.com-inf-20200117-182131-36uuk.json	259	download job
www.mercury-and-queen.com-inf-20200117-183252-7kpag-00000.warc.gz	200414941	download job
www.mercury-and-queen.com-inf-20200117-183252-7kpag-00000.warc.os.cdx.gz	383041	download
www.mercury-and-queen.com-inf-20200117-183252-7kpag-meta.warc.gz	241516	download job
www.mercury-and-queen.com-inf-20200117-183252-7kpag-meta.warc.os.cdx.gz	47	download
www.mercury-and-queen.com-inf-20200117-183252-7kpag.json	253	download job
www.missamericanpie.co.uk-inf-20200117-170519-cxupc-00000.warc.gz	656954274	download job
www.missamericanpie.co.uk-inf-20200117-170519-cxupc-00000.warc.os.cdx.gz	657541	download
www.missamericanpie.co.uk-inf-20200117-170519-cxupc-meta.warc.gz	480147	download job
www.missamericanpie.co.uk-inf-20200117-170519-cxupc-meta.warc.os.cdx.gz	47	download
www.missamericanpie.co.uk-inf-20200117-170519-cxupc.json	254	download job
www.mordauntfamilyhistory.com-inf-20200117-171754-8aqdw-00000.warc.gz	1341283978	download job
www.mordauntfamilyhistory.com-inf-20200117-171754-8aqdw-00000.warc.os.cdx.gz	741636	download
www.mordauntfamilyhistory.com-inf-20200117-171754-8aqdw-meta.warc.gz	470091	download job
www.mordauntfamilyhistory.com-inf-20200117-171754-8aqdw-meta.warc.os.cdx.gz	47	download
www.mordauntfamilyhistory.com-inf-20200117-171754-8aqdw.json	257	download job
www.ninersnation.com-inf-20191224-082402-8nweq-00232.warc.gz	5428302845	download job
www.ninersnation.com-inf-20191224-082402-8nweq-00232.warc.os.cdx.gz	1539027	download
www.ninersnation.com-inf-20191224-082402-8nweq-00236.warc.gz	5372492958	download job
www.ninersnation.com-inf-20191224-082402-8nweq-00236.warc.os.cdx.gz	1650440	download
www.parliran.ir-inf-20200104-222244-8qwn2-00021.warc.gz	5382809251	download job
www.parliran.ir-inf-20200104-222244-8qwn2-00021.warc.os.cdx.gz	235995	download
www.popsugar.com-inf-20191008-053953-43mu2-00175.warc.gz	5368926381	download job
www.popsugar.com-inf-20191008-053953-43mu2-00175.warc.os.cdx.gz	6026206	download
www.ralphb.net-inf-20200113-051503-5zzms-00001.warc.gz	5375305641	download job
www.ralphb.net-inf-20200113-051503-5zzms-00001.warc.os.cdx.gz	1193228	download
www.ralphb.net-inf-20200113-051503-5zzms-00002.warc.gz	4509211009	download job
www.ralphb.net-inf-20200113-051503-5zzms-00002.warc.os.cdx.gz	4673562	download
www.ralphb.net-inf-20200113-051503-5zzms-meta.warc.gz	4038119	download job
www.ralphb.net-inf-20200113-051503-5zzms-meta.warc.os.cdx.gz	47	download
www.ralphb.net-inf-20200113-051503-5zzms.json	238	download job
www.ranil.uk-inf-20200113-062710-16oyy-00000.warc.gz	778601633	download job
www.ranil.uk-inf-20200113-062710-16oyy-00000.warc.os.cdx.gz	975389	download
www.ranil.uk-inf-20200113-062710-16oyy-meta.warc.gz	613757	download job
www.ranil.uk-inf-20200113-062710-16oyy-meta.warc.os.cdx.gz	47	download
www.ranil.uk-inf-20200113-062710-16oyy.json	242	download job
www.readinglibdems.org.uk-inf-20200113-062758-5cjq0-00000.warc.gz	211478656	download job
www.readinglibdems.org.uk-inf-20200113-062758-5cjq0-00000.warc.os.cdx.gz	584042	download
www.readinglibdems.org.uk-inf-20200113-062758-5cjq0-meta.warc.gz	367411	download job
www.readinglibdems.org.uk-inf-20200113-062758-5cjq0-meta.warc.os.cdx.gz	47	download
www.readinglibdems.org.uk-inf-20200113-062758-5cjq0.json	255	download job
www.rebeccagordon-nesbitt.org-inf-20200113-062809-7to2g-00000.warc.gz	230243644	download job
www.rebeccagordon-nesbitt.org-inf-20200113-062809-7to2g-00000.warc.os.cdx.gz	352903	download
www.rebeccagordon-nesbitt.org-inf-20200113-062809-7to2g-meta.warc.gz	276316	download job
www.rebeccagordon-nesbitt.org-inf-20200113-062809-7to2g-meta.warc.os.cdx.gz	47	download
www.rebeccagordon-nesbitt.org-inf-20200113-062809-7to2g.json	259	download job
www.renewparty.org.uk-inf-20200113-063656-9gdms-00000.warc.gz	1612202349	download job
www.renewparty.org.uk-inf-20200113-063656-9gdms-00000.warc.os.cdx.gz	1398115	download
www.renewparty.org.uk-inf-20200113-063656-9gdms-meta.warc.gz	981447	download job
www.renewparty.org.uk-inf-20200113-063656-9gdms-meta.warc.os.cdx.gz	47	download
www.renewparty.org.uk-inf-20200113-063656-9gdms.json	251	download job
www.ritzysofowensboro.com-inf-20200117-175942-5fzia-00000.warc.gz	13856458	download job
www.ritzysofowensboro.com-inf-20200117-175942-5fzia-00000.warc.os.cdx.gz	55170	download
www.ritzysofowensboro.com-inf-20200117-175942-5fzia-meta.warc.gz	35512	download job
www.ritzysofowensboro.com-inf-20200117-175942-5fzia-meta.warc.os.cdx.gz	47	download
www.ritzysofowensboro.com-inf-20200117-175942-5fzia.json	254	download job
www.robbiemoore.org.uk-inf-20200113-070829-1w5t5-00000.warc.gz	222121367	download job
www.robbiemoore.org.uk-inf-20200113-070829-1w5t5-00000.warc.os.cdx.gz	154181	download
www.robbiemoore.org.uk-inf-20200113-070829-1w5t5-meta.warc.gz	102361	download job
www.robbiemoore.org.uk-inf-20200113-070829-1w5t5-meta.warc.os.cdx.gz	47	download
www.robbiemoore.org.uk-inf-20200113-070829-1w5t5.json	252	download job
www.robertlargan.co.uk-inf-20200113-070917-pqtqq-00000.warc.gz	199848525	download job
www.robertlargan.co.uk-inf-20200113-070917-pqtqq-00000.warc.os.cdx.gz	255965	download
www.robertlargan.co.uk-inf-20200113-070917-pqtqq-meta.warc.gz	192496	download job
www.robertlargan.co.uk-inf-20200113-070917-pqtqq-meta.warc.os.cdx.gz	47	download
www.robertlargan.co.uk-inf-20200113-070917-pqtqq.json	252	download job
www.rt.com-shallow-20200110-220200-1tqdk-00000.warc.gz	6216988	download job
www.rt.com-shallow-20200110-220200-1tqdk-00000.warc.os.cdx.gz	11965	download
www.rt.com-shallow-20200110-220200-1tqdk-meta.warc.gz	10590	download job
www.rt.com-shallow-20200110-220200-1tqdk-meta.warc.os.cdx.gz	47	download
www.rt.com-shallow-20200110-220200-1tqdk.json	290	download job
www.ruthgripper.org.uk-inf-20200113-074142-dyhuo-00000.warc.gz	90557395	download job
www.ruthgripper.org.uk-inf-20200113-074142-dyhuo-00000.warc.os.cdx.gz	197966	download
www.ruthgripper.org.uk-inf-20200113-074142-dyhuo-meta.warc.gz	191350	download job
www.ruthgripper.org.uk-inf-20200113-074142-dyhuo-meta.warc.os.cdx.gz	47	download
www.ruthgripper.org.uk-inf-20200113-074142-dyhuo.json	252	download job
www.rutlandmeltonlabour.org.uk-inf-20200113-074314-v39j1-00000.warc.gz	29622810	download job
www.rutlandmeltonlabour.org.uk-inf-20200113-074314-v39j1-00000.warc.os.cdx.gz	63882	download
www.rutlandmeltonlabour.org.uk-inf-20200113-074314-v39j1-meta.warc.gz	47453	download job
www.rutlandmeltonlabour.org.uk-inf-20200113-074314-v39j1-meta.warc.os.cdx.gz	47	download
www.rutlandmeltonlabour.org.uk-inf-20200113-074314-v39j1.json	260	download job
www.ryanjones.wales-inf-20200113-074329-e90ll-00000.warc.gz	42188354	download job
www.ryanjones.wales-inf-20200113-074329-e90ll-00000.warc.os.cdx.gz	108514	download
www.ryanjones.wales-inf-20200113-074329-e90ll-meta.warc.gz	82830	download job
www.ryanjones.wales-inf-20200113-074329-e90ll-meta.warc.os.cdx.gz	47	download
www.ryanjones.wales-inf-20200113-074329-e90ll.json	249	download job
www.sactownroyalty.com-inf-20191221-232523-4qy6b-00052.warc.gz	5368784242	download job
www.sactownroyalty.com-inf-20191221-232523-4qy6b-00052.warc.os.cdx.gz	2498349	download
www.sactownroyalty.com-inf-20191221-232523-4qy6b-00053.warc.gz	5368783622	download job
www.sactownroyalty.com-inf-20191221-232523-4qy6b-00053.warc.os.cdx.gz	2298651	download
www.sparkytractor.com-inf-20200117-180538-n2ofa-00000.warc.gz	86521630	download job
www.sparkytractor.com-inf-20200117-180538-n2ofa-00000.warc.os.cdx.gz	156161	download
www.sparkytractor.com-inf-20200117-180538-n2ofa-meta.warc.gz	149381	download job
www.sparkytractor.com-inf-20200117-180538-n2ofa-meta.warc.os.cdx.gz	47	download
www.sparkytractor.com-inf-20200117-180538-n2ofa.json	249	download job
www.taringa.net-inf-20190927-205127-2a0h7-00210.warc.gz	5369659309	download job
www.taringa.net-inf-20190927-205127-2a0h7-00210.warc.os.cdx.gz	2966727	download
www.theguardian.com-inf-20200114-005916-7iuqz-00059.warc.gz	5368789898	download job
www.theguardian.com-inf-20200114-005916-7iuqz-00059.warc.os.cdx.gz	6064319	download
www.theroot.com-inf-20191211-013035-dr1fd-00246.warc.gz	5368741096	download job
www.theroot.com-inf-20191211-013035-dr1fd-00246.warc.os.cdx.gz	923625	download
www.thestranger.com-inf-20190827-222815-3hodl-00401.warc.gz	5439087930	download job
www.thestranger.com-inf-20190827-222815-3hodl-00401.warc.os.cdx.gz	3658033	download
www.thomaswhitemusic.com-inf-20200117-170354-dzcrf-00000.warc.gz	15537948	download job
www.thomaswhitemusic.com-inf-20200117-170354-dzcrf-00000.warc.os.cdx.gz	51983	download
www.tsukamaki.net-inf-20200117-171618-5f1k2-meta.warc.gz	292862	download job
www.tsukamaki.net-inf-20200117-171618-5f1k2-meta.warc.os.cdx.gz	47	download
www.twilightheadquarters.com-inf-20200117-172119-erzux-00000.warc.gz	1081866496	download job
www.twilightheadquarters.com-inf-20200117-172119-erzux-00000.warc.os.cdx.gz	964575	download
www.twilightheadquarters.com-inf-20200117-172119-erzux-meta.warc.gz	672013	download job
www.twilightheadquarters.com-inf-20200117-172119-erzux-meta.warc.os.cdx.gz	47	download
www.twilightheadquarters.com-inf-20200117-172119-erzux.json	256	download job
www.widgerwoodlabradors.com-inf-20200117-175502-2230w-00000.warc.gz	262041583	download job
www.widgerwoodlabradors.com-inf-20200117-175502-2230w-00000.warc.os.cdx.gz	114454	download
www.widgerwoodlabradors.com-inf-20200117-175502-2230w-meta.warc.gz	71971	download job
www.widgerwoodlabradors.com-inf-20200117-175502-2230w-meta.warc.os.cdx.gz	47	download
www.widgerwoodlabradors.com-inf-20200117-175502-2230w.json	255	download job
www.wolvesden.org-inf-20200117-180728-f4174-00000.warc.gz	57578461	download job
www.wolvesden.org-inf-20200117-180728-f4174-00000.warc.os.cdx.gz	177042	download
www.wolvesden.org-inf-20200117-180728-f4174-meta.warc.gz	113421	download job
www.wolvesden.org-inf-20200117-180728-f4174-meta.warc.os.cdx.gz	47	download
www.wolvesden.org-inf-20200117-180728-f4174.json	245	download job
yemenwar.info-inf-20200117-143414-chxpz-00000.warc.gz	4079890068	download job
yemenwar.info-inf-20200117-143414-chxpz-00000.warc.os.cdx.gz	1000174	download
yemenwar.info-inf-20200117-143414-chxpz-meta.warc.gz	620149	download job
yemenwar.info-inf-20200117-143414-chxpz-meta.warc.os.cdx.gz	47	download