Item archiveteam_archivebot_go_20200711190004

Filename	Size
aerospaceresearch.net-inf-20200711-071326-3k1n3-00000.warc.gz	1139894496	download job
aerospaceresearch.net-inf-20200711-071326-3k1n3-00000.warc.os.cdx.gz	1419278	download
aerospaceresearch.net-inf-20200711-071326-3k1n3-meta.warc.gz	929428	download job
aerospaceresearch.net-inf-20200711-071326-3k1n3-meta.warc.os.cdx.gz	47	download
aerospaceresearch.net-inf-20200711-071326-3k1n3.json	246	download job
againstthepagans.blogspot.com-inf-20200711-184230-99m4z-00000.warc.gz	96368135	download job
againstthepagans.blogspot.com-inf-20200711-184230-99m4z-00000.warc.os.cdx.gz	171638	download
ajmanzanedo.blogspot.com-inf-20200711-184232-4j23l-00000.warc.gz	268977112	download job
ajmanzanedo.blogspot.com-inf-20200711-184232-4j23l-00000.warc.os.cdx.gz	248711	download
archiveteam_archivebot_go_20200711190004.cdx.gz	139425474	download
archiveteam_archivebot_go_20200711190004.cdx.idx	119260	download
archiveteam_archivebot_go_20200711190004_files.xml	0	download
archiveteam_archivebot_go_20200711190004_meta.sqlite	292864	download
archiveteam_archivebot_go_20200711190004_meta.xml	969	download
bravehalflingpublishing.blogspot.com-inf-20200711-184932-bz7mh-00000.warc.gz	69518375	download job
bravehalflingpublishing.blogspot.com-inf-20200711-184932-bz7mh-00000.warc.os.cdx.gz	86773	download
bravehalflingpublishing.blogspot.com-inf-20200711-184932-bz7mh.json	261	download job
cdn1.ruarxive.org-inf-20200602-221412-82e21-00600.warc.gz	5550878047	download job
cdn1.ruarxive.org-inf-20200602-221412-82e21-00600.warc.os.cdx.gz	3704	download
ektoplazm.com-inf-20200704-233408-66i1h-00024.warc.gz	5540068952	download job
ektoplazm.com-inf-20200704-233408-66i1h-00024.warc.os.cdx.gz	4486	download
elderskull.blogspot.com-inf-20200711-171828-8qgyj-00000.warc.gz	539925383	download job
elderskull.blogspot.com-inf-20200711-171828-8qgyj-00000.warc.os.cdx.gz	624619	download
elderskull.blogspot.com-inf-20200711-171828-8qgyj-meta.warc.gz	428199	download job
elderskull.blogspot.com-inf-20200711-171828-8qgyj-meta.warc.os.cdx.gz	47	download
elderskull.blogspot.com-inf-20200711-171828-8qgyj.json	248	download job
forums.nextgames.com-inf-20200709-160247-15pvo-00008.warc.gz	5370369704	download job
forums.nextgames.com-inf-20200709-160247-15pvo-00008.warc.os.cdx.gz	1450393	download
getsatisfaction.com-inf-20200708-234031-epnla-00013.warc.gz	5368968198	download job
getsatisfaction.com-inf-20200708-234031-epnla-00013.warc.os.cdx.gz	5814356	download
huntersquarry.wordpress.com-inf-20200711-171814-enxf9-00000.warc.gz	1214681832	download job
huntersquarry.wordpress.com-inf-20200711-171814-enxf9-00000.warc.os.cdx.gz	521966	download
huntersquarry.wordpress.com-inf-20200711-171814-enxf9-meta.warc.gz	365180	download job
huntersquarry.wordpress.com-inf-20200711-171814-enxf9-meta.warc.os.cdx.gz	47	download
huntersquarry.wordpress.com-inf-20200711-171814-enxf9.json	252	download job
huth.wordpress.com-inf-20200711-171818-20p79-00000.warc.gz	777598788	download job
huth.wordpress.com-inf-20200711-171818-20p79-00000.warc.os.cdx.gz	371647	download
huth.wordpress.com-inf-20200711-171818-20p79-meta.warc.gz	269798	download job
huth.wordpress.com-inf-20200711-171818-20p79-meta.warc.os.cdx.gz	47	download
huth.wordpress.com-inf-20200711-171818-20p79.json	243	download job
idungeoncrawl.wordpress.com-inf-20200711-171849-9lhyk-00000.warc.gz	824849448	download job
idungeoncrawl.wordpress.com-inf-20200711-171849-9lhyk-00000.warc.os.cdx.gz	588712	download
idungeoncrawl.wordpress.com-inf-20200711-171849-9lhyk-meta.warc.gz	401200	download job
idungeoncrawl.wordpress.com-inf-20200711-171849-9lhyk-meta.warc.os.cdx.gz	47	download
idungeoncrawl.wordpress.com-inf-20200711-171849-9lhyk.json	252	download job
jackstoolbox.wordpress.com-inf-20200711-171853-bc1xq-00000.warc.gz	1221315203	download job
jackstoolbox.wordpress.com-inf-20200711-171853-bc1xq-00000.warc.os.cdx.gz	725495	download
jackstoolbox.wordpress.com-inf-20200711-171853-bc1xq-meta.warc.gz	518499	download job
jackstoolbox.wordpress.com-inf-20200711-171853-bc1xq-meta.warc.os.cdx.gz	47	download
jaspersrantings.blogspot.com-inf-20200711-171912-7ko53.json	253	download job
library.mibckerala.org-inf-20200711-082334-xtxyo-00011.warc.gz	5368878733	download job
library.mibckerala.org-inf-20200711-082334-xtxyo-00011.warc.os.cdx.gz	326227	download
library.mibckerala.org-inf-20200711-082334-xtxyo-00012.warc.gz	5369465508	download job
library.mibckerala.org-inf-20200711-082334-xtxyo-00012.warc.os.cdx.gz	556153	download
library.mibckerala.org-inf-20200711-082334-xtxyo-00013.warc.gz	5130703289	download job
library.mibckerala.org-inf-20200711-082334-xtxyo-00013.warc.os.cdx.gz	195226	download
library.mibckerala.org-inf-20200711-082334-xtxyo-meta.warc.gz	1530013	download job
library.mibckerala.org-inf-20200711-082334-xtxyo-meta.warc.os.cdx.gz	47	download
library.mibckerala.org-inf-20200711-082334-xtxyo.json	262	download job
luc.devroye.org-inf-20200629-195003-6kmq5-00049.warc.gz	5369662627	download job
luc.devroye.org-inf-20200629-195003-6kmq5-00049.warc.os.cdx.gz	3775373	download
mediaset.sdasofia.org-inf-20200709-091713-c8wet-00106.warc.gz	5376492208	download job
mediaset.sdasofia.org-inf-20200709-091713-c8wet-00106.warc.os.cdx.gz	1244501	download
mikemonaco.wordpress.com-inf-20200711-072259-7znak-00001.warc.gz	5409143056	download job
mikemonaco.wordpress.com-inf-20200711-072259-7znak-00001.warc.os.cdx.gz	3545756	download
mikemonaco.wordpress.com-inf-20200711-072259-7znak-00002.warc.gz	2076825660	download job
mikemonaco.wordpress.com-inf-20200711-072259-7znak-00002.warc.os.cdx.gz	1244199	download
mikemonaco.wordpress.com-inf-20200711-072259-7znak-meta.warc.gz	5189690	download job
mikemonaco.wordpress.com-inf-20200711-072259-7znak-meta.warc.os.cdx.gz	47	download
mikemonaco.wordpress.com-inf-20200711-072259-7znak.json	249	download job
mystop.tistory.com-inf-20200711-064610-9fz5n-00000.warc.gz	4164778748	download job
mystop.tistory.com-inf-20200711-064610-9fz5n-00000.warc.os.cdx.gz	3751381	download
mystop.tistory.com-inf-20200711-064610-9fz5n-meta.warc.gz	2528359	download job
mystop.tistory.com-inf-20200711-064610-9fz5n-meta.warc.os.cdx.gz	47	download
mystop.tistory.com-inf-20200711-064610-9fz5n.json	243	download job
new.12377.cn-inf-20200710-201841-4uz15-00002.warc.gz	5100521644	download job
new.12377.cn-inf-20200710-201841-4uz15-00002.warc.os.cdx.gz	4228068	download
new.12377.cn-inf-20200710-201841-4uz15-meta.warc.gz	5517278	download job
new.12377.cn-inf-20200710-201841-4uz15-meta.warc.os.cdx.gz	47	download
new.12377.cn-inf-20200710-201841-4uz15.json	242	download job
olctsd.wordpress.com-inf-20200711-172712-b6x8a-meta.warc.gz	465505	download job
olctsd.wordpress.com-inf-20200711-172712-b6x8a-meta.warc.os.cdx.gz	47	download
ominosity.wordpress.com-inf-20200711-172715-a8vbd-00000.warc.gz	790171979	download job
ominosity.wordpress.com-inf-20200711-172715-a8vbd-00000.warc.os.cdx.gz	453991	download
ominosity.wordpress.com-inf-20200711-172715-a8vbd-meta.warc.gz	326705	download job
ominosity.wordpress.com-inf-20200711-172715-a8vbd-meta.warc.os.cdx.gz	47	download
ominosity.wordpress.com-inf-20200711-172715-a8vbd.json	248	download job
redboxvancouver.wordpress.com-inf-20200711-172720-336cg-00000.warc.gz	1493273277	download job
redboxvancouver.wordpress.com-inf-20200711-172720-336cg-00000.warc.os.cdx.gz	960770	download
seevaa.tistory.com-inf-20200711-054757-2ry21-00004.warc.gz	5387762370	download job
seevaa.tistory.com-inf-20200711-054757-2ry21-00004.warc.os.cdx.gz	3025475	download
skarlocs.wordpress.com-inf-20200711-172727-7ktvu-00000.warc.gz	3557670597	download job
skarlocs.wordpress.com-inf-20200711-172727-7ktvu-00000.warc.os.cdx.gz	972261	download
starmonkey.wordpress.com-inf-20200711-172732-3im47-00000.warc.gz	1065333237	download job
starmonkey.wordpress.com-inf-20200711-172732-3im47-00000.warc.os.cdx.gz	396150	download
starmonkey.wordpress.com-inf-20200711-172732-3im47-meta.warc.gz	281142	download job
starmonkey.wordpress.com-inf-20200711-172732-3im47-meta.warc.os.cdx.gz	47	download
starmonkey.wordpress.com-inf-20200711-172732-3im47.json	249	download job
urls-archive.max.fan-twitter-@CarverPolice-filtered.txt-shallow-20200711-184655-3udi8-urls.txt	49250	download
urls-archive.max.fan-twitter-@ChelmsfordPD-filtered.txt-shallow-20200711-184654-2ww4y-meta.warc.gz	104949	download job
urls-archive.max.fan-twitter-@ChelmsfordPD-filtered.txt-shallow-20200711-184654-2ww4y-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@ChelmsfordPD-filtered.txt-shallow-20200711-184654-2ww4y.json	339	download job
urls-archive.max.fan-twitter-@ChiefCantu111-filtered.txt-shallow-20200711-184515-ch2h9-00000.warc.gz	164029900	download job
urls-archive.max.fan-twitter-@ChiefCantu111-filtered.txt-shallow-20200711-184515-ch2h9-00000.warc.os.cdx.gz	216193	download
urls-archive.max.fan-twitter-@ChiefGalea-filtered.txt-shallow-20200711-184453-55xv3-meta.warc.gz	14142	download job
urls-archive.max.fan-twitter-@ChiefGalea-filtered.txt-shallow-20200711-184453-55xv3-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@ChiefGalea-filtered.txt-shallow-20200711-184453-55xv3-urls.txt	2424	download
urls-archive.max.fan-twitter-@ChiefGalea-filtered.txt-shallow-20200711-184453-55xv3.json	335	download job
urls-archive.max.fan-twitter-@ChiefMcNeilSPD-filtered.txt-shallow-20200711-184104-ac0fw-meta.warc.gz	58891	download job
urls-archive.max.fan-twitter-@ChiefMcNeilSPD-filtered.txt-shallow-20200711-184104-ac0fw-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@ChiefMcNeilSPD-filtered.txt-shallow-20200711-184104-ac0fw-urls.txt	33191	download
urls-archive.max.fan-twitter-@ChiefMillerCPD-filtered.txt-shallow-20200711-183925-adr1j-meta.warc.gz	86557	download job
urls-archive.max.fan-twitter-@ChiefMillerCPD-filtered.txt-shallow-20200711-183925-adr1j-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@ChiefShughes-filtered.txt-shallow-20200711-183646-dwmc9-meta.warc.gz	132886	download job
urls-archive.max.fan-twitter-@ChiefShughes-filtered.txt-shallow-20200711-183646-dwmc9-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@Chief_Navarro-filtered.txt-shallow-20200711-183831-955d4.json	341	download job
urls-archive.max.fan-twitter-@CityofLowellMA-filtered.txt-shallow-20200711-183347-1pvr4-00000.warc.gz	129501646	download job
urls-archive.max.fan-twitter-@CityofLowellMA-filtered.txt-shallow-20200711-183347-1pvr4-00000.warc.os.cdx.gz	191558	download
urls-archive.max.fan-twitter-@CityofLowellMA-filtered.txt-shallow-20200711-183347-1pvr4.json	343	download job
urls-archive.max.fan-twitter-@CohassetPolice-filtered.txt-shallow-20200711-183341-d29sk-00000.warc.gz	200910290	download job
urls-archive.max.fan-twitter-@CohassetPolice-filtered.txt-shallow-20200711-183341-d29sk-00000.warc.os.cdx.gz	212524	download
urls-archive.max.fan-twitter-@CohassetPolice-filtered.txt-shallow-20200711-183341-d29sk-meta.warc.gz	116841	download job
urls-archive.max.fan-twitter-@CohassetPolice-filtered.txt-shallow-20200711-183341-d29sk-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@CohassetPolice-filtered.txt-shallow-20200711-183341-d29sk.json	343	download job
urls-archive.max.fan-twitter-@DanversPolice-filtered.txt-shallow-20200711-183149-t2wj9-meta.warc.gz	188870	download job
urls-archive.max.fan-twitter-@DanversPolice-filtered.txt-shallow-20200711-183149-t2wj9-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@DanversPolice-filtered.txt-shallow-20200711-183149-t2wj9.json	341	download job
urls-archive.max.fan-twitter-@DedhamPD-filtered.txt-shallow-20200711-183149-5r1nz-00000.warc.gz	232478600	download job
urls-archive.max.fan-twitter-@DedhamPD-filtered.txt-shallow-20200711-183149-5r1nz-00000.warc.os.cdx.gz	252952	download
urls-archive.max.fan-twitter-@DeerfieldMAPD-filtered.txt-shallow-20200711-183148-agg5q-00000.warc.gz	45551160	download job
urls-archive.max.fan-twitter-@DeerfieldMAPD-filtered.txt-shallow-20200711-183148-agg5q-00000.warc.os.cdx.gz	52142	download
urls-archive.max.fan-twitter-@DeerfieldMAPD-filtered.txt-shallow-20200711-183148-agg5q-urls.txt	20100	download
urls-archive.max.fan-twitter-@DoverMAChief-filtered.txt-shallow-20200711-183148-555re-urls.txt	34971	download
urls-archive.max.fan-twitter-@DoverNHPolice-filtered.txt-shallow-20200711-183028-dmf4q-00000.warc.gz	59145034	download job
urls-archive.max.fan-twitter-@DoverNHPolice-filtered.txt-shallow-20200711-183028-dmf4q-00000.warc.os.cdx.gz	78251	download
urls-archive.max.fan-twitter-@EBPolice-filtered.txt-shallow-20200711-182815-6cvjb.json	331	download job
urls-archive.max.fan-twitter-@EastonMapd-filtered.txt-shallow-20200711-182907-ehreb.json	335	download job
urls-archive.max.fan-twitter-@Essex_PD-filtered.txt-shallow-20200711-182812-153d0-meta.warc.gz	21083	download job
urls-archive.max.fan-twitter-@Essex_PD-filtered.txt-shallow-20200711-182812-153d0-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@Essex_PD-filtered.txt-shallow-20200711-182812-153d0-urls.txt	14399	download
urls-archive.max.fan-twitter-@Essex_PD-filtered.txt-shallow-20200711-182812-153d0.json	331	download job
urls-archive.max.fan-twitter-@FallRiverPD-filtered.txt-shallow-20200711-182634-93u43-00000.warc.gz	44094752	download job
urls-archive.max.fan-twitter-@FallRiverPD-filtered.txt-shallow-20200711-182634-93u43-00000.warc.os.cdx.gz	65418	download
urls-archive.max.fan-twitter-@FallRiverPD-filtered.txt-shallow-20200711-182634-93u43-meta.warc.gz	39490	download job
urls-archive.max.fan-twitter-@FallRiverPD-filtered.txt-shallow-20200711-182634-93u43-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@FallRiverPD-filtered.txt-shallow-20200711-182634-93u43.json	337	download job
urls-archive.max.fan-twitter-@FitchburgPolice-filtered.txt-shallow-20200711-182412-4ev11-00000.warc.gz	97047355	download job
urls-archive.max.fan-twitter-@FitchburgPolice-filtered.txt-shallow-20200711-182412-4ev11-00000.warc.os.cdx.gz	133459	download
urls-archive.max.fan-twitter-@FoxboroughPD-filtered.txt-shallow-20200711-182412-3dsyj-urls.txt	21122	download
urls-archive.max.fan-twitter-@FraminghamFire-filtered.txt-shallow-20200711-181850-dw4a1-urls.txt	59247	download
urls-archive.max.fan-twitter-@FraminghamPD-filtered.txt-shallow-20200711-181848-df29w-00000.warc.gz	491586502	download job
urls-archive.max.fan-twitter-@FraminghamPD-filtered.txt-shallow-20200711-181848-df29w-00000.warc.os.cdx.gz	391555	download
urls-archive.max.fan-twitter-@FraminghamPD-filtered.txt-shallow-20200711-181848-df29w-urls.txt	203216	download
urls-archive.max.fan-twitter-@FraminghamPD-filtered.txt-shallow-20200711-181848-df29w.json	339	download job
urls-archive.max.fan-twitter-@GardnerMassPD-filtered.txt-shallow-20200711-181841-eym54-urls.txt	4663	download
urls-archive.max.fan-twitter-@GloucesterPD-filtered.txt-shallow-20200711-181836-852ej.json	339	download job
urls-archive.max.fan-twitter-@GraftonPolice-filtered.txt-shallow-20200711-181832-2z650-00000.warc.gz	173230566	download job
urls-archive.max.fan-twitter-@GraftonPolice-filtered.txt-shallow-20200711-181832-2z650-00000.warc.os.cdx.gz	182326	download
urls-archive.max.fan-twitter-@GreenfieldPD-filtered.txt-shallow-20200711-181825-cvvlc-00000.warc.gz	227178531	download job
urls-archive.max.fan-twitter-@GreenfieldPD-filtered.txt-shallow-20200711-181825-cvvlc-00000.warc.os.cdx.gz	242986	download
urls-archive.max.fan-twitter-@GrovelandPolice-filtered.txt-shallow-20200711-181829-9fd9h-00000.warc.gz	43931258	download job
urls-archive.max.fan-twitter-@GrovelandPolice-filtered.txt-shallow-20200711-181829-9fd9h-00000.warc.os.cdx.gz	42913	download
urls-archive.max.fan-twitter-@HamptonNHPD-filtered.txt-shallow-20200711-181821-ckvst-urls.txt	53970	download
urls-archive.max.fan-twitter-@HamptonNHPD-filtered.txt-shallow-20200711-181821-ckvst.json	337	download job
urls-archive.max.fan-twitter-@HanoverPolice-filtered.txt-shallow-20200711-181729-79ov8-urls.txt	175280	download
urls-archive.max.fan-twitter-@HansonMAPolice-filtered.txt-shallow-20200711-181728-cruo5.json	343	download job
urls-archive.max.fan-twitter-@HaverhillPolice-filtered.txt-shallow-20200711-181607-ddh2z-meta.warc.gz	77873	download job
urls-archive.max.fan-twitter-@HaverhillPolice-filtered.txt-shallow-20200711-181607-ddh2z-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@Holbrook_PD-filtered.txt-shallow-20200711-181607-5kbv8-00000.warc.gz	18346538	download job
urls-archive.max.fan-twitter-@Holbrook_PD-filtered.txt-shallow-20200711-181607-5kbv8-00000.warc.os.cdx.gz	21762	download
urls-archive.max.fan-twitter-@HollisPolice-filtered.txt-shallow-20200711-181348-c0tgq.json	339	download job
urls-archive.max.fan-twitter-@HollistonPolice-filtered.txt-shallow-20200711-181348-c8k2u-meta.warc.gz	189099	download job
urls-archive.max.fan-twitter-@HollistonPolice-filtered.txt-shallow-20200711-181348-c8k2u-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@HollistonPolice-filtered.txt-shallow-20200711-181348-c8k2u-urls.txt	135174	download
urls-archive.max.fan-twitter-@HopkintonFire-filtered.txt-shallow-20200711-181257-dwhtm.json	341	download job
urls-archive.max.fan-twitter-@HubPD-filtered.txt-shallow-20200711-181230-11e94-00000.warc.gz	118244725	download job
urls-archive.max.fan-twitter-@HubPD-filtered.txt-shallow-20200711-181230-11e94-00000.warc.os.cdx.gz	103094	download
urls-archive.max.fan-twitter-@HubPD-filtered.txt-shallow-20200711-181230-11e94.json	325	download job
urls-archive.max.fan-twitter-@HudsonMaPD-filtered.txt-shallow-20200711-181202-39tpb-urls.txt	29447	download
urls-archive.max.fan-twitter-@HudsonMaPD-filtered.txt-shallow-20200711-181202-39tpb.json	335	download job
urls-archive.max.fan-twitter-@LAPDChiefMoore-filtered.txt-shallow-20200711-181025-32ilu-00000.warc.gz	332235143	download job
urls-archive.max.fan-twitter-@LAPDChiefMoore-filtered.txt-shallow-20200711-181025-32ilu-00000.warc.os.cdx.gz	496732	download
urls-archive.max.fan-twitter-@LAPDChiefMoore-filtered.txt-shallow-20200711-181025-32ilu-urls.txt	52266	download
urls-archive.max.fan-twitter-@LAPDChiefMoore-filtered.txt-shallow-20200711-181025-32ilu.json	343	download job
urls-archive.max.fan-twitter-@LaconiaNHPolice-filtered.txt-shallow-20200711-181137-b3y4a-urls.txt	40842	download
urls-archive.max.fan-twitter-@LeominsterPD-filtered.txt-shallow-20200711-180930-42hin-meta.warc.gz	12212	download job
urls-archive.max.fan-twitter-@LeominsterPD-filtered.txt-shallow-20200711-180930-42hin-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@MAEnviroPolice-filtered.txt-shallow-20200711-175721-9826c.json	343	download job
urls-archive.max.fan-twitter-@ManchesterMAPD-filtered.txt-shallow-20200711-175720-13epu.json	343	download job
urls-archive.max.fan-twitter-@MarlboroughMaPD-filtered.txt-shallow-20200711-175719-5i7h7-00000.warc.gz	61896011	download job
urls-archive.max.fan-twitter-@MarlboroughMaPD-filtered.txt-shallow-20200711-175719-5i7h7-00000.warc.os.cdx.gz	75689	download
urls-archive.max.fan-twitter-@MarlboroughMaPD-filtered.txt-shallow-20200711-175719-5i7h7.json	345	download job
urls-archive.max.fan-twitter-@chiefbradleyupd-filtered.txt-shallow-20200711-184515-9pg1j-urls.txt	4410	download
urls-archive.max.fan-twitter-@chiefpaulcell-filtered.txt-shallow-20200711-183831-5tv6n-meta.warc.gz	3410	download job
urls-archive.max.fan-twitter-@chiefpaulcell-filtered.txt-shallow-20200711-183831-5tv6n-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@dovermapd-filtered.txt-shallow-20200711-183147-3s7xi-00000.warc.gz	151925135	download job
urls-archive.max.fan-twitter-@dovermapd-filtered.txt-shallow-20200711-183147-3s7xi-00000.warc.os.cdx.gz	198640	download
urls-archive.max.fan-twitter-@dovermapd-filtered.txt-shallow-20200711-183147-3s7xi-urls.txt	96737	download
urls-archive.max.fan-twitter-@elpdsro-filtered.txt-shallow-20200711-182812-6xew2-00000.warc.gz	2532	download job
urls-archive.max.fan-twitter-@elpdsro-filtered.txt-shallow-20200711-182812-6xew2-00000.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@elpdsro-filtered.txt-shallow-20200711-182812-6xew2-urls.txt	0	download
urls-archive.max.fan-twitter-@htownfockey2014-filtered.txt-shallow-20200711-181233-bjqvf-urls.txt	4526	download
urls-archive.max.fan-twitter-@htowngrlssoccer-filtered.txt-shallow-20200711-181231-bakxm.json	345	download job
urls-archive.max.fan-twitter-@kpd_policechief-filtered.txt-shallow-20200711-181137-shsvc-meta.warc.gz	9737	download job
urls-archive.max.fan-twitter-@kpd_policechief-filtered.txt-shallow-20200711-181137-shsvc-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@kpd_policechief-filtered.txt-shallow-20200711-181137-shsvc-urls.txt	1438	download
urls-archive.max.fan-twitter-@lawrencepolice-filtered.txt-shallow-20200711-181019-44j9d-urls.txt	62	download
urls-archive.max.fan-twitter-@machiefpo-filtered.txt-shallow-20200711-175721-9j93i-00000.warc.gz	1994559	download job
urls-archive.max.fan-twitter-@machiefpo-filtered.txt-shallow-20200711-175721-9j93i-00000.warc.os.cdx.gz	6693	download
urls-archive.max.fan-twitter-@machiefpo-filtered.txt-shallow-20200711-175721-9j93i-meta.warc.gz	7692	download job
urls-archive.max.fan-twitter-@machiefpo-filtered.txt-shallow-20200711-175721-9j93i-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@machiefpo-filtered.txt-shallow-20200711-175721-9j93i-urls.txt	840	download
urls-archive.max.fan-twitter-@machiefpo-filtered.txt-shallow-20200711-175721-9j93i.json	333	download job
urls-archive.max.fan-twitter-@nytimes-filtered.txt-shallow-20200710-213818-4f3nw-00005.warc.gz	5368709791	download job
urls-archive.max.fan-twitter-@nytimes-filtered.txt-shallow-20200710-213818-4f3nw-00005.warc.os.cdx.gz	44680425	download
urls-archive.max.fan-twitter-@nytimes-filtered.txt-shallow-20200710-213818-4f3nw-00006.warc.gz	5368789878	download job
urls-archive.max.fan-twitter-@nytimes-filtered.txt-shallow-20200710-213818-4f3nw-00006.warc.os.cdx.gz	23821047	download
urls-transfer.notkiska.pw-twitter-%23BlackHistoryMonth-shallow-20200610-132545-46qdq-00196.warc.gz	5418724983	download job
urls-transfer.notkiska.pw-twitter-%23BlackHistoryMonth-shallow-20200610-132545-46qdq-00196.warc.os.cdx.gz	2168174	download
urls-transfer.notkiska.pw-twitter-%23HongKong-shallow-20191011-144913-dze3i-00264.warc.gz	5371839752	download job
urls-transfer.notkiska.pw-twitter-%23HongKong-shallow-20191011-144913-dze3i-00264.warc.os.cdx.gz	1574255	download
urls-transfer.notkiska.pw-twitter-%23WorldRefugeeDay-shallow-20200605-213315-5wxzx-00068.warc.gz	5401440588	download job
urls-transfer.notkiska.pw-twitter-%23WorldRefugeeDay-shallow-20200605-213315-5wxzx-00068.warc.os.cdx.gz	5942438	download
urls-transfer.notkiska.pw-twitter-%23notmypresident-shallow-20200530-220957-2c0z0-00116.warc.gz	5907510917	download job
urls-transfer.notkiska.pw-twitter-%23notmypresident-shallow-20200530-220957-2c0z0-00116.warc.os.cdx.gz	1591161	download
urls-transfer.notkiska.pw-twitter-%23notmypresident-shallow-20200530-220957-2c0z0-00117.warc.gz	5405298020	download job
urls-transfer.notkiska.pw-twitter-%23notmypresident-shallow-20200530-220957-2c0z0-00117.warc.os.cdx.gz	2241889	download
urls-transfer.notkiska.pw-twitter-%23qanon-shallow-20200531-053932-8yw79-00072.warc.gz	5368981966	download job
urls-transfer.notkiska.pw-twitter-%23qanon-shallow-20200531-053932-8yw79-00072.warc.os.cdx.gz	5983792	download
urls-transfer.notkiska.pw-twitter-@Supermorff-shallow-20200711-172755-cv4u4-00000.warc.gz	108599699	download job
urls-transfer.notkiska.pw-twitter-@Supermorff-shallow-20200711-172755-cv4u4-00000.warc.os.cdx.gz	182090	download
urls-transfer.notkiska.pw-twitter-@Supermorff-shallow-20200711-172755-cv4u4-meta.warc.gz	112427	download job
urls-transfer.notkiska.pw-twitter-@Supermorff-shallow-20200711-172755-cv4u4-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-@Supermorff-shallow-20200711-172755-cv4u4-urls.txt	16849	download
urls-transfer.notkiska.pw-twitter-@Supermorff-shallow-20200711-172755-cv4u4.json	332	download job
urls-transfer.notkiska.pw-twitter-@take_yama06-shallow-20200711-170257-6pu67-00000.warc.gz	203286274	download job
urls-transfer.notkiska.pw-twitter-@take_yama06-shallow-20200711-170257-6pu67-00000.warc.os.cdx.gz	218476	download
urls-transfer.notkiska.pw-twitter-@take_yama06-shallow-20200711-170257-6pu67-meta.warc.gz	122409	download job
urls-transfer.notkiska.pw-twitter-@take_yama06-shallow-20200711-170257-6pu67-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-@take_yama06-shallow-20200711-170257-6pu67-urls.txt	30464	download
urls-transfer.notkiska.pw-twitter-@take_yama06-shallow-20200711-170257-6pu67.json	334	download job
wilper.wordpress.com-inf-20200711-173603-8w7oy-00000.warc.gz	2008131588	download job
wilper.wordpress.com-inf-20200711-173603-8w7oy-00000.warc.os.cdx.gz	885270	download
www.chrishuth.com-inf-20200711-171821-abhw3-00000.warc.gz	79922182	download job
www.chrishuth.com-inf-20200711-171821-abhw3-00000.warc.os.cdx.gz	88243	download
www.chrishuth.com-inf-20200711-171821-abhw3-meta.warc.gz	54538	download job
www.chrishuth.com-inf-20200711-171821-abhw3-meta.warc.os.cdx.gz	47	download
www.chrishuth.com-inf-20200711-171821-abhw3.json	241	download job
www.instagram.com-inf-20200711-171956-1j3yq-00000.warc.gz	13253993	download job
www.instagram.com-inf-20200711-171956-1j3yq-00000.warc.os.cdx.gz	29089	download
www.instagram.com-inf-20200711-171956-1j3yq-meta.warc.gz	22807	download job
www.instagram.com-inf-20200711-171956-1j3yq-meta.warc.os.cdx.gz	47	download
www.instagram.com-inf-20200711-171956-1j3yq.json	254	download job
www.notcot.com-inf-20200709-213423-116f3-00014.warc.gz	5368809542	download job
www.notcot.com-inf-20200709-213423-116f3-00014.warc.os.cdx.gz	3055308	download
www.qiagen.com-inf-20200621-061202-1wax4-00022.warc.gz	5369074262	download job
www.qiagen.com-inf-20200621-061202-1wax4-00022.warc.os.cdx.gz	3281798	download
www.seniorsnews.com.au-inf-20200528-062104-cuuvc-00109.warc.gz	5373329511	download job
www.seniorsnews.com.au-inf-20200528-062104-cuuvc-00109.warc.os.cdx.gz	3799511	download
www.seniorsnews.com.au-inf-20200528-062104-cuuvc-00110.warc.gz	5491967903	download job
www.seniorsnews.com.au-inf-20200528-062104-cuuvc-00110.warc.os.cdx.gz	166084	download
www.turiver.com-inf-20200629-212723-6d3re-00026.warc.gz	5383214764	download job
www.turiver.com-inf-20200629-212723-6d3re-00026.warc.os.cdx.gz	4636536	download