Item archiveteam_archivebot_go_20201108180002

Filename	Size
archiveteam_archivebot_go_20201108180002.cdx.gz	41053506	download
archiveteam_archivebot_go_20201108180002.cdx.idx	39559	download
archiveteam_archivebot_go_20201108180002_files.xml	0	download
archiveteam_archivebot_go_20201108180002_meta.sqlite	242688	download
archiveteam_archivebot_go_20201108180002_meta.xml	968	download
en.wikipedia.org-shallow-20201108-160640-53kn6-meta.warc.gz	6335	download job
en.wikipedia.org-shallow-20201108-160640-53kn6-meta.warc.os.cdx.gz	47	download
en.wikipedia.org-shallow-20201108-160656-emhf8-meta.warc.gz	10282	download job
en.wikipedia.org-shallow-20201108-160656-emhf8-meta.warc.os.cdx.gz	47	download
events.jo20.com-inf-20201108-152801-bsykm-00000.warc.gz	5444344541	download job
events.jo20.com-inf-20201108-152801-bsykm-00000.warc.os.cdx.gz	1700653	download
hastebin.com-shallow-20201108-170244-9r9vi-00000.warc.gz	101797	download job
hastebin.com-shallow-20201108-170244-9r9vi-00000.warc.os.cdx.gz	714	download
hastebin.com-shallow-20201108-170244-9r9vi-meta.warc.gz	3731	download job
hastebin.com-shallow-20201108-170244-9r9vi-meta.warc.os.cdx.gz	47	download
hastebin.com-shallow-20201108-170252-7j5xy-00000.warc.gz	4826	download job
hastebin.com-shallow-20201108-170252-7j5xy-00000.warc.os.cdx.gz	231	download
hastebin.com-shallow-20201108-170252-7j5xy-meta.warc.gz	3412	download job
hastebin.com-shallow-20201108-170252-7j5xy-meta.warc.os.cdx.gz	47	download
hastebin.com-shallow-20201108-170252-7j5xy.json	261	download job
hastebin.com-shallow-20201108-170309-650x7-00000.warc.gz	97175	download job
hastebin.com-shallow-20201108-170309-650x7-00000.warc.os.cdx.gz	228	download
hastebin.com-shallow-20201108-170309-650x7-meta.warc.gz	3462	download job
hastebin.com-shallow-20201108-170309-650x7-meta.warc.os.cdx.gz	47	download
hastebin.com-shallow-20201108-170309-650x7.json	261	download job
litter.catbox.moe-shallow-20201108-170253-ey3z6-00000.warc.gz	20261918	download job
litter.catbox.moe-shallow-20201108-170253-ey3z6-00000.warc.os.cdx.gz	234	download
loomered.com-inf-20201106-094038-22m97-00011.warc.gz	5377557388	download job
loomered.com-inf-20201106-094038-22m97-00011.warc.os.cdx.gz	662512	download
my.elizabethwarren.com-inf-20201108-142057-1xmm1-meta.warc.gz	16468	download job
my.elizabethwarren.com-inf-20201108-142057-1xmm1-meta.warc.os.cdx.gz	47	download
nagi.ee-inf-20200928-222120-1mnfk-00075.warc.gz	5368740271	download job
nagi.ee-inf-20200928-222120-1mnfk-00075.warc.os.cdx.gz	15613021	download
news.tulsigabbard.com-inf-20201108-140105-covu6-00000.warc.gz	2759161858	download job
news.tulsigabbard.com-inf-20201108-140105-covu6-00000.warc.os.cdx.gz	155411	download
phoenix.maemo.org-inf-20200926-232644-ektr9-00265.warc.gz	5532802199	download job
phoenix.maemo.org-inf-20200926-232644-ektr9-00265.warc.os.cdx.gz	194922	download
reddy4congress.com-inf-20201108-084733-4c2nb-meta.warc.gz	61654	download job
reddy4congress.com-inf-20201108-084733-4c2nb-meta.warc.os.cdx.gz	47	download
reddy4congress.com-inf-20201108-084733-4c2nb.json	243	download job
secure.winred.com-inf-20201108-164734-c7b7j-00000.warc.gz	11053004	download job
secure.winred.com-inf-20201108-164734-c7b7j-00000.warc.os.cdx.gz	17270	download
secure.winred.com-inf-20201108-164734-c7b7j-meta.warc.gz	14300	download job
secure.winred.com-inf-20201108-164734-c7b7j-meta.warc.os.cdx.gz	47	download
sylviaforcongress.com-inf-20201108-092050-45kng-00000.warc.gz	129672080	download job
sylviaforcongress.com-inf-20201108-092050-45kng-00000.warc.os.cdx.gz	175613	download
sylviaforcongress.com-inf-20201108-092050-45kng-meta.warc.gz	121695	download job
sylviaforcongress.com-inf-20201108-092050-45kng-meta.warc.os.cdx.gz	47	download
trumpaccountability.squarespace.com-inf-20201108-145736-oynca-meta.warc.gz	82006	download job
trumpaccountability.squarespace.com-inf-20201108-145736-oynca-meta.warc.os.cdx.gz	47	download
trumpaccountability.squarespace.com-inf-20201108-145736-oynca.json	265	download job
trumptide.us-inf-20201108-165415-f3oad-meta.warc.gz	265664	download job
trumptide.us-inf-20201108-165415-f3oad-meta.warc.os.cdx.gz	47	download
trumptide.us-inf-20201108-165415-f3oad.json	241	download job
urls-archive.max.fan-twitter-@BuzzPatterson-20201103T193421Z.txt-shallow-20201107-065815-e9ob8-00026.warc.gz	2504851816	download job
urls-archive.max.fan-twitter-@BuzzPatterson-20201103T193421Z.txt-shallow-20201107-065815-e9ob8-00026.warc.os.cdx.gz	1851773	download
urls-archive.max.fan-twitter-@Collias4NC11-20201104T085541Z.txt-shallow-20201108-073736-6gsxl-00000.warc.gz	5498465597	download job
urls-archive.max.fan-twitter-@Collias4NC11-20201104T085541Z.txt-shallow-20201108-073736-6gsxl-00000.warc.os.cdx.gz	1451093	download
urls-archive.max.fan-twitter-@CollinsWilmot-20201104T135924Z.txt-shallow-20201108-143801-5prx5-00000.warc.gz	5401440327	download job
urls-archive.max.fan-twitter-@CollinsWilmot-20201104T135924Z.txt-shallow-20201108-143801-5prx5-00000.warc.os.cdx.gz	647959	download
urls-archive.max.fan-twitter-@CollinsWilmot-20201104T135924Z.txt-shallow-20201108-143801-5prx5-00001.warc.gz	5402576420	download job
urls-archive.max.fan-twitter-@CollinsWilmot-20201104T135924Z.txt-shallow-20201108-143801-5prx5-00001.warc.os.cdx.gz	577871	download
urls-archive.max.fan-twitter-@CollinsWilmot-20201104T135924Z.txt-shallow-20201108-143801-5prx5-meta.warc.gz	877719	download job
urls-archive.max.fan-twitter-@CollinsWilmot-20201104T135924Z.txt-shallow-20201108-143801-5prx5-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@CollinsWilmot-20201104T135924Z.txt-shallow-20201108-143801-5prx5-urls.txt	46084	download
urls-archive.max.fan-twitter-@CollinsWilmot-20201104T135924Z.txt-shallow-20201108-143801-5prx5.json	381	download job
urls-archive.max.fan-twitter-@CollinsforGA-20201104T042302Z.txt-shallow-20201108-143733-b0lws-00000.warc.gz	13780003	download job
urls-archive.max.fan-twitter-@CollinsforGA-20201104T042302Z.txt-shallow-20201108-143733-b0lws-00000.warc.os.cdx.gz	33232	download
urls-archive.max.fan-twitter-@CollisDr-20201104T063909Z.txt-shallow-20201108-143812-572iz-00000.warc.gz	257939484	download job
urls-archive.max.fan-twitter-@CollisDr-20201104T063909Z.txt-shallow-20201108-143812-572iz-00000.warc.os.cdx.gz	291903	download
urls-archive.max.fan-twitter-@CongMikeSimpson-20201103T215147Z.txt-shallow-20201108-144639-uf217-00000.warc.gz	3821204638	download job
urls-archive.max.fan-twitter-@CongMikeSimpson-20201103T215147Z.txt-shallow-20201108-144639-uf217-00000.warc.os.cdx.gz	2614472	download
urls-archive.max.fan-twitter-@CongMikeSimpson-20201103T215147Z.txt-shallow-20201108-144639-uf217.json	385	download job
urls-archive.max.fan-twitter-@CongMikeSimpson-20201104T042446Z.txt-shallow-20201108-144709-79u2e-00000.warc.gz	10436624	download job
urls-archive.max.fan-twitter-@CongMikeSimpson-20201104T042446Z.txt-shallow-20201108-144709-79u2e-00000.warc.os.cdx.gz	11918	download
urls-archive.max.fan-twitter-@CongMikeSimpson-20201104T042446Z.txt-shallow-20201108-144709-79u2e-meta.warc.gz	10482	download job
urls-archive.max.fan-twitter-@CongMikeSimpson-20201104T042446Z.txt-shallow-20201108-144709-79u2e-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@CongPalazzo-20201104T064221Z.txt-shallow-20201108-144713-2qgko-00000.warc.gz	5368830723	download job
urls-archive.max.fan-twitter-@CongPalazzo-20201104T064221Z.txt-shallow-20201108-144713-2qgko-00000.warc.os.cdx.gz	3687528	download
urls-archive.max.fan-twitter-@Congress4_IDLaw-20201103T215205Z.txt-shallow-20201108-145245-4v6t0-urls.txt	29461	download
urls-archive.max.fan-twitter-@Congress4_IDLaw-20201103T215205Z.txt-shallow-20201108-145245-4v6t0.json	385	download job
urls-archive.max.fan-twitter-@CongressEd-20201104T143723Z.txt-shallow-20201108-145450-1qmtr-00000.warc.gz	9680624	download job
urls-archive.max.fan-twitter-@CongressEd-20201104T143723Z.txt-shallow-20201108-145450-1qmtr-00000.warc.os.cdx.gz	20691	download
urls-archive.max.fan-twitter-@CongressLandon-20201104T094145Z.txt-shallow-20201108-145807-dbofo-meta.warc.gz	527087	download job
urls-archive.max.fan-twitter-@CongressLandon-20201104T094145Z.txt-shallow-20201108-145807-dbofo-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@CongressLandon-20201104T094145Z.txt-shallow-20201108-145807-dbofo-urls.txt	41343	download
urls-archive.max.fan-twitter-@CongressLandon-20201104T094145Z.txt-shallow-20201108-145807-dbofo.json	383	download job
urls-archive.max.fan-twitter-@CongressLawton4-20201103T201059Z.txt-shallow-20201108-151812-3j48j-00000.warc.gz	5408098856	download job
urls-archive.max.fan-twitter-@CongressLawton4-20201103T201059Z.txt-shallow-20201108-151812-3j48j-00000.warc.os.cdx.gz	684265	download
urls-archive.max.fan-twitter-@CongressLawton4-20201103T201059Z.txt-shallow-20201108-151812-3j48j-00002.warc.gz	5379848750	download job
urls-archive.max.fan-twitter-@CongressLawton4-20201103T201059Z.txt-shallow-20201108-151812-3j48j-00002.warc.os.cdx.gz	30147	download
urls-archive.max.fan-twitter-@chrisjollyhale-20201104T102827Z.txt-shallow-20201108-011757-5rxhh-00003.warc.gz	5368894168	download job
urls-archive.max.fan-twitter-@chrisjollyhale-20201104T102827Z.txt-shallow-20201108-011757-5rxhh-00003.warc.os.cdx.gz	689030	download
urls-archive.max.fan-twitter-@chrisjollyhale-20201104T102827Z.txt-shallow-20201108-011757-5rxhh-00004.warc.gz	5412747565	download job
urls-archive.max.fan-twitter-@chrisjollyhale-20201104T102827Z.txt-shallow-20201108-011757-5rxhh-00004.warc.os.cdx.gz	582073	download
urls-archive.max.fan-twitter-@chrisjollyhale-20201104T102827Z.txt-shallow-20201108-011757-5rxhh-00006.warc.gz	5514549422	download job
urls-archive.max.fan-twitter-@chrisjollyhale-20201104T102827Z.txt-shallow-20201108-011757-5rxhh-00006.warc.os.cdx.gz	124469	download
urls-archive.max.fan-twitter-@claraha74184453-20201104T144544Z.txt-shallow-20201108-060300-a6fa3-meta.warc.gz	1521757	download job
urls-archive.max.fan-twitter-@claraha74184453-20201104T144544Z.txt-shallow-20201108-060300-a6fa3-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@claraha74184453-20201104T144544Z.txt-shallow-20201108-060300-a6fa3.json	385	download job
urls-archive.max.fan-twitter-@claudiatenney-20201104T083618Z.txt-shallow-20201108-061809-2bxqa-00003.warc.gz	5723041976	download job
urls-archive.max.fan-twitter-@claudiatenney-20201104T083618Z.txt-shallow-20201108-061809-2bxqa-00003.warc.os.cdx.gz	74720	download
urls-archive.max.fan-twitter-@claudiatenney-20201104T083618Z.txt-shallow-20201108-061809-2bxqa-00004.warc.gz	5497015547	download job
urls-archive.max.fan-twitter-@claudiatenney-20201104T083618Z.txt-shallow-20201108-061809-2bxqa-00004.warc.os.cdx.gz	33492	download
urls-archive.max.fan-twitter-@congbillposey-20201103T210555Z.txt-shallow-20201108-144138-dpnoo-urls.txt	118985	download
urls-archive.max.fan-twitter-@congbillposey-20201104T042131Z.txt-shallow-20201108-144618-8rkt5-00000.warc.gz	5544044	download job
urls-archive.max.fan-twitter-@congbillposey-20201104T042131Z.txt-shallow-20201108-144618-8rkt5-00000.warc.os.cdx.gz	11264	download
urls-archive.max.fan-twitter-@congbillposey-20201104T042131Z.txt-shallow-20201108-144618-8rkt5-urls.txt	218	download
urls-archive.max.fan-twitter-@congress2020_j-20201103T201012Z.txt-shallow-20201108-144807-5350t-00000.warc.gz	20872113	download job
urls-archive.max.fan-twitter-@congress2020_j-20201103T201012Z.txt-shallow-20201108-144807-5350t-00000.warc.os.cdx.gz	62574	download
urls-archive.max.fan-twitter-@congress2020_j-20201103T201012Z.txt-shallow-20201108-144807-5350t-meta.warc.gz	41403	download job
urls-archive.max.fan-twitter-@congress2020_j-20201103T201012Z.txt-shallow-20201108-144807-5350t-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@congress_dan-20201103T213415Z.txt-shallow-20201108-145437-4ta7n-00001.warc.gz	5774981529	download job
urls-archive.max.fan-twitter-@congress_dan-20201103T213415Z.txt-shallow-20201108-145437-4ta7n-00001.warc.os.cdx.gz	28278	download
urls-archive.max.fan-twitter-@congress_dan-20201103T213415Z.txt-shallow-20201108-145437-4ta7n-urls.txt	184787	download
urls-archive.max.fan-twitter-@congress_dan-20201103T213415Z.txt-shallow-20201108-145437-4ta7n.json	379	download job
urls-archive.max.fan-twitter-@congress_dan-20201104T042314Z.txt-shallow-20201108-145437-7l8nf-meta.warc.gz	7379	download job
urls-archive.max.fan-twitter-@congress_dan-20201104T042314Z.txt-shallow-20201108-145437-7l8nf-meta.warc.os.cdx.gz	47	download
urls-archive.max.fan-twitter-@congress_dan-20201104T042314Z.txt-shallow-20201108-145437-7l8nf.json	379	download job
urls-transfer.notkiska.pw-twitter-@ElectionTask-shallow-20201108-170213-6ruj1-00000.warc.gz	5390025303	download job
urls-transfer.notkiska.pw-twitter-@ElectionTask-shallow-20201108-170213-6ruj1-00000.warc.os.cdx.gz	631794	download
urls-transfer.notkiska.pw-twitter-@HariSevugan-shallow-20201108-150914-d6a1c-00000.warc.gz	5368809100	download job
urls-transfer.notkiska.pw-twitter-@HariSevugan-shallow-20201108-150914-d6a1c-00000.warc.os.cdx.gz	2284419	download
urls-transfer.notkiska.pw-twitter-@MaxBoot-shallow-20201107-201453-5og92-00007.warc.gz	5381027586	download job
urls-transfer.notkiska.pw-twitter-@MaxBoot-shallow-20201107-201453-5og92-00007.warc.os.cdx.gz	290287	download
urls-transfer.notkiska.pw-twitter-@MaxBoot-shallow-20201107-201453-5og92-00009.warc.gz	5443142008	download job
urls-transfer.notkiska.pw-twitter-@MaxBoot-shallow-20201107-201453-5og92-00009.warc.os.cdx.gz	800562	download
urls-transfer.notkiska.pw-twitter-@MaxBoot-shallow-20201107-201453-5og92-00012.warc.gz	5740774331	download job
urls-transfer.notkiska.pw-twitter-@MaxBoot-shallow-20201107-201453-5og92-00012.warc.os.cdx.gz	453632	download
urls-transfer.notkiska.pw-twitter-@MaxBoot-shallow-20201107-201453-5og92-00016.warc.gz	5405852080	download job
urls-transfer.notkiska.pw-twitter-@MaxBoot-shallow-20201107-201453-5og92-00016.warc.os.cdx.gz	271115	download
urls-transfer.notkiska.pw-twitter-@MaxBoot-shallow-20201107-201453-5og92-00017.warc.gz	5382002357	download job
urls-transfer.notkiska.pw-twitter-@MaxBoot-shallow-20201107-201453-5og92-00017.warc.os.cdx.gz	451352	download
urls-transfer.notkiska.pw-twitter-@MaxBoot-shallow-20201107-201453-5og92-00019.warc.gz	5373427847	download job
urls-transfer.notkiska.pw-twitter-@MaxBoot-shallow-20201107-201453-5og92-00019.warc.os.cdx.gz	793897	download
urls-transfer.notkiska.pw-twitter-@PawbyBun-shallow-20201108-092141-bxxvp-00000.warc.gz	27003581	download job
urls-transfer.notkiska.pw-twitter-@PawbyBun-shallow-20201108-092141-bxxvp-00000.warc.os.cdx.gz	46859	download
urls-transfer.notkiska.pw-twitter-@PawbyBun-shallow-20201108-092141-bxxvp-urls.txt	8417	download
urls-transfer.notkiska.pw-twitter-@murray_nyc-shallow-20201107-201645-2hkew.json	334	download job
urls-transfer.notkiska.pw-twitter-search-RemembranceDay%20min_retweets:50-shallow-20201108-170426-4by4t-00000.warc.gz	251837511	download
urls-transfer.notkiska.pw-twitter-search-RemembranceDay%20min_retweets:50-shallow-20201108-170426-4by4t-00000.warc.os.cdx.gz	604154	download
urls-transfer.notkiska.pw-twitter-search-RemembranceDay%20min_retweets:50-shallow-20201108-170426-4by4t-meta.warc.gz	323636	download
urls-transfer.notkiska.pw-twitter-search-RemembranceDay%20min_retweets:50-shallow-20201108-170426-4by4t-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-search-RemembranceDay%20min_retweets:50-shallow-20201108-170426-4by4t-urls.txt	23834	download
urls-transfer.notkiska.pw-twitter-search-TrumpOut%20min_retweets:20-shallow-20201108-092052-cs80j-meta.warc.gz	797671	download
urls-transfer.notkiska.pw-twitter-search-TrumpOut%20min_retweets:20-shallow-20201108-092052-cs80j-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-search-TrumpOut%20min_retweets:20-shallow-20201108-092052-cs80j-urls.txt	64429	download
urls-transfer.notkiska.pw-twitter-search-TrumpOut%20min_retweets:20-shallow-20201108-092052-cs80j.json	376	download
urls-transfer.notkiska.pw-twitter-search-Vote2020%20since:2020-11-01%20until:2020-11-8%20min_retweets:100-shallow-20201108-132850-96ijm-aborted-wpull.log.gz	89673	download
urls-transfer.notkiska.pw-twitter-search-Vote2020%20since:2020-11-01%20until:2020-11-8%20min_retweets:100-shallow-20201108-132850-96ijm-urls.txt	12049717	download
vanwinkleforcongress.com-inf-20201108-084257-erloo.json	249	download job
votehermes.com-inf-20201108-085854-1mo0o-00000.warc.gz	26148	download job
votehermes.com-inf-20201108-085854-1mo0o-00000.warc.os.cdx.gz	589	download
votehermes.com-inf-20201108-085854-1mo0o-meta.warc.gz	3833	download job
votehermes.com-inf-20201108-085854-1mo0o-meta.warc.os.cdx.gz	47	download
votehindman.com-inf-20201108-080812-alqhk-00000.warc.gz	2466	download job
votehindman.com-inf-20201108-080812-alqhk-00000.warc.os.cdx.gz	47	download
votehindman.com-inf-20201108-080812-alqhk.json	239	download job
votevessali.com-inf-20201108-081502-1l5r2-00000.warc.gz	12074890	download job
votevessali.com-inf-20201108-081502-1l5r2-00000.warc.os.cdx.gz	13524	download
votevessali.com-inf-20201108-081502-1l5r2.json	240	download job
wibailoutpeople.org-inf-20201107-152406-7a7zr-00013.warc.gz	5382861241	download job
wibailoutpeople.org-inf-20201107-152406-7a7zr-00013.warc.os.cdx.gz	1364531	download
www.abhiram.us-inf-20201108-085800-7jjw2-00000.warc.gz	23644990	download job
www.abhiram.us-inf-20201108-085800-7jjw2-00000.warc.os.cdx.gz	93512	download
www.abhiram.us-inf-20201108-085800-7jjw2-meta.warc.gz	128184	download job
www.abhiram.us-inf-20201108-085800-7jjw2-meta.warc.os.cdx.gz	47	download
www.bethfortexas.com-inf-20201108-084218-9v9l0-00000.warc.gz	241524657	download job
www.bethfortexas.com-inf-20201108-084218-9v9l0-00000.warc.os.cdx.gz	164799	download
www.bethfortexas.com-inf-20201108-084218-9v9l0-meta.warc.gz	101607	download job
www.bethfortexas.com-inf-20201108-084218-9v9l0-meta.warc.os.cdx.gz	47	download
www.bethfortexas.com-inf-20201108-084218-9v9l0.json	245	download job
www.brandonbatch.com-inf-20201108-084035-9bmxo-meta.warc.gz	3557	download job
www.brandonbatch.com-inf-20201108-084035-9bmxo-meta.warc.os.cdx.gz	47	download
www.brandonbatch.com-inf-20201108-084035-9bmxo.json	245	download job
www.capitol.tn.gov-shallow-20201108-163706-1ukhm.json	268	download job
www.caseygraycongresstx11.com-inf-20201108-083812-4yeds.json	254	download job
www.catherineiswearcarrforcongress.com-inf-20201108-083628-7pw9b-00000.warc.gz	2512	download job
www.catherineiswearcarrforcongress.com-inf-20201108-083628-7pw9b-00000.warc.os.cdx.gz	47	download
www.catherineiswearcarrforcongress.com-inf-20201108-083628-7pw9b.json	263	download job
www.cecilburtonjones.com-inf-20201108-083449-7xgsv-00000.warc.gz	48421927	download job
www.cecilburtonjones.com-inf-20201108-083449-7xgsv-00000.warc.os.cdx.gz	73170	download
www.cecilburtonjones.com-inf-20201108-083449-7xgsv-meta.warc.gz	103001	download job
www.cecilburtonjones.com-inf-20201108-083449-7xgsv-meta.warc.os.cdx.gz	47	download
www.facebook.com-shallow-20201108-152619-516se-meta.warc.gz	12659	download job
www.facebook.com-shallow-20201108-152619-516se-meta.warc.os.cdx.gz	47	download
www.factcheckzuck.com-inf-20201108-164505-3wven-meta.warc.gz	18078	download job
www.factcheckzuck.com-inf-20201108-164505-3wven-meta.warc.os.cdx.gz	47	download
www.factcheckzuck.com-inf-20201108-164505-3wven.json	251	download job
www.fcv2020.com-inf-20201108-081229-cgxqn-00000.warc.gz	108638566	download job
www.fcv2020.com-inf-20201108-081229-cgxqn-00000.warc.os.cdx.gz	116646	download
www.fcv2020.com-inf-20201108-081229-cgxqn.json	240	download job
www.gcforcongress.com-inf-20201108-080950-exysx-00000.warc.gz	712636089	download job
www.gcforcongress.com-inf-20201108-080950-exysx-00000.warc.os.cdx.gz	789292	download
www.gcforcongress.com-inf-20201108-080950-exysx-meta.warc.gz	534567	download job
www.gcforcongress.com-inf-20201108-080950-exysx-meta.warc.os.cdx.gz	47	download
www.gcforcongress.com-inf-20201108-080950-exysx.json	246	download job
www.hmdb.org-inf-20201018-175958-aboei-00275.warc.gz	5378697023	download job
www.hmdb.org-inf-20201018-175958-aboei-00275.warc.os.cdx.gz	174784	download
www.howardsteele.com-inf-20201108-080644-63zg7-00000.warc.gz	10472	download job
www.howardsteele.com-inf-20201108-080644-63zg7-00000.warc.os.cdx.gz	299	download
www.howardsteele.com-inf-20201108-080644-63zg7-meta.warc.gz	3496	download job
www.howardsteele.com-inf-20201108-080644-63zg7-meta.warc.os.cdx.gz	47	download
www.jodeyarrington.com-inf-20201108-080133-9qhl1-00000.warc.gz	232844264	download job
www.jodeyarrington.com-inf-20201108-080133-9qhl1-00000.warc.os.cdx.gz	281048	download
www.johncarterforcongress.com-inf-20201108-075547-1dzz9-00000.warc.gz	206418355	download job
www.johncarterforcongress.com-inf-20201108-075547-1dzz9-00000.warc.os.cdx.gz	312884	download
www.njweedman.com-inf-20201108-070907-amoah-00000.warc.gz	5371296042	download job
www.njweedman.com-inf-20201108-070907-amoah-00000.warc.os.cdx.gz	1753644	download
www.nytimes.com-shallow-20201107-182407-52slo-00000.warc.gz	71102213	download job
www.nytimes.com-shallow-20201107-182407-52slo-00000.warc.os.cdx.gz	49769	download
www.politico.com-shallow-20201108-055843-a0j7u-00000.warc.gz	3705516	download job
www.politico.com-shallow-20201108-055843-a0j7u-00000.warc.os.cdx.gz	9818	download
www.politico.com-shallow-20201108-055843-a0j7u-meta.warc.gz	9994	download job
www.politico.com-shallow-20201108-055843-a0j7u-meta.warc.os.cdx.gz	47	download
www.scstatehouse.gov-shallow-20201107-232357-48qwi-meta.warc.gz	5508	download job
www.scstatehouse.gov-shallow-20201107-232357-48qwi-meta.warc.os.cdx.gz	47	download
www.wbrz.com-shallow-20201108-055851-54dre-00000.warc.gz	13563107	download job
www.wbrz.com-shallow-20201108-055851-54dre-00000.warc.os.cdx.gz	33318	download
www.yelp.com-shallow-20201108-073359-4iz1q-00000.warc.gz	4739423	download job
www.yelp.com-shallow-20201108-073359-4iz1q-00000.warc.os.cdx.gz	15104	download
www.yelp.com-shallow-20201108-073359-4iz1q-meta.warc.gz	13035	download job
www.yelp.com-shallow-20201108-073359-4iz1q-meta.warc.os.cdx.gz	47	download