Item archiveteam_archivebot_go_20200203050003

Filename	Size
archiveteam_archivebot_go_20200203050003.cdx.gz	64741895	download
archiveteam_archivebot_go_20200203050003.cdx.idx	64780	download
archiveteam_archivebot_go_20200203050003_files.xml	0	download
archiveteam_archivebot_go_20200203050003_meta.sqlite	235520	download
archiveteam_archivebot_go_20200203050003_meta.xml	1018	download
butterfly.ontarioinsects.org-inf-20200203-022551-aksq2.json	257	download job
community.brownpapertickets.com-inf-20200202-170858-5zwfs-00006.warc.gz	5368859702	download job
community.brownpapertickets.com-inf-20200202-170858-5zwfs-00006.warc.os.cdx.gz	2271353	download
cyberrodeo.com-inf-20200202-222828-6mssr-00000.warc.gz	5397257585	download job
cyberrodeo.com-inf-20200202-222828-6mssr-00000.warc.os.cdx.gz	3421132	download
entomofaune.qc.ca-inf-20200203-032944-d6msu-00000.warc.gz	1446987209	download job
entomofaune.qc.ca-inf-20200203-032944-d6msu-00000.warc.os.cdx.gz	1747631	download
entomofaune.qc.ca-inf-20200203-032944-d6msu-meta.warc.gz	1016522	download job
entomofaune.qc.ca-inf-20200203-032944-d6msu-meta.warc.os.cdx.gz	47	download
entomofaune.qc.ca-inf-20200203-032944-d6msu.json	246	download job
entomoravia.eu-inf-20200203-035945-386gf-00000.warc.gz	16673509	download job
entomoravia.eu-inf-20200203-035945-386gf-00000.warc.os.cdx.gz	36602	download
entomoravia.eu-inf-20200203-035945-386gf-meta.warc.gz	25017	download job
entomoravia.eu-inf-20200203-035945-386gf-meta.warc.os.cdx.gz	47	download
entomoravia.eu-inf-20200203-035945-386gf.json	244	download job
news.abs-cbn.com-inf-20200123-190204-awyod-00022.warc.gz	5368971907	download job
news.abs-cbn.com-inf-20200123-190204-awyod-00022.warc.os.cdx.gz	6402167	download
ottawa.moths.ca-inf-20200203-025639-cmqs1-00000.warc.gz	5369640316	download job
ottawa.moths.ca-inf-20200203-025639-cmqs1-00000.warc.os.cdx.gz	187008	download
ottawa.moths.ca-inf-20200203-025639-cmqs1-00001.warc.gz	5373584073	download job
ottawa.moths.ca-inf-20200203-025639-cmqs1-00001.warc.os.cdx.gz	37481	download
ottawa.moths.ca-inf-20200203-025639-cmqs1-00002.warc.gz	5382954425	download job
ottawa.moths.ca-inf-20200203-025639-cmqs1-00002.warc.os.cdx.gz	32076	download
ottawa.moths.ca-inf-20200203-025639-cmqs1-00003.warc.gz	3784593814	download job
ottawa.moths.ca-inf-20200203-025639-cmqs1-00003.warc.os.cdx.gz	415849	download
ottawa.moths.ca-inf-20200203-025639-cmqs1-meta.warc.gz	423752	download job
ottawa.moths.ca-inf-20200203-025639-cmqs1-meta.warc.os.cdx.gz	47	download
ottawa.moths.ca-inf-20200203-025639-cmqs1.json	244	download job
seeclickfix.com-inf-20191012-203853-am48d-00231.warc.gz	5368714515	download job
seeclickfix.com-inf-20191012-203853-am48d-00231.warc.os.cdx.gz	6846819	download
some-jw-things.tumblr.com-inf-20200202-225359-49dle.json	256	download job
spotlight.nudge.ai-inf-20200123-185237-d8fjm-00044.warc.gz	5387646106	download job
spotlight.nudge.ai-inf-20200123-185237-d8fjm-00044.warc.os.cdx.gz	1376111	download
urls-transfer.notkiska.pw-facebook-@HangingHillsBrewing-shallow-20200203-031713-3waa2-00000.warc.gz	738243574	download job
urls-transfer.notkiska.pw-facebook-@HangingHillsBrewing-shallow-20200203-031713-3waa2-00000.warc.os.cdx.gz	727455	download
urls-transfer.notkiska.pw-facebook-@HangingHillsBrewing-shallow-20200203-031713-3waa2-meta.warc.gz	507882	download job
urls-transfer.notkiska.pw-facebook-@HangingHillsBrewing-shallow-20200203-031713-3waa2-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-facebook-@HangingHillsBrewing-shallow-20200203-031713-3waa2-urls.txt	146616	download
urls-transfer.notkiska.pw-facebook-@issfb-shallow-20200203-015625-9ko8q-meta.warc.gz	136939	download job
urls-transfer.notkiska.pw-facebook-@issfb-shallow-20200203-015625-9ko8q-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-facebook-@issfb-shallow-20200203-015625-9ko8q-urls.txt	14872	download
urls-transfer.notkiska.pw-galeon.com-subdomains-01-inf-20200130-170341-7gyu7-00004.warc.gz	5369296991	download job
urls-transfer.notkiska.pw-galeon.com-subdomains-01-inf-20200130-170341-7gyu7-00004.warc.os.cdx.gz	5347033	download
urls-transfer.notkiska.pw-galeon.com-subdomains-06-inf-20200130-170429-axbga-00007.warc.gz	2475	download job
urls-transfer.notkiska.pw-galeon.com-subdomains-06-inf-20200130-170429-axbga-00007.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-galeon.com-subdomains-06-inf-20200130-170429-axbga-urls.txt	311137	download
urls-transfer.notkiska.pw-galeon.com-subdomains-07-inf-20200130-170453-2efmi-00003.warc.gz	3759965276	download job
urls-transfer.notkiska.pw-galeon.com-subdomains-07-inf-20200130-170453-2efmi-00003.warc.os.cdx.gz	5069563	download
urls-transfer.notkiska.pw-galeon.com-subdomains-07-inf-20200130-170453-2efmi-meta.warc.gz	17004471	download job
urls-transfer.notkiska.pw-galeon.com-subdomains-07-inf-20200130-170453-2efmi-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-galeon.com-subdomains-07-inf-20200130-170453-2efmi-urls.txt	311131	download
urls-transfer.notkiska.pw-galeon.com-subdomains-07-inf-20200130-170453-2efmi.json	332	download job
urls-transfer.notkiska.pw-instagram-@hanginghillsbrewing-inf-20200203-031457-2hy8g-00000.warc.gz	1184779293	download job
urls-transfer.notkiska.pw-instagram-@hanginghillsbrewing-inf-20200203-031457-2hy8g-00000.warc.os.cdx.gz	993688	download
urls-transfer.notkiska.pw-instagram-@hanginghillsbrewing-inf-20200203-031457-2hy8g-meta.warc.gz	1303691	download job
urls-transfer.notkiska.pw-instagram-@hanginghillsbrewing-inf-20200203-031457-2hy8g-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-instagram-@hanginghillsbrewing-inf-20200203-031457-2hy8g-urls.txt	71541	download
urls-transfer.notkiska.pw-instagram-@hanginghillsbrewing-inf-20200203-031457-2hy8g.json	350	download job
urls-transfer.notkiska.pw-senate.gov-senators-websites-inf-20200110-173327-5e2rb-00193.warc.gz	5371686523	download job
urls-transfer.notkiska.pw-senate.gov-senators-websites-inf-20200110-173327-5e2rb-00193.warc.os.cdx.gz	1144391	download
urls-transfer.notkiska.pw-senate.gov-senators-websites-inf-20200110-173327-5e2rb-00194.warc.gz	5388052310	download job
urls-transfer.notkiska.pw-senate.gov-senators-websites-inf-20200110-173327-5e2rb-00194.warc.os.cdx.gz	210985	download
urls-transfer.notkiska.pw-senate.gov-senators-websites-inf-20200110-173327-5e2rb-00195.warc.gz	5369526955	download job
urls-transfer.notkiska.pw-senate.gov-senators-websites-inf-20200110-173327-5e2rb-00195.warc.os.cdx.gz	145844	download
urls-transfer.notkiska.pw-twitter-%23goldenglobes-shallow-20200108-102809-8zzp6-00156.warc.gz	5369022948	download job
urls-transfer.notkiska.pw-twitter-%23goldenglobes-shallow-20200108-102809-8zzp6-00156.warc.os.cdx.gz	2826293	download
urls-transfer.notkiska.pw-twitter-@BPTickets-shallow-20200202-171413-910ze-00006.warc.gz	4794042832	download job
urls-transfer.notkiska.pw-twitter-@BPTickets-shallow-20200202-171413-910ze-00006.warc.os.cdx.gz	2605115	download
urls-transfer.notkiska.pw-twitter-@BPTickets-shallow-20200202-171413-910ze-meta.warc.gz	4752727	download job
urls-transfer.notkiska.pw-twitter-@BPTickets-shallow-20200202-171413-910ze-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-@BPTickets-shallow-20200202-171413-910ze-urls.txt	912353	download
urls-transfer.notkiska.pw-twitter-@BPTickets-shallow-20200202-171413-910ze.json	330	download job
urls-transfer.notkiska.pw-twitter-@BeanCreative-shallow-20200202-232105-1q97x-meta.warc.gz	1118621	download job
urls-transfer.notkiska.pw-twitter-@BeanCreative-shallow-20200202-232105-1q97x-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-@ChuckGrassley-shallow-20200202-234732-d71rg-meta.warc.gz	1657228	download job
urls-transfer.notkiska.pw-twitter-@ChuckGrassley-shallow-20200202-234732-d71rg-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-@HHillsBeer-shallow-20200203-031413-67kyi-00000.warc.gz	1520415370	download job
urls-transfer.notkiska.pw-twitter-@HHillsBeer-shallow-20200203-031413-67kyi-00000.warc.os.cdx.gz	1436294	download
urls-transfer.notkiska.pw-twitter-@HHillsBeer-shallow-20200203-031413-67kyi-meta.warc.gz	831430	download job
urls-transfer.notkiska.pw-twitter-@HHillsBeer-shallow-20200203-031413-67kyi-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-@HHillsBeer-shallow-20200203-031413-67kyi-urls.txt	379313	download
urls-transfer.notkiska.pw-twitter-@HHillsBeer-shallow-20200203-031413-67kyi.json	332	download job
urls-transfer.notkiska.pw-twitter-@JimInhofe-shallow-20200203-030107-k5n0e-00000.warc.gz	373186269	download job
urls-transfer.notkiska.pw-twitter-@JimInhofe-shallow-20200203-030107-k5n0e-00000.warc.os.cdx.gz	898330	download
urls-transfer.notkiska.pw-twitter-@JimInhofe-shallow-20200203-030107-k5n0e-meta.warc.gz	484713	download job
urls-transfer.notkiska.pw-twitter-@JimInhofe-shallow-20200203-030107-k5n0e-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-@JimInhofe-shallow-20200203-030107-k5n0e-urls.txt	120630	download
urls-transfer.notkiska.pw-twitter-@JimInhofe-shallow-20200203-030107-k5n0e.json	329	download job
urls-transfer.notkiska.pw-twitter-@gillibrandny-shallow-20200203-025938-t3mz5-00000.warc.gz	109714404	download job
urls-transfer.notkiska.pw-twitter-@gillibrandny-shallow-20200203-025938-t3mz5-00000.warc.os.cdx.gz	305644	download
urls-transfer.notkiska.pw-twitter-@gillibrandny-shallow-20200203-025938-t3mz5-meta.warc.gz	167314	download job
urls-transfer.notkiska.pw-twitter-@gillibrandny-shallow-20200203-025938-t3mz5-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-twitter-@gillibrandny-shallow-20200203-025938-t3mz5-urls.txt	39933	download
urls-transfer.notkiska.pw-twitter-@gillibrandny-shallow-20200203-025938-t3mz5.json	335	download job
www.albertalepguild.ca-inf-20200203-034742-abw78-00000.warc.gz	742738963	download job
www.albertalepguild.ca-inf-20200203-034742-abw78-00000.warc.os.cdx.gz	230517	download
www.albertalepguild.ca-inf-20200203-034742-abw78-meta.warc.gz	134919	download job
www.albertalepguild.ca-inf-20200203-034742-abw78-meta.warc.os.cdx.gz	47	download
www.albertalepguild.ca-inf-20200203-034742-abw78.json	251	download job
www.atelierjeanpaquet.com-inf-20200203-030402-e2v2w-00000.warc.gz	62222213	download job
www.atelierjeanpaquet.com-inf-20200203-030402-e2v2w-00000.warc.os.cdx.gz	68655	download
www.atelierjeanpaquet.com-inf-20200203-030402-e2v2w-meta.warc.gz	52160	download job
www.atelierjeanpaquet.com-inf-20200203-030402-e2v2w-meta.warc.os.cdx.gz	47	download
www.atelierjeanpaquet.com-inf-20200203-030402-e2v2w.json	254	download job
www.bizpacreview.com-shallow-20200203-031048-bq49g-00000.warc.gz	6429392	download job
www.bizpacreview.com-shallow-20200203-031048-bq49g-00000.warc.os.cdx.gz	26919	download
www.bizpacreview.com-shallow-20200203-031048-bq49g-meta.warc.gz	20801	download job
www.bizpacreview.com-shallow-20200203-031048-bq49g-meta.warc.os.cdx.gz	47	download
www.bizpacreview.com-shallow-20200203-031048-bq49g.json	347	download job
www.bjnews.com.cn-inf-20200131-153934-dfgnl-00015.warc.gz	5398098093	download job
www.bjnews.com.cn-inf-20200131-153934-dfgnl-00015.warc.os.cdx.gz	404295	download
www.bjnews.com.cn-inf-20200131-153934-dfgnl-00016.warc.gz	5369336417	download job
www.bjnews.com.cn-inf-20200131-153934-dfgnl-00016.warc.os.cdx.gz	216691	download
www.chinanews.com-inf-20200128-213711-6a7mg-00019.warc.gz	5507802352	download job
www.chinanews.com-inf-20200128-213711-6a7mg-00019.warc.os.cdx.gz	1304408	download
www.crystalinks.com-inf-20200202-074009-ca7ld-00012.warc.gz	5374231061	download job
www.crystalinks.com-inf-20200202-074009-ca7ld-00012.warc.os.cdx.gz	1304582	download
www.entomoafricana.org-inf-20200203-041058-bxin3-00000.warc.gz	48983536	download job
www.entomoafricana.org-inf-20200203-041058-bxin3-00000.warc.os.cdx.gz	99694	download
www.entomoafricana.org-inf-20200203-041058-bxin3-meta.warc.gz	61621	download job
www.entomoafricana.org-inf-20200203-041058-bxin3-meta.warc.os.cdx.gz	47	download
www.entomoafricana.org-inf-20200203-041058-bxin3.json	251	download job
www.faintlake.com-inf-20200203-023318-eilci-00000.warc.gz	366073013	download job
www.faintlake.com-inf-20200203-023318-eilci-00000.warc.os.cdx.gz	381334	download
www.faintlake.com-inf-20200203-023318-eilci-meta.warc.gz	239147	download job
www.faintlake.com-inf-20200203-023318-eilci-meta.warc.os.cdx.gz	47	download
www.faintlake.com-inf-20200203-023318-eilci.json	242	download job
www.firstinspires.org-inf-20200202-182926-bejam-00006.warc.gz	5399645581	download job
www.firstinspires.org-inf-20200202-182926-bejam-00006.warc.os.cdx.gz	4771105	download
www.flickr.com-inf-20200203-035513-8lt9r-00000.warc.gz	453509412	download job
www.flickr.com-inf-20200203-035513-8lt9r-00000.warc.os.cdx.gz	208484	download
www.flickr.com-inf-20200203-035513-8lt9r-meta.warc.gz	124932	download job
www.flickr.com-inf-20200203-035513-8lt9r-meta.warc.os.cdx.gz	47	download
www.flickr.com-inf-20200203-035513-8lt9r.json	265	download job
www.flickr.com-inf-20200203-035530-ef0br-00000.warc.gz	5368715332	download job
www.flickr.com-inf-20200203-035530-ef0br-00000.warc.os.cdx.gz	762022	download
www.gimizu.de-inf-20200203-022730-5o72p-00000.warc.gz	601039679	download job
www.gimizu.de-inf-20200203-022730-5o72p-00000.warc.os.cdx.gz	508412	download
www.gimizu.de-inf-20200203-022730-5o72p-meta.warc.gz	234597	download job
www.gimizu.de-inf-20200203-022730-5o72p-meta.warc.os.cdx.gz	47	download
www.gimizu.de-inf-20200203-022730-5o72p.json	238	download job
www.hanginghillsbrewery.com-inf-20200203-031042-7xinv-00000.warc.gz	54220329	download job
www.hanginghillsbrewery.com-inf-20200203-031042-7xinv-00000.warc.os.cdx.gz	116199	download
www.hanginghillsbrewery.com-inf-20200203-031042-7xinv-meta.warc.gz	76475	download job
www.hanginghillsbrewery.com-inf-20200203-031042-7xinv-meta.warc.os.cdx.gz	47	download
www.hanginghillsbrewery.com-inf-20200203-031042-7xinv.json	256	download job
www.kickstarter.com-shallow-20200203-024756-2ht7u-00000.warc.gz	58464416	download job
www.kickstarter.com-shallow-20200203-024756-2ht7u-00000.warc.os.cdx.gz	23417	download
www.kickstarter.com-shallow-20200203-024756-2ht7u-meta.warc.gz	19356	download job
www.kickstarter.com-shallow-20200203-024756-2ht7u-meta.warc.os.cdx.gz	47	download
www.kickstarter.com-shallow-20200203-024756-2ht7u.json	269	download job
www.lepidopexchange.com-inf-20200203-041733-d5z7k-00000.warc.gz	22682264	download job
www.lepidopexchange.com-inf-20200203-041733-d5z7k-00000.warc.os.cdx.gz	54264	download
www.lepidopexchange.com-inf-20200203-041733-d5z7k-meta.warc.gz	33248	download job
www.lepidopexchange.com-inf-20200203-041733-d5z7k-meta.warc.os.cdx.gz	47	download
www.lepidopexchange.com-inf-20200203-041733-d5z7k.json	252	download job
www.modern-airships.info-inf-20200203-013716-1hsca-00000.warc.gz	131158640	download job
www.modern-airships.info-inf-20200203-013716-1hsca-00000.warc.os.cdx.gz	85500	download
www.modern-airships.info-inf-20200203-013716-1hsca.json	249	download job
www.nerdylorrin.net-inf-20200203-013040-est8o-00000.warc.gz	5550654761	download job
www.nerdylorrin.net-inf-20200203-013040-est8o-00000.warc.os.cdx.gz	791571	download
www.nerdylorrin.net-inf-20200203-013040-est8o-00001.warc.gz	5433149047	download job
www.nerdylorrin.net-inf-20200203-013040-est8o-00001.warc.os.cdx.gz	175898	download
www.ontarioinsects.org-inf-20200203-021740-c0428-meta.warc.gz	81795	download job
www.ontarioinsects.org-inf-20200203-021740-c0428-meta.warc.os.cdx.gz	47	download
www.ontarioinsects.org-inf-20200203-021740-c0428.json	251	download job
www.pbs.org-inf-20200202-224808-3evov-meta.warc.gz	1481804	download job
www.pbs.org-inf-20200202-224808-3evov-meta.warc.os.cdx.gz	47	download
www.pbs.org-inf-20200202-224808-3evov.json	262	download job
www.pbs.org-inf-20200203-032332-csu6x-00000.warc.gz	59322922	download job
www.pbs.org-inf-20200203-032332-csu6x-00000.warc.os.cdx.gz	76512	download
www.pbs.org-inf-20200203-032332-csu6x-meta.warc.gz	52126	download job
www.pbs.org-inf-20200203-032332-csu6x-meta.warc.os.cdx.gz	47	download
www.pbs.org-inf-20200203-032332-csu6x.json	254	download job
www.pbs.org-inf-20200203-032442-dbfza-00000.warc.gz	379060857	download job
www.pbs.org-inf-20200203-032442-dbfza-00000.warc.os.cdx.gz	460310	download
www.pbs.org-inf-20200203-032442-dbfza-meta.warc.gz	290314	download job
www.pbs.org-inf-20200203-032442-dbfza-meta.warc.os.cdx.gz	47	download
www.pbs.org-inf-20200203-032442-dbfza.json	251	download job
www.pbs.org-inf-20200203-032521-2054g-00000.warc.gz	65954575	download job
www.pbs.org-inf-20200203-032521-2054g-00000.warc.os.cdx.gz	94582	download
www.pbs.org-inf-20200203-032521-2054g-meta.warc.gz	62940	download job
www.pbs.org-inf-20200203-032521-2054g-meta.warc.os.cdx.gz	47	download
www.pbs.org-inf-20200203-032521-2054g.json	260	download job
www.pbs.org-inf-20200203-032542-2fj1p-00000.warc.gz	41622571	download job
www.pbs.org-inf-20200203-032542-2fj1p-00000.warc.os.cdx.gz	93467	download
www.pbs.org-inf-20200203-032542-2fj1p-meta.warc.gz	60555	download job
www.pbs.org-inf-20200203-032542-2fj1p-meta.warc.os.cdx.gz	47	download
www.pbs.org-inf-20200203-032542-2fj1p.json	260	download job
www.pbs.org-inf-20200203-032553-98o1y-00000.warc.gz	37978081	download job
www.pbs.org-inf-20200203-032553-98o1y-00000.warc.os.cdx.gz	83288	download
www.pbs.org-inf-20200203-032553-98o1y-meta.warc.gz	52436	download job
www.pbs.org-inf-20200203-032553-98o1y-meta.warc.os.cdx.gz	47	download
www.pbs.org-inf-20200203-032553-98o1y.json	260	download job
www.pbs.org-inf-20200203-032722-1u8r3-00000.warc.gz	110011145	download job
www.pbs.org-inf-20200203-032722-1u8r3-00000.warc.os.cdx.gz	60857	download
www.pbs.org-inf-20200203-032722-1u8r3-meta.warc.gz	44035	download job
www.pbs.org-inf-20200203-032722-1u8r3-meta.warc.os.cdx.gz	47	download
www.pbs.org-inf-20200203-032722-1u8r3.json	254	download job
www.pbs.org-inf-20200203-032832-715x5-00000.warc.gz	218540658	download job
www.pbs.org-inf-20200203-032832-715x5-00000.warc.os.cdx.gz	431081	download
www.pbs.org-inf-20200203-032832-715x5-meta.warc.gz	272996	download job
www.pbs.org-inf-20200203-032832-715x5-meta.warc.os.cdx.gz	47	download
www.pbs.org-inf-20200203-032832-715x5.json	251	download job
www.pbs.org-inf-20200203-032905-5waqi-00000.warc.gz	383757266	download job
www.pbs.org-inf-20200203-032905-5waqi-00000.warc.os.cdx.gz	367420	download
www.pbs.org-inf-20200203-032905-5waqi-meta.warc.gz	230352	download job
www.pbs.org-inf-20200203-032905-5waqi-meta.warc.os.cdx.gz	47	download
www.pbs.org-inf-20200203-032905-5waqi.json	258	download job
www.pbs.org-inf-20200203-033420-eyop9-00000.warc.gz	4141925	download job
www.pbs.org-inf-20200203-033420-eyop9-00000.warc.os.cdx.gz	32301	download
www.pbs.org-inf-20200203-033420-eyop9-meta.warc.gz	19895	download job
www.pbs.org-inf-20200203-033420-eyop9-meta.warc.os.cdx.gz	47	download
www.pbs.org-inf-20200203-033420-eyop9.json	255	download job
www.pbs.org-inf-20200203-033524-demgj-00000.warc.gz	5660840958	download job
www.pbs.org-inf-20200203-033524-demgj-00000.warc.os.cdx.gz	292992	download
www.spin.com-inf-20200126-235314-465ro-00129.warc.gz	5369993943	download job
www.spin.com-inf-20200126-235314-465ro-00129.warc.os.cdx.gz	2406636	download
www.spin.com-inf-20200126-235314-465ro-00130.warc.gz	5504392833	download job
www.spin.com-inf-20200126-235314-465ro-00130.warc.os.cdx.gz	1202887	download
www.taringa.net-inf-20190927-205127-2a0h7-00270.warc.gz	5368769196	download job
www.taringa.net-inf-20190927-205127-2a0h7-00270.warc.os.cdx.gz	5285235	download
wwwmpa.mpa-garching.mpg.de-inf-20200202-181316-d7ufa-00001.warc.gz	5368717677	download job
wwwmpa.mpa-garching.mpg.de-inf-20200202-181316-d7ufa-00001.warc.os.cdx.gz	1453965	download