Item archiveteam_archivebot_go_20221003131831_e756ac7b

Filename	Size
24tv.ua-inf-20220122-201022-76v7u-01437.warc.gz	5368803191	download job
24tv.ua-inf-20220122-201022-76v7u-01437.warc.os.cdx.gz	156169	download
24tv.ua-inf-20220122-201022-76v7u-01438.warc.gz	5438958055	download job
24tv.ua-inf-20220122-201022-76v7u-01438.warc.os.cdx.gz	160498	download
24tv.ua-inf-20220122-201022-76v7u-01439.warc.gz	5377500502	download job
24tv.ua-inf-20220122-201022-76v7u-01439.warc.os.cdx.gz	119892	download
24tv.ua-inf-20220122-201022-76v7u-01440.warc.gz	5372721657	download job
24tv.ua-inf-20220122-201022-76v7u-01440.warc.os.cdx.gz	147530	download
24tv.ua-inf-20220122-201022-76v7u-01441.warc.gz	5375399503	download job
24tv.ua-inf-20220122-201022-76v7u-01441.warc.os.cdx.gz	174644	download
24tv.ua-inf-20220122-201022-76v7u-01442.warc.gz	5414362503	download job
24tv.ua-inf-20220122-201022-76v7u-01442.warc.os.cdx.gz	130674	download
24tv.ua-inf-20220122-201022-76v7u-01443.warc.gz	5420904945	download job
24tv.ua-inf-20220122-201022-76v7u-01443.warc.os.cdx.gz	88637	download
24tv.ua-inf-20220122-201022-76v7u-01444.warc.gz	5529089241	download job
24tv.ua-inf-20220122-201022-76v7u-01444.warc.os.cdx.gz	142848	download
24tv.ua-inf-20220122-201022-76v7u-01445.warc.gz	5475793352	download job
24tv.ua-inf-20220122-201022-76v7u-01445.warc.os.cdx.gz	167395	download
24tv.ua-inf-20220122-201022-76v7u-01446.warc.gz	5418111450	download job
24tv.ua-inf-20220122-201022-76v7u-01446.warc.os.cdx.gz	82805	download
24tv.ua-inf-20220122-201022-76v7u-01447.warc.gz	5569849822	download job
24tv.ua-inf-20220122-201022-76v7u-01447.warc.os.cdx.gz	104841	download
24tv.ua-inf-20220122-201022-76v7u-01448.warc.gz	5386269357	download job
24tv.ua-inf-20220122-201022-76v7u-01448.warc.os.cdx.gz	82352	download
24tv.ua-inf-20220122-201022-76v7u-01449.warc.gz	5500122208	download job
24tv.ua-inf-20220122-201022-76v7u-01449.warc.os.cdx.gz	123190	download
24tv.ua-inf-20220122-201022-76v7u-01450.warc.gz	5372971599	download job
24tv.ua-inf-20220122-201022-76v7u-01450.warc.os.cdx.gz	98492	download
24tv.ua-inf-20220122-201022-76v7u-01451.warc.gz	5381216202	download job
24tv.ua-inf-20220122-201022-76v7u-01451.warc.os.cdx.gz	71773	download
24tv.ua-inf-20220122-201022-76v7u-01452.warc.gz	5515670120	download job
24tv.ua-inf-20220122-201022-76v7u-01452.warc.os.cdx.gz	100503	download
24tv.ua-inf-20220122-201022-76v7u-01453.warc.gz	5369309302	download job
24tv.ua-inf-20220122-201022-76v7u-01453.warc.os.cdx.gz	217434	download
24tv.ua-inf-20220122-201022-76v7u-01454.warc.gz	5377968729	download job
24tv.ua-inf-20220122-201022-76v7u-01454.warc.os.cdx.gz	167168	download
24tv.ua-inf-20220122-201022-76v7u-01455.warc.gz	5399126682	download job
24tv.ua-inf-20220122-201022-76v7u-01455.warc.os.cdx.gz	213509	download
24tv.ua-inf-20220122-201022-76v7u-01456.warc.gz	5377036199	download job
24tv.ua-inf-20220122-201022-76v7u-01456.warc.os.cdx.gz	211351	download
24tv.ua-inf-20220122-201022-76v7u-01457.warc.gz	5369059200	download job
24tv.ua-inf-20220122-201022-76v7u-01457.warc.os.cdx.gz	167642	download
alliesforchildren.org-inf-20221003-064128-dh2r4-00000.warc.gz	5369057437	download job
alliesforchildren.org-inf-20221003-064128-dh2r4-00000.warc.os.cdx.gz	2141635	download
alliesforchildren.org-inf-20221003-064128-dh2r4-00001.warc.gz	470676192	download job
alliesforchildren.org-inf-20221003-064128-dh2r4-00001.warc.os.cdx.gz	277257	download
alliesforchildren.org-inf-20221003-064128-dh2r4-meta.warc.gz	1649763	download job
alliesforchildren.org-inf-20221003-064128-dh2r4-meta.warc.os.cdx.gz	47	download
alliesforchildren.org-inf-20221003-064128-dh2r4.json	251	download job
ancientworldonline.blogspot.com-inf-20220921-030433-93k9b-00086.warc.gz	5368784234	download job
ancientworldonline.blogspot.com-inf-20220921-030433-93k9b-00086.warc.os.cdx.gz	28294827	download
archiveteam_archivebot_go_20221003131831_e756ac7b.cdx.gz	208795796	download
archiveteam_archivebot_go_20221003131831_e756ac7b.cdx.idx	218654	download
archiveteam_archivebot_go_20221003131831_e756ac7b_files.xml	0	download
archiveteam_archivebot_go_20221003131831_e756ac7b_meta.sqlite	430080	download
archiveteam_archivebot_go_20221003131831_e756ac7b_meta.xml	997	download
blessunleashed.fandom.com-inf-20220925-025623-7zlpq-00037.warc.gz	5368709508	download job
blessunleashed.fandom.com-inf-20220925-025623-7zlpq-00037.warc.os.cdx.gz	2994713	download
blessunleashed.fandom.com-inf-20220925-025623-7zlpq-00038.warc.gz	5368858297	download job
blessunleashed.fandom.com-inf-20220925-025623-7zlpq-00038.warc.os.cdx.gz	2951313	download
businessradiox.com-inf-20220916-152826-8v166-00081.warc.gz	5373636270	download job
businessradiox.com-inf-20220916-152826-8v166-00081.warc.os.cdx.gz	490869	download
businessradiox.com-inf-20220916-152826-8v166-00082.warc.gz	5413944567	download job
businessradiox.com-inf-20220916-152826-8v166-00082.warc.os.cdx.gz	337406	download
coolestsound.jp-inf-20221001-212333-ewrkl-00004.warc.gz	5372182673	download job
coolestsound.jp-inf-20221001-212333-ewrkl-00004.warc.os.cdx.gz	3318271	download
coolestsound.jp-inf-20221001-212333-ewrkl-00005.warc.gz	5374455434	download job
coolestsound.jp-inf-20221001-212333-ewrkl-00005.warc.os.cdx.gz	5124744	download
coolhunting.com-inf-20221002-050402-4t1o9-00012.warc.gz	5368914009	download job
coolhunting.com-inf-20221002-050402-4t1o9-00012.warc.os.cdx.gz	1639255	download
coolhunting.com-inf-20221002-050402-4t1o9-00013.warc.gz	5369005780	download job
coolhunting.com-inf-20221002-050402-4t1o9-00013.warc.os.cdx.gz	1656552	download
db.sac.or.th-inf-20221003-035201-baeg3-00000.warc.gz	6581	download job
db.sac.or.th-inf-20221003-035201-baeg3-00000.warc.os.cdx.gz	331	download
db.sac.or.th-inf-20221003-035201-baeg3-meta.warc.gz	3548	download job
db.sac.or.th-inf-20221003-035201-baeg3-meta.warc.os.cdx.gz	47	download
db.sac.or.th-inf-20221003-035201-baeg3.json	243	download job
defkey.com-inf-20221001-082656-4oil3-00007.warc.gz	5368797962	download job
defkey.com-inf-20221001-082656-4oil3-00007.warc.os.cdx.gz	4662018	download
digbywebster.com-inf-20221003-061230-i13o3-00000.warc.gz	890260761	download job
digbywebster.com-inf-20221003-061230-i13o3-00000.warc.os.cdx.gz	398702	download
digbywebster.com-inf-20221003-061230-i13o3-meta.warc.gz	260750	download job
digbywebster.com-inf-20221003-061230-i13o3-meta.warc.os.cdx.gz	47	download
digbywebster.com-inf-20221003-061230-i13o3.json	241	download job
download.lavadomefive.com-inf-20221003-061915-1mlp4-00000.warc.gz	473591101	download job
download.lavadomefive.com-inf-20221003-061915-1mlp4-00000.warc.os.cdx.gz	305237	download
download.lavadomefive.com-inf-20221003-061915-1mlp4-meta.warc.gz	182388	download job
download.lavadomefive.com-inf-20221003-061915-1mlp4-meta.warc.os.cdx.gz	47	download
download.lavadomefive.com-inf-20221003-061915-1mlp4.json	268	download job
gat.hubei.gov.cn-inf-20221003-005854-d33og-00000.warc.gz	866600249	download job
gat.hubei.gov.cn-inf-20221003-005854-d33og-00000.warc.os.cdx.gz	703485	download
gat.hubei.gov.cn-inf-20221003-005854-d33og-meta.warc.gz	447230	download job
gat.hubei.gov.cn-inf-20221003-005854-d33og-meta.warc.os.cdx.gz	47	download
gat.hubei.gov.cn-inf-20221003-005854-d33og.json	245	download job
gdj.hubei.gov.cn-inf-20221003-014549-c58te-00000.warc.gz	5375389697	download job
gdj.hubei.gov.cn-inf-20221003-014549-c58te-00000.warc.os.cdx.gz	936323	download
ghp.papnet.eu-inf-20220928-031858-6ux1x-00062.warc.gz	5391970539	download job
ghp.papnet.eu-inf-20220928-031858-6ux1x-00062.warc.os.cdx.gz	76293	download
ghp.papnet.eu-inf-20220928-031858-6ux1x-00063.warc.gz	5424934297	download job
ghp.papnet.eu-inf-20220928-031858-6ux1x-00063.warc.os.cdx.gz	48895	download
grable.org-inf-20221003-062234-3egse-00000.warc.gz	1130635720	download job
grable.org-inf-20221003-062234-3egse-00000.warc.os.cdx.gz	1244873	download
grable.org-inf-20221003-062234-3egse-meta.warc.gz	775810	download job
grable.org-inf-20221003-062234-3egse-meta.warc.os.cdx.gz	47	download
grable.org-inf-20221003-062234-3egse.json	241	download job
gtaforums.com-inf-20220919-234047-2u4am-00029.warc.gz	5369466170	download job
gtaforums.com-inf-20220919-234047-2u4am-00029.warc.os.cdx.gz	1831459	download
gxs.hubei.gov.cn-inf-20221003-042123-ac4nm-00000.warc.gz	296404837	download job
gxs.hubei.gov.cn-inf-20221003-042123-ac4nm-00000.warc.os.cdx.gz	492536	download
gxs.hubei.gov.cn-inf-20221003-042123-ac4nm-meta.warc.gz	308856	download job
gxs.hubei.gov.cn-inf-20221003-042123-ac4nm-meta.warc.os.cdx.gz	47	download
gxs.hubei.gov.cn-inf-20221003-042123-ac4nm.json	245	download job
headlinesmasher.com-inf-20220430-225921-bvc2x-00957.warc.gz	5506263142	download job
headlinesmasher.com-inf-20220430-225921-bvc2x-00957.warc.os.cdx.gz	481463	download
ignca.gov.in-inf-20220921-033106-7d3od-00221.warc.gz	5414901990	download job
ignca.gov.in-inf-20220921-033106-7d3od-00221.warc.os.cdx.gz	501794	download
madmimi.com-inf-20221003-022030-hxce4-00000.warc.gz	1563777971	download job
madmimi.com-inf-20221003-022030-hxce4-00000.warc.os.cdx.gz	1633479	download
madmimi.com-inf-20221003-022030-hxce4-meta.warc.gz	1005815	download job
madmimi.com-inf-20221003-022030-hxce4-meta.warc.os.cdx.gz	47	download
madmimi.com-inf-20221003-022030-hxce4.json	236	download job
magportal.com-inf-20220920-191458-9mcwd-00047.warc.gz	5514875705	download job
magportal.com-inf-20220920-191458-9mcwd-00047.warc.os.cdx.gz	2909256	download
markozen.com-inf-20221003-023259-7bc5r-00000.warc.gz	5373293659	download job
markozen.com-inf-20221003-023259-7bc5r-00000.warc.os.cdx.gz	3222091	download
markozen.com-inf-20221003-023259-7bc5r-00001.warc.gz	5663852488	download job
markozen.com-inf-20221003-023259-7bc5r-00001.warc.os.cdx.gz	1042493	download
mikenovak.blogspot.com-inf-20221003-021352-cwl8z-00000.warc.gz	5369212333	download job
mikenovak.blogspot.com-inf-20221003-021352-cwl8z-00000.warc.os.cdx.gz	3476500	download
mikenovak.blogspot.com-inf-20221003-021352-cwl8z-00001.warc.gz	6518285794	download job
mikenovak.blogspot.com-inf-20221003-021352-cwl8z-00001.warc.os.cdx.gz	89422	download
mikenovak.blogspot.com-inf-20221003-021352-cwl8z-00002.warc.gz	4402566807	download job
mikenovak.blogspot.com-inf-20221003-021352-cwl8z-00002.warc.os.cdx.gz	3718746	download
mikenovak.blogspot.com-inf-20221003-021352-cwl8z-meta.warc.gz	4483509	download job
mikenovak.blogspot.com-inf-20221003-021352-cwl8z-meta.warc.os.cdx.gz	47	download
mikenovak.blogspot.com-inf-20221003-021352-cwl8z.json	247	download job
nintendo-pictures.co.jp-inf-20221003-122431-s81yh-00000.warc.gz	9930527	download job
nintendo-pictures.co.jp-inf-20221003-122431-s81yh-00000.warc.os.cdx.gz	27500	download
nintendo-pictures.co.jp-inf-20221003-122431-s81yh-meta.warc.gz	20335	download job
nintendo-pictures.co.jp-inf-20221003-122431-s81yh-meta.warc.os.cdx.gz	47	download
nintendo-pictures.co.jp-inf-20221003-122431-s81yh.json	248	download job
pittsburghpromise.org-inf-20221003-071936-a5qer-00000.warc.gz	2196402467	download job
pittsburghpromise.org-inf-20221003-071936-a5qer-00000.warc.os.cdx.gz	1878985	download
pittsburghpromise.org-inf-20221003-071936-a5qer-meta.warc.gz	1220741	download job
pittsburghpromise.org-inf-20221003-071936-a5qer-meta.warc.os.cdx.gz	47	download
pittsburghpromise.org-inf-20221003-071936-a5qer.json	252	download job
remakelearning.org-inf-20221003-071859-te72v-00000.warc.gz	5368770368	download job
remakelearning.org-inf-20221003-071859-te72v-00000.warc.os.cdx.gz	3342109	download
remakelearningdays.org-inf-20221003-084350-32v6o-00000.warc.gz	5368945821	download job
remakelearningdays.org-inf-20221003-084350-32v6o-00000.warc.os.cdx.gz	1981505	download
remakelearningdays.org-inf-20221003-084350-32v6o-00001.warc.gz	5369141407	download job
remakelearningdays.org-inf-20221003-084350-32v6o-00001.warc.os.cdx.gz	1796191	download
siddham.network-inf-20221002-221929-ese1x-00001.warc.gz	5379953041	download job
siddham.network-inf-20221002-221929-ese1x-00001.warc.os.cdx.gz	894899	download
siddham.network-inf-20221002-221929-ese1x-00002.warc.gz	1316327088	download job
siddham.network-inf-20221002-221929-ese1x-00002.warc.os.cdx.gz	296792	download
siddham.network-inf-20221002-221929-ese1x-meta.warc.gz	2131981	download job
siddham.network-inf-20221002-221929-ese1x-meta.warc.os.cdx.gz	47	download
siddham.network-inf-20221002-221929-ese1x.json	246	download job
stormchasercenter.net-inf-20221003-030302-5vf1b-00000.warc.gz	3087178214	download job
stormchasercenter.net-inf-20221003-030302-5vf1b-00000.warc.os.cdx.gz	861603	download
stormchasercenter.net-inf-20221003-030302-5vf1b-meta.warc.gz	504549	download job
stormchasercenter.net-inf-20221003-030302-5vf1b-meta.warc.os.cdx.gz	47	download
stormchasercenter.net-inf-20221003-030302-5vf1b.json	251	download job
thehostthefilm.com-inf-20221003-123559-mwe38-00000.warc.gz	774181349	download job
thehostthefilm.com-inf-20221003-123559-mwe38-00000.warc.os.cdx.gz	242203	download
thehostthefilm.com-inf-20221003-123559-mwe38-meta.warc.gz	153725	download job
thehostthefilm.com-inf-20221003-123559-mwe38-meta.warc.os.cdx.gz	47	download
thehostthefilm.com-inf-20221003-123559-mwe38.json	242	download job
thepittsburghstudy.org-inf-20221003-062514-96vi8-00000.warc.gz	306653785	download job
thepittsburghstudy.org-inf-20221003-062514-96vi8-00000.warc.os.cdx.gz	159842	download
thepittsburghstudy.org-inf-20221003-062514-96vi8-meta.warc.gz	103891	download job
thepittsburghstudy.org-inf-20221003-062514-96vi8-meta.warc.os.cdx.gz	47	download
thepittsburghstudy.org-inf-20221003-062514-96vi8.json	253	download job
threesheepstudio.blogspot.com-inf-20221003-021731-ur3hl-00000.warc.gz	2744602919	download job
threesheepstudio.blogspot.com-inf-20221003-021731-ur3hl-00000.warc.os.cdx.gz	2144203	download
threesheepstudio.blogspot.com-inf-20221003-021731-ur3hl-meta.warc.gz	1506942	download job
threesheepstudio.blogspot.com-inf-20221003-021731-ur3hl-meta.warc.os.cdx.gz	47	download
threesheepstudio.blogspot.com-inf-20221003-021731-ur3hl.json	254	download job
tryingtogether.org-inf-20221003-062534-8lsxp-00000.warc.gz	5414584704	download job
tryingtogether.org-inf-20221003-062534-8lsxp-00000.warc.os.cdx.gz	1855017	download
urls-transfer.archivete.am-db.sac.or.th_seed_urls.txt-inf-20221003-035829-8qudp-00000.warc.gz	5368844818	download job
urls-transfer.archivete.am-db.sac.or.th_seed_urls.txt-inf-20221003-035829-8qudp-00000.warc.os.cdx.gz	1365193	download
urls-transfer.archivete.am-twitter-@NateBlogs-shallow-20221003-023855-d7tsu-00000.warc.gz	5368842812	download job
urls-transfer.archivete.am-twitter-@NateBlogs-shallow-20221003-023855-d7tsu-00000.warc.os.cdx.gz	2607891	download
urls-transfer.archivete.am-twitter-@NateBlogs-shallow-20221003-023855-d7tsu-00001.warc.gz	5368805588	download job
urls-transfer.archivete.am-twitter-@NateBlogs-shallow-20221003-023855-d7tsu-00001.warc.os.cdx.gz	4172765	download
urls-transfer.archivete.am-twitter-@NateBlogs-shallow-20221003-023855-d7tsu-00002.warc.gz	1193487835	download job
urls-transfer.archivete.am-twitter-@NateBlogs-shallow-20221003-023855-d7tsu-00002.warc.os.cdx.gz	1278603	download
urls-transfer.archivete.am-twitter-@NateBlogs-shallow-20221003-023855-d7tsu-meta.warc.gz	5104591	download job
urls-transfer.archivete.am-twitter-@NateBlogs-shallow-20221003-023855-d7tsu-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@NateBlogs-shallow-20221003-023855-d7tsu-urls.txt	553935	download
urls-transfer.archivete.am-twitter-@NateBlogs-shallow-20221003-023855-d7tsu.json	332	download job
urls-transfer.archivete.am-twitter-@PDChina-shallow-20221001-173528-7vvkd-00000.warc.gz	5432781269	download job
urls-transfer.archivete.am-twitter-@PDChina-shallow-20221001-173528-7vvkd-00000.warc.os.cdx.gz	8111931	download
urls-transfer.archivete.am-twitter-@RipRoarRex-shallow-20221003-061957-f4j5q-00000.warc.gz	50356963	download job
urls-transfer.archivete.am-twitter-@RipRoarRex-shallow-20221003-061957-f4j5q-00000.warc.os.cdx.gz	120263	download
urls-transfer.archivete.am-twitter-@RipRoarRex-shallow-20221003-061957-f4j5q-meta.warc.gz	89363	download job
urls-transfer.archivete.am-twitter-@RipRoarRex-shallow-20221003-061957-f4j5q-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@RipRoarRex-shallow-20221003-061957-f4j5q-urls.txt	62599	download
urls-transfer.archivete.am-twitter-@RipRoarRex-shallow-20221003-061957-f4j5q.json	334	download job
urls-transfer.archivete.am-twitter-@flicksnews-shallow-20221003-062417-65759-00000.warc.gz	1735539059	download job
urls-transfer.archivete.am-twitter-@flicksnews-shallow-20221003-062417-65759-00000.warc.os.cdx.gz	935587	download
urls-transfer.archivete.am-twitter-@flicksnews-shallow-20221003-062417-65759-meta.warc.gz	686418	download job
urls-transfer.archivete.am-twitter-@flicksnews-shallow-20221003-062417-65759-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@flicksnews-shallow-20221003-062417-65759-urls.txt	497548	download
urls-transfer.archivete.am-twitter-@flicksnews-shallow-20221003-062417-65759.json	334	download job
urls-transfer.archivete.am-twitter-@manfightdragon-shallow-20221003-041647-efsxl-00000.warc.gz	5382514171	download job
urls-transfer.archivete.am-twitter-@manfightdragon-shallow-20221003-041647-efsxl-00000.warc.os.cdx.gz	895065	download
urls-transfer.archivete.am-twitter-@manfightdragon-shallow-20221003-041647-efsxl-00001.warc.gz	3833631323	download job
urls-transfer.archivete.am-twitter-@manfightdragon-shallow-20221003-041647-efsxl-00001.warc.os.cdx.gz	2787607	download
urls-transfer.archivete.am-twitter-@manfightdragon-shallow-20221003-041647-efsxl-meta.warc.gz	3415235	download job
urls-transfer.archivete.am-twitter-@manfightdragon-shallow-20221003-041647-efsxl-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@manfightdragon-shallow-20221003-041647-efsxl-urls.txt	4790367	download
urls-transfer.archivete.am-twitter-@manfightdragon-shallow-20221003-041647-efsxl.json	342	download job
urls-transfer.archivete.am-twitter-@rebeccapropes-shallow-20221003-024330-8ae88-00000.warc.gz	1097620264	download job
urls-transfer.archivete.am-twitter-@rebeccapropes-shallow-20221003-024330-8ae88-00000.warc.os.cdx.gz	1088643	download
urls-transfer.archivete.am-twitter-@rebeccapropes-shallow-20221003-024330-8ae88-meta.warc.gz	731541	download job
urls-transfer.archivete.am-twitter-@rebeccapropes-shallow-20221003-024330-8ae88-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@rebeccapropes-shallow-20221003-024330-8ae88-urls.txt	171703	download
urls-transfer.archivete.am-twitter-@rebeccapropes-shallow-20221003-024330-8ae88.json	340	download job
wannabite.com-inf-20221003-023557-duxth-00000.warc.gz	5368709790	download job
wannabite.com-inf-20221003-023557-duxth-00000.warc.os.cdx.gz	2264689	download
wannabite.com-inf-20221003-023557-duxth-00001.warc.gz	5369371168	download job
wannabite.com-inf-20221003-023557-duxth-00001.warc.os.cdx.gz	3998203	download
www.accursedfarms.com-inf-20221001-191608-fjtjo-00005.warc.gz	5368831162	download job
www.accursedfarms.com-inf-20221001-191608-fjtjo-00005.warc.os.cdx.gz	4010302	download
www.accursedfarms.com-inf-20221001-191608-fjtjo-00006.warc.gz	5368789053	download job
www.accursedfarms.com-inf-20221001-191608-fjtjo-00006.warc.os.cdx.gz	2553022	download
www.aiu3.net-inf-20221003-071920-8ujlo-00000.warc.gz	2020864662	download job
www.aiu3.net-inf-20221003-071920-8ujlo-00000.warc.os.cdx.gz	1797546	download
www.aiu3.net-inf-20221003-071920-8ujlo-meta.warc.gz	1077272	download job
www.aiu3.net-inf-20221003-071920-8ujlo-meta.warc.os.cdx.gz	47	download
www.aiu3.net-inf-20221003-071920-8ujlo.json	243	download job
www.appledaily.com.tw-inf-20220903-015827-1bpf8-00527.warc.gz	5369166036	download job
www.appledaily.com.tw-inf-20220903-015827-1bpf8-00527.warc.os.cdx.gz	1303871	download
www.appledaily.com.tw-inf-20220903-015827-1bpf8-00528.warc.gz	5370081661	download job
www.appledaily.com.tw-inf-20220903-015827-1bpf8-00528.warc.os.cdx.gz	1126657	download
www.appledaily.com.tw-inf-20220903-015827-1bpf8-00529.warc.gz	5370360321	download job
www.appledaily.com.tw-inf-20220903-015827-1bpf8-00529.warc.os.cdx.gz	1155790	download
www.appledaily.com.tw-inf-20220903-015827-1bpf8-00530.warc.gz	5368709379	download job
www.appledaily.com.tw-inf-20220903-015827-1bpf8-00530.warc.os.cdx.gz	1201383	download
www.appledaily.com.tw-inf-20220903-015827-1bpf8-00531.warc.gz	5378939493	download job
www.appledaily.com.tw-inf-20220903-015827-1bpf8-00531.warc.os.cdx.gz	991992	download
www.appledaily.com.tw-inf-20220903-015827-1bpf8-00532.warc.gz	5378808673	download job
www.appledaily.com.tw-inf-20220903-015827-1bpf8-00532.warc.os.cdx.gz	973160	download
www.appledaily.com.tw-inf-20220903-015827-1bpf8-00533.warc.gz	5371273455	download job
www.appledaily.com.tw-inf-20220903-015827-1bpf8-00533.warc.os.cdx.gz	914058	download
www.bungie.net-inf-20220131-203956-5atdf-00418.warc.gz	5368736560	download job
www.bungie.net-inf-20220131-203956-5atdf-00418.warc.os.cdx.gz	7646619	download
www.curieservices.com-inf-20221003-045719-9xmsb-00000.warc.gz	50672548	download job
www.curieservices.com-inf-20221003-045719-9xmsb-00000.warc.os.cdx.gz	104915	download
www.curieservices.com-inf-20221003-045719-9xmsb-meta.warc.gz	74977	download job
www.curieservices.com-inf-20221003-045719-9xmsb-meta.warc.os.cdx.gz	47	download
www.curieservices.com-inf-20221003-045719-9xmsb.json	252	download job
www.flicksnews.net-inf-20221003-062116-8wj85-00000.warc.gz	5531678908	download job
www.flicksnews.net-inf-20221003-062116-8wj85-00000.warc.os.cdx.gz	3032677	download
www.flicksnews.net-inf-20221003-062116-8wj85-00001.warc.gz	6041905942	download job
www.flicksnews.net-inf-20221003-062116-8wj85-00001.warc.os.cdx.gz	199443	download
www.flicksnews.net-inf-20221003-062116-8wj85-00002.warc.gz	5368763781	download job
www.flicksnews.net-inf-20221003-062116-8wj85-00002.warc.os.cdx.gz	3497422	download
www.fredrogersinstitute.org-inf-20221003-084912-ard0o-00000.warc.gz	1699924962	download job
www.fredrogersinstitute.org-inf-20221003-084912-ard0o-00000.warc.os.cdx.gz	385940	download
www.fredrogersinstitute.org-inf-20221003-084912-ard0o-meta.warc.gz	232734	download job
www.fredrogersinstitute.org-inf-20221003-084912-ard0o-meta.warc.os.cdx.gz	47	download
www.fredrogersinstitute.org-inf-20221003-084912-ard0o.json	258	download job
www.jameslovelock.org-inf-20221003-040607-cq0c5-00000.warc.gz	159993668	download job
www.jameslovelock.org-inf-20221003-040607-cq0c5-00000.warc.os.cdx.gz	290377	download
www.jameslovelock.org-inf-20221003-040607-cq0c5-meta.warc.gz	183566	download job
www.jameslovelock.org-inf-20221003-040607-cq0c5-meta.warc.os.cdx.gz	47	download
www.jameslovelock.org-inf-20221003-040607-cq0c5.json	251	download job
www.kdejsme.cz-inf-20220924-170044-1flh5-00008.warc.gz	5368730210	download job
www.kdejsme.cz-inf-20220924-170044-1flh5-00008.warc.os.cdx.gz	16966930	download
www.mentoringpittsburgh.org-inf-20221003-072659-a9y0m-00000.warc.gz	5476557869	download job
www.mentoringpittsburgh.org-inf-20221003-072659-a9y0m-00000.warc.os.cdx.gz	1116126	download
www.mentoringpittsburgh.org-inf-20221003-072659-a9y0m-00001.warc.gz	5375813475	download job
www.mentoringpittsburgh.org-inf-20221003-072659-a9y0m-00001.warc.os.cdx.gz	556535	download
www.mentoringpittsburgh.org-inf-20221003-072659-a9y0m-00002.warc.gz	3379526547	download job
www.mentoringpittsburgh.org-inf-20221003-072659-a9y0m-00002.warc.os.cdx.gz	1919336	download
www.mentoringpittsburgh.org-inf-20221003-072659-a9y0m-meta.warc.gz	2215872	download job
www.mentoringpittsburgh.org-inf-20221003-072659-a9y0m-meta.warc.os.cdx.gz	47	download
www.mentoringpittsburgh.org-inf-20221003-072659-a9y0m.json	258	download job
www.ourschoolspittsburgh.org-inf-20221003-064115-9k93z-00000.warc.gz	4769549151	download job
www.ourschoolspittsburgh.org-inf-20221003-064115-9k93z-00000.warc.os.cdx.gz	1494386	download
www.ourschoolspittsburgh.org-inf-20221003-064115-9k93z-meta.warc.gz	936627	download job
www.ourschoolspittsburgh.org-inf-20221003-064115-9k93z-meta.warc.os.cdx.gz	47	download
www.ourschoolspittsburgh.org-inf-20221003-064115-9k93z.json	259	download job
www.papartnerships.org-inf-20221003-064024-eums4-00000.warc.gz	6723827237	download job
www.papartnerships.org-inf-20221003-064024-eums4-00000.warc.os.cdx.gz	819072	download
www.papartnerships.org-inf-20221003-064024-eums4-00001.warc.gz	6159820392	download job
www.papartnerships.org-inf-20221003-064024-eums4-00001.warc.os.cdx.gz	1667494	download
www.papartnerships.org-inf-20221003-064024-eums4-00002.warc.gz	2688847903	download job
www.papartnerships.org-inf-20221003-064024-eums4-00002.warc.os.cdx.gz	19238	download
www.papartnerships.org-inf-20221003-064024-eums4-meta.warc.gz	1643307	download job
www.papartnerships.org-inf-20221003-064024-eums4-meta.warc.os.cdx.gz	47	download
www.papartnerships.org-inf-20221003-064024-eums4.json	253	download job
www.perseus.tufts.edu-inf-20220920-224927-4kuf2-00002.warc.gz	5368719872	download job
www.perseus.tufts.edu-inf-20220920-224927-4kuf2-00002.warc.os.cdx.gz	25791779	download
www.playfulpittsburgh.org-inf-20221003-062632-erbe6-00000.warc.gz	4034721806	download job
www.playfulpittsburgh.org-inf-20221003-062632-erbe6-00000.warc.os.cdx.gz	2606452	download
www.playfulpittsburgh.org-inf-20221003-062632-erbe6-meta.warc.gz	1627771	download job
www.playfulpittsburgh.org-inf-20221003-062632-erbe6-meta.warc.os.cdx.gz	47	download
www.playfulpittsburgh.org-inf-20221003-062632-erbe6.json	256	download job
www.rebeccapropes.com-inf-20221003-024232-72rjt-00000.warc.gz	5368814360	download job
www.rebeccapropes.com-inf-20221003-024232-72rjt-00000.warc.os.cdx.gz	1636022	download
www.rebeccapropes.com-inf-20221003-024232-72rjt-00001.warc.gz	5369403860	download job
www.rebeccapropes.com-inf-20221003-024232-72rjt-00001.warc.os.cdx.gz	3929393	download
www.rebeccapropes.com-inf-20221003-024232-72rjt-00002.warc.gz	5369105224	download job
www.rebeccapropes.com-inf-20221003-024232-72rjt-00002.warc.os.cdx.gz	2865865	download
www.sacheenlittlefeather.net-inf-20221003-051400-uw0nb-00000.warc.gz	333303	download job
www.sacheenlittlefeather.net-inf-20221003-051400-uw0nb-00000.warc.os.cdx.gz	1908	download
www.sacheenlittlefeather.net-inf-20221003-051400-uw0nb-meta.warc.gz	4766	download job
www.sacheenlittlefeather.net-inf-20221003-051400-uw0nb-meta.warc.os.cdx.gz	47	download
www.sacheenlittlefeather.net-inf-20221003-051400-uw0nb.json	254	download job
www.sciencemadness.org-inf-20220917-190447-e9jpg-00007.warc.gz	5446397803	download job
www.sciencemadness.org-inf-20220917-190447-e9jpg-00007.warc.os.cdx.gz	1736378	download
www.sciencemadness.org-inf-20220917-190447-e9jpg-00008.warc.gz	6138936352	download job
www.sciencemadness.org-inf-20220917-190447-e9jpg-00008.warc.os.cdx.gz	5098	download
www.sciencemadness.org-inf-20220917-190447-e9jpg-00009.warc.gz	6728796720	download job
www.sciencemadness.org-inf-20220917-190447-e9jpg-00009.warc.os.cdx.gz	5091	download
www.sciencemadness.org-inf-20220917-190447-e9jpg-00010.warc.gz	6783244983	download job
www.sciencemadness.org-inf-20220917-190447-e9jpg-00010.warc.os.cdx.gz	11194	download
www.sciencemadness.org-inf-20220917-190447-e9jpg-00011.warc.gz	5395464516	download job
www.sciencemadness.org-inf-20220917-190447-e9jpg-00011.warc.os.cdx.gz	7314	download
www.sciencemadness.org-inf-20220917-190447-e9jpg-00012.warc.gz	5848432851	download job
www.sciencemadness.org-inf-20220917-190447-e9jpg-00012.warc.os.cdx.gz	5833	download
www.sciencemadness.org-inf-20220917-190447-e9jpg-00013.warc.gz	5550546968	download job
www.sciencemadness.org-inf-20220917-190447-e9jpg-00013.warc.os.cdx.gz	7267	download
www.sciencemadness.org-inf-20220917-190447-e9jpg-00014.warc.gz	5739912724	download job
www.sciencemadness.org-inf-20220917-190447-e9jpg-00014.warc.os.cdx.gz	5342	download
www.sciencemadness.org-inf-20220917-190447-e9jpg-00015.warc.gz	5595955335	download job
www.sciencemadness.org-inf-20220917-190447-e9jpg-00015.warc.os.cdx.gz	9492	download
www.tamilvu.org-inf-20220921-042434-65fsl-00047.warc.gz	5372196277	download job
www.tamilvu.org-inf-20220921-042434-65fsl-00047.warc.os.cdx.gz	66568	download
www.tamilvu.org-inf-20220921-042434-65fsl-00048.warc.gz	5406145752	download job
www.tamilvu.org-inf-20220921-042434-65fsl-00048.warc.os.cdx.gz	16128	download
www.tek.no-inf-20220913-002050-5r54x-00126.warc.gz	5973446866	download job
www.tek.no-inf-20220913-002050-5r54x-00126.warc.os.cdx.gz	2876539	download