Item archiveteam_archivebot_go_20230115191058_5d3a950a

Filename	Size
antoniodepoli.it-inf-20230113-132600-bhjcg-00004.warc.gz	5368719013	download job
antoniodepoli.it-inf-20230113-132600-bhjcg-00004.warc.os.cdx.gz	3713287	download
archiveteam_archivebot_go_20230115191058_5d3a950a.cdx.gz	249019674	download
archiveteam_archivebot_go_20230115191058_5d3a950a.cdx.idx	272114	download
archiveteam_archivebot_go_20230115191058_5d3a950a_files.xml	0	download
archiveteam_archivebot_go_20230115191058_5d3a950a_meta.sqlite	557056	download
archiveteam_archivebot_go_20230115191058_5d3a950a_meta.xml	997	download
beyond-coal.eu-inf-20230115-155159-73ezv-00000.warc.gz	5480765961	download job
beyond-coal.eu-inf-20230115-155159-73ezv-00000.warc.os.cdx.gz	1384724	download
beyond-coal.eu-inf-20230115-155159-73ezv-00001.warc.gz	5369696293	download job
beyond-coal.eu-inf-20230115-155159-73ezv-00001.warc.os.cdx.gz	1510808	download
businessradiox.com-inf-20220916-152826-8v166-00264.warc.gz	5380334352	download job
businessradiox.com-inf-20220916-152826-8v166-00264.warc.os.cdx.gz	448459	download
cosmicsummit2023.com-inf-20230115-154653-2iavk-00000.warc.gz	3622547133	download job
cosmicsummit2023.com-inf-20230115-154653-2iavk-00000.warc.os.cdx.gz	499684	download
cosmicsummit2023.com-inf-20230115-154653-2iavk-meta.warc.gz	313680	download job
cosmicsummit2023.com-inf-20230115-154653-2iavk-meta.warc.os.cdx.gz	47	download
cosmicsummit2023.com-inf-20230115-154653-2iavk.json	250	download job
discussion.fool.com-inf-20230109-003723-1yaux-00074.warc.gz	5467040491	download job
discussion.fool.com-inf-20230109-003723-1yaux-00074.warc.os.cdx.gz	622328	download
discussion.fool.com-inf-20230109-003723-1yaux-00075.warc.gz	5378958324	download job
discussion.fool.com-inf-20230109-003723-1yaux-00075.warc.os.cdx.gz	561394	download
discussion.fool.com-inf-20230109-003723-1yaux-00076.warc.gz	5377447028	download job
discussion.fool.com-inf-20230109-003723-1yaux-00076.warc.os.cdx.gz	216613	download
discussion.fool.com-inf-20230109-003723-1yaux-00077.warc.gz	5435960331	download job
discussion.fool.com-inf-20230109-003723-1yaux-00077.warc.os.cdx.gz	756089	download
discussion.fool.com-inf-20230109-003723-1yaux-00078.warc.gz	5371243425	download job
discussion.fool.com-inf-20230109-003723-1yaux-00078.warc.os.cdx.gz	441122	download
emiliaromagna.articolo1mdp.it-inf-20230115-134930-1wbu2-00000.warc.gz	46235294	download job
emiliaromagna.articolo1mdp.it-inf-20230115-134930-1wbu2-00000.warc.os.cdx.gz	92437	download
emiliaromagna.articolo1mdp.it-inf-20230115-134930-1wbu2-meta.warc.gz	75107	download job
emiliaromagna.articolo1mdp.it-inf-20230115-134930-1wbu2-meta.warc.os.cdx.gz	47	download
emiliaromagna.articolo1mdp.it-inf-20230115-134930-1wbu2.json	257	download job
freewechat.com-inf-20221128-202335-8k26b-00614.warc.gz	5369414522	download job
freewechat.com-inf-20221128-202335-8k26b-00614.warc.os.cdx.gz	4385770	download
freewechat.com-inf-20221128-202335-8k26b-00615.warc.gz	5368754708	download job
freewechat.com-inf-20221128-202335-8k26b-00615.warc.os.cdx.gz	2994723	download
freewechat.com-inf-20221128-202335-8k26b-00616.warc.gz	5407788115	download job
freewechat.com-inf-20221128-202335-8k26b-00616.warc.os.cdx.gz	4807412	download
freewechat.com-inf-20221128-202335-8k26b-00617.warc.gz	5374104058	download job
freewechat.com-inf-20221128-202335-8k26b-00617.warc.os.cdx.gz	1626428	download
fridaysforfuture.de-inf-20230115-155415-amr8r-00000.warc.gz	5368709834	download job
fridaysforfuture.de-inf-20230115-155415-amr8r-00000.warc.os.cdx.gz	2140564	download
friuliveneziagiulia.articolo1mdp.it-inf-20230115-153623-9dz63-00000.warc.gz	49576870	download job
friuliveneziagiulia.articolo1mdp.it-inf-20230115-153623-9dz63-00000.warc.os.cdx.gz	99351	download
friuliveneziagiulia.articolo1mdp.it-inf-20230115-153623-9dz63-meta.warc.gz	94027	download job
friuliveneziagiulia.articolo1mdp.it-inf-20230115-153623-9dz63-meta.warc.os.cdx.gz	47	download
friuliveneziagiulia.articolo1mdp.it-inf-20230115-153623-9dz63.json	263	download job
inspiredbycharm.com-inf-20230114-193854-8ujui-00006.warc.gz	5368755664	download job
inspiredbycharm.com-inf-20230114-193854-8ujui-00006.warc.os.cdx.gz	1095737	download
inspiredbycharm.com-inf-20230114-193854-8ujui-00007.warc.gz	5384119229	download job
inspiredbycharm.com-inf-20230114-193854-8ujui-00007.warc.os.cdx.gz	1314043	download
inspiredbycharm.com-inf-20230114-193854-8ujui-00008.warc.gz	5372949061	download job
inspiredbycharm.com-inf-20230114-193854-8ujui-00008.warc.os.cdx.gz	1712989	download
inspiredbycharm.com-inf-20230114-193854-8ujui-00009.warc.gz	5369761112	download job
inspiredbycharm.com-inf-20230114-193854-8ujui-00009.warc.os.cdx.gz	1634184	download
inspiredbycharm.com-inf-20230114-193854-8ujui-00010.warc.gz	5378953220	download job
inspiredbycharm.com-inf-20230114-193854-8ujui-00010.warc.os.cdx.gz	1626355	download
inspiredbycharm.com-inf-20230114-193854-8ujui-00011.warc.gz	5369111686	download job
inspiredbycharm.com-inf-20230114-193854-8ujui-00011.warc.os.cdx.gz	2015550	download
inspiredbycharm.com-inf-20230114-193854-8ujui-00012.warc.gz	5386674246	download job
inspiredbycharm.com-inf-20230114-193854-8ujui-00012.warc.os.cdx.gz	1856879	download
inspiredbycharm.com-inf-20230114-193854-8ujui-00013.warc.gz	5391169861	download job
inspiredbycharm.com-inf-20230114-193854-8ujui-00013.warc.os.cdx.gz	1840465	download
inspiredbycharm.com-inf-20230114-193854-8ujui-00014.warc.gz	5422688615	download job
inspiredbycharm.com-inf-20230114-193854-8ujui-00014.warc.os.cdx.gz	2549607	download
inspiredbycharm.com-inf-20230114-193854-8ujui-00015.warc.gz	5459577361	download job
inspiredbycharm.com-inf-20230114-193854-8ujui-00015.warc.os.cdx.gz	1559863	download
inspiredbycharm.com-inf-20230114-193854-8ujui-00016.warc.gz	5369293927	download job
inspiredbycharm.com-inf-20230114-193854-8ujui-00016.warc.os.cdx.gz	840792	download
inspiredbycharm.com-inf-20230114-193854-8ujui-00017.warc.gz	5368820740	download job
inspiredbycharm.com-inf-20230114-193854-8ujui-00017.warc.os.cdx.gz	3823788	download
linktr.ee-shallow-20230115-145224-cbu7m-00000.warc.gz	1898662	download job
linktr.ee-shallow-20230115-145224-cbu7m-00000.warc.os.cdx.gz	5951	download
linktr.ee-shallow-20230115-145224-cbu7m-meta.warc.gz	6823	download job
linktr.ee-shallow-20230115-145224-cbu7m-meta.warc.os.cdx.gz	47	download
linktr.ee-shallow-20230115-145224-cbu7m.json	255	download job
listserv.fao.org-inf-20221203-043112-192su-00053.warc.gz	5368744365	download job
listserv.fao.org-inf-20221203-043112-192su-00053.warc.os.cdx.gz	18597254	download
logicmag.io-inf-20230115-074127-ddt28-00003.warc.gz	5863780046	download job
logicmag.io-inf-20230115-074127-ddt28-00003.warc.os.cdx.gz	2423	download
logicmag.io-inf-20230115-074127-ddt28-00004.warc.gz	5496358625	download job
logicmag.io-inf-20230115-074127-ddt28-00004.warc.os.cdx.gz	2552801	download
logicmag.io-inf-20230115-074127-ddt28-00005.warc.gz	11329297	download job
logicmag.io-inf-20230115-074127-ddt28-00005.warc.os.cdx.gz	79448	download
logicmag.io-inf-20230115-074127-ddt28-meta.warc.gz	2601802	download job
logicmag.io-inf-20230115-074127-ddt28-meta.warc.os.cdx.gz	47	download
logicmag.io-inf-20230115-074127-ddt28.json	237	download job
lombardia.articolo1mdp.it-inf-20230115-134943-a52v3-00000.warc.gz	44867874	download job
lombardia.articolo1mdp.it-inf-20230115-134943-a52v3-00000.warc.os.cdx.gz	71854	download
lombardia.articolo1mdp.it-inf-20230115-134943-a52v3-meta.warc.gz	52627	download job
lombardia.articolo1mdp.it-inf-20230115-134943-a52v3-meta.warc.os.cdx.gz	47	download
lombardia.articolo1mdp.it-inf-20230115-134943-a52v3.json	253	download job
luetzerathlebt.info-inf-20230115-125911-8m5jw-00000.warc.gz	5396622314	download job
luetzerathlebt.info-inf-20230115-125911-8m5jw-00000.warc.os.cdx.gz	845014	download
luetzerathlebt.info-inf-20230115-125911-8m5jw-00001.warc.gz	5411627716	download job
luetzerathlebt.info-inf-20230115-125911-8m5jw-00001.warc.os.cdx.gz	1524986	download
luetzerathlebt.info-inf-20230115-125911-8m5jw-00002.warc.gz	2914462143	download job
luetzerathlebt.info-inf-20230115-125911-8m5jw-00002.warc.os.cdx.gz	28329	download
luetzerathlebt.info-inf-20230115-125911-8m5jw-meta.warc.gz	1524717	download job
luetzerathlebt.info-inf-20230115-125911-8m5jw-meta.warc.os.cdx.gz	47	download
luetzerathlebt.info-inf-20230115-125911-8m5jw.json	246	download job
meet.howtube.com-inf-20230115-162331-255hb-00000.warc.gz	554745465	download job
meet.howtube.com-inf-20230115-162331-255hb-00000.warc.os.cdx.gz	356190	download
meet.howtube.com-inf-20230115-162331-255hb-meta.warc.gz	223275	download job
meet.howtube.com-inf-20230115-162331-255hb-meta.warc.os.cdx.gz	47	download
meet.howtube.com-inf-20230115-162331-255hb.json	246	download job
moneyway.tistory.com-inf-20230115-081646-3hfvm-00000.warc.gz	5374619928	download job
moneyway.tistory.com-inf-20230115-081646-3hfvm-00000.warc.os.cdx.gz	2008129	download
mosley.howtube.com-inf-20230115-145525-cgplo-00000.warc.gz	5404901858	download job
mosley.howtube.com-inf-20230115-145525-cgplo-00000.warc.os.cdx.gz	964576	download
mosley.howtube.com-inf-20230115-145525-cgplo-00001.warc.gz	1554216036	download job
mosley.howtube.com-inf-20230115-145525-cgplo-00001.warc.os.cdx.gz	642428	download
mosley.howtube.com-inf-20230115-145525-cgplo-meta.warc.gz	954427	download job
mosley.howtube.com-inf-20230115-145525-cgplo-meta.warc.os.cdx.gz	47	download
mosley.howtube.com-inf-20230115-145525-cgplo.json	248	download job
pastebin.mozilla.org-shallow-20230115-115909-egd59-00000.warc.gz	10205	download job
pastebin.mozilla.org-shallow-20230115-115909-egd59-00000.warc.os.cdx.gz	236	download
pastebin.mozilla.org-shallow-20230115-115909-egd59-meta.warc.gz	3498	download job
pastebin.mozilla.org-shallow-20230115-115909-egd59-meta.warc.os.cdx.gz	47	download
pastebin.mozilla.org-shallow-20230115-115909-egd59.json	257	download job
pastebin.mozilla.org-shallow-20230115-115911-btrxf-00000.warc.gz	7413	download job
pastebin.mozilla.org-shallow-20230115-115911-btrxf-00000.warc.os.cdx.gz	236	download
pastebin.mozilla.org-shallow-20230115-115911-btrxf-meta.warc.gz	3501	download job
pastebin.mozilla.org-shallow-20230115-115911-btrxf-meta.warc.os.cdx.gz	47	download
pastebin.mozilla.org-shallow-20230115-115911-btrxf.json	257	download job
project.randallcarlson.com-inf-20230115-153738-3b0d3-00000.warc.gz	573683891	download job
project.randallcarlson.com-inf-20230115-153738-3b0d3-00000.warc.os.cdx.gz	182993	download
project.randallcarlson.com-inf-20230115-153738-3b0d3-meta.warc.gz	117735	download job
project.randallcarlson.com-inf-20230115-153738-3b0d3-meta.warc.os.cdx.gz	47	download
project.randallcarlson.com-inf-20230115-153738-3b0d3.json	256	download job
puglia.articolo1mdp.it-inf-20230115-144353-45ry3-00000.warc.gz	118163567	download job
puglia.articolo1mdp.it-inf-20230115-144353-45ry3-00000.warc.os.cdx.gz	204262	download
puglia.articolo1mdp.it-inf-20230115-144353-45ry3-meta.warc.gz	176267	download job
puglia.articolo1mdp.it-inf-20230115-144353-45ry3-meta.warc.os.cdx.gz	47	download
puglia.articolo1mdp.it-inf-20230115-144353-45ry3.json	250	download job
repository.escholarship.umassmed.edu-inf-20230111-204402-1jx33-00003.warc.gz	5603187479	download job
repository.escholarship.umassmed.edu-inf-20230111-204402-1jx33-00003.warc.os.cdx.gz	3725599	download
republicbroadcasting.org-inf-20230102-015110-8zlj3-00118.warc.gz	5374486807	download job
republicbroadcasting.org-inf-20230102-015110-8zlj3-00118.warc.os.cdx.gz	2106812	download
republicbroadcasting.org-inf-20230102-015110-8zlj3-00119.warc.gz	5418518854	download job
republicbroadcasting.org-inf-20230102-015110-8zlj3-00119.warc.os.cdx.gz	894923	download
republicbroadcasting.org-inf-20230102-015110-8zlj3-00120.warc.gz	5370543628	download job
republicbroadcasting.org-inf-20230102-015110-8zlj3-00120.warc.os.cdx.gz	1079809	download
republicbroadcasting.org-inf-20230102-015110-8zlj3-00121.warc.gz	5506883257	download job
republicbroadcasting.org-inf-20230102-015110-8zlj3-00121.warc.os.cdx.gz	1007990	download
rinascimentoitalia.it-inf-20230111-221640-5fs4x-00018.warc.gz	5368762535	download job
rinascimentoitalia.it-inf-20230111-221640-5fs4x-00018.warc.os.cdx.gz	4083305	download
secure.pitchdeck.howtube.com-inf-20230115-145315-eiok4-00000.warc.gz	22489131	download job
secure.pitchdeck.howtube.com-inf-20230115-145315-eiok4-00000.warc.os.cdx.gz	33311	download
secure.pitchdeck.howtube.com-inf-20230115-145315-eiok4-meta.warc.gz	23169	download job
secure.pitchdeck.howtube.com-inf-20230115-145315-eiok4-meta.warc.os.cdx.gz	47	download
secure.pitchdeck.howtube.com-inf-20230115-145315-eiok4.json	258	download job
sicilia.articolo1mdp.it-inf-20230115-140700-cmpy2-00000.warc.gz	37572970	download job
sicilia.articolo1mdp.it-inf-20230115-140700-cmpy2-00000.warc.os.cdx.gz	46473	download
sicilia.articolo1mdp.it-inf-20230115-140700-cmpy2-meta.warc.gz	34151	download job
sicilia.articolo1mdp.it-inf-20230115-140700-cmpy2-meta.warc.os.cdx.gz	47	download
sicilia.articolo1mdp.it-inf-20230115-140700-cmpy2.json	251	download job
toscana.articolo1mdp.it-inf-20230115-140644-ew1tb-00000.warc.gz	201419206	download job
toscana.articolo1mdp.it-inf-20230115-140644-ew1tb-00000.warc.os.cdx.gz	302971	download
toscana.articolo1mdp.it-inf-20230115-140644-ew1tb-meta.warc.gz	242304	download job
toscana.articolo1mdp.it-inf-20230115-140644-ew1tb-meta.warc.os.cdx.gz	47	download
toscana.articolo1mdp.it-inf-20230115-140644-ew1tb.json	251	download job
transfer.archivete.am-shallow-20230115-160612-6k15p-00000.warc.gz	6500	download job
transfer.archivete.am-shallow-20230115-160612-6k15p-00000.warc.os.cdx.gz	249	download
transfer.archivete.am-shallow-20230115-160612-6k15p-meta.warc.gz	3455	download job
transfer.archivete.am-shallow-20230115-160612-6k15p-meta.warc.os.cdx.gz	47	download
transfer.archivete.am-shallow-20230115-160612-6k15p.json	289	download job
transfer.archivete.am-shallow-20230115-160618-1p1z9-00000.warc.gz	5205	download job
transfer.archivete.am-shallow-20230115-160618-1p1z9-00000.warc.os.cdx.gz	262	download
transfer.archivete.am-shallow-20230115-160618-1p1z9-meta.warc.gz	3551	download job
transfer.archivete.am-shallow-20230115-160618-1p1z9-meta.warc.os.cdx.gz	47	download
transfer.archivete.am-shallow-20230115-160618-1p1z9.json	298	download job
transfer.archivete.am-shallow-20230115-160635-9wv6r-00000.warc.gz	4998	download job
transfer.archivete.am-shallow-20230115-160635-9wv6r-00000.warc.os.cdx.gz	249	download
transfer.archivete.am-shallow-20230115-160635-9wv6r-meta.warc.gz	3524	download job
transfer.archivete.am-shallow-20230115-160635-9wv6r-meta.warc.os.cdx.gz	47	download
transfer.archivete.am-shallow-20230115-160635-9wv6r.json	287	download job
transfer.archivete.am-shallow-20230115-160642-f1mje-00000.warc.gz	5423	download job
transfer.archivete.am-shallow-20230115-160642-f1mje-00000.warc.os.cdx.gz	259	download
transfer.archivete.am-shallow-20230115-160642-f1mje-meta.warc.gz	3473	download job
transfer.archivete.am-shallow-20230115-160642-f1mje-meta.warc.os.cdx.gz	47	download
transfer.archivete.am-shallow-20230115-160642-f1mje.json	301	download job
transfer.archivete.am-shallow-20230115-160706-cgepe-00000.warc.gz	5866	download job
transfer.archivete.am-shallow-20230115-160706-cgepe-00000.warc.os.cdx.gz	252	download
transfer.archivete.am-shallow-20230115-160706-cgepe-meta.warc.gz	3455	download job
transfer.archivete.am-shallow-20230115-160706-cgepe-meta.warc.os.cdx.gz	47	download
transfer.archivete.am-shallow-20230115-160706-cgepe.json	290	download job
twitter.com-shallow-20230115-150322-7ub2u-00000.warc.gz	9200335	download job
twitter.com-shallow-20230115-150322-7ub2u-00000.warc.os.cdx.gz	4333	download
twitter.com-shallow-20230115-150322-7ub2u-meta.warc.gz	5807	download job
twitter.com-shallow-20230115-150322-7ub2u-meta.warc.os.cdx.gz	47	download
twitter.com-shallow-20230115-150322-7ub2u.json	256	download job
umbria.articolo1mdp.it-inf-20230115-153635-b3wma-00000.warc.gz	37172422	download job
umbria.articolo1mdp.it-inf-20230115-153635-b3wma-00000.warc.os.cdx.gz	84273	download
umbria.articolo1mdp.it-inf-20230115-153635-b3wma-meta.warc.gz	73707	download job
umbria.articolo1mdp.it-inf-20230115-153635-b3wma-meta.warc.os.cdx.gz	47	download
umbria.articolo1mdp.it-inf-20230115-153635-b3wma.json	250	download job
urls-transfer.archivete.am-hipcast_video_urls_shuffled_3.txt-shallow-20230109-183957-dhelh-00017.warc.gz	5949546349	download job
urls-transfer.archivete.am-hipcast_video_urls_shuffled_3.txt-shallow-20230109-183957-dhelh-00017.warc.os.cdx.gz	1065	download
urls-transfer.archivete.am-hipcast_video_urls_shuffled_4.txt-shallow-20230110-191105-em7wa-00011.warc.gz	6970316313	download job
urls-transfer.archivete.am-hipcast_video_urls_shuffled_4.txt-shallow-20230110-191105-em7wa-00011.warc.os.cdx.gz	684	download
urls-transfer.archivete.am-hipcast_video_urls_shuffled_5.txt-shallow-20230114-010009-cankm-00009.warc.gz	6085819082	download job
urls-transfer.archivete.am-hipcast_video_urls_shuffled_5.txt-shallow-20230114-010009-cankm-00009.warc.os.cdx.gz	1112	download
urls-transfer.archivete.am-tweakblogs.net_offsite_outlinks_and_images.txt-shallow-20230114-200238-9eufz-00001.warc.gz	5495444492	download job
urls-transfer.archivete.am-tweakblogs.net_offsite_outlinks_and_images.txt-shallow-20230114-200238-9eufz-00001.warc.os.cdx.gz	2875399	download
urls-transfer.archivete.am-tweakblogs.net_offsite_outlinks_and_images.txt-shallow-20230114-200238-9eufz-00002.warc.gz	5375303843	download job
urls-transfer.archivete.am-tweakblogs.net_offsite_outlinks_and_images.txt-shallow-20230114-200238-9eufz-00002.warc.os.cdx.gz	207763	download
urls-transfer.archivete.am-tweakblogs.net_offsite_outlinks_and_images.txt-shallow-20230114-200238-9eufz-00003.warc.gz	5369602747	download job
urls-transfer.archivete.am-tweakblogs.net_offsite_outlinks_and_images.txt-shallow-20230114-200238-9eufz-00003.warc.os.cdx.gz	1451134	download
urls-transfer.archivete.am-tweakblogs.net_offsite_outlinks_and_images.txt-shallow-20230114-200238-9eufz-00004.warc.gz	5464727163	download job
urls-transfer.archivete.am-tweakblogs.net_offsite_outlinks_and_images.txt-shallow-20230114-200238-9eufz-00004.warc.os.cdx.gz	1162863	download
urls-transfer.archivete.am-tweakblogs.net_offsite_outlinks_and_images.txt-shallow-20230114-200238-9eufz-00005.warc.gz	5455670918	download job
urls-transfer.archivete.am-tweakblogs.net_offsite_outlinks_and_images.txt-shallow-20230114-200238-9eufz-00005.warc.os.cdx.gz	528845	download
urls-transfer.archivete.am-tweakblogs.net_offsite_outlinks_and_images.txt-shallow-20230114-200238-9eufz-00006.warc.gz	5369390554	download job
urls-transfer.archivete.am-tweakblogs.net_offsite_outlinks_and_images.txt-shallow-20230114-200238-9eufz-00006.warc.os.cdx.gz	42424	download
urls-transfer.archivete.am-twitter-@BarrySilbert-shallow-20230115-041454-92b6y-00004.warc.gz	5204651250	download job
urls-transfer.archivete.am-twitter-@BarrySilbert-shallow-20230115-041454-92b6y-00004.warc.os.cdx.gz	2922153	download
urls-transfer.archivete.am-twitter-@BarrySilbert-shallow-20230115-041454-92b6y-meta.warc.gz	3390096	download job
urls-transfer.archivete.am-twitter-@BarrySilbert-shallow-20230115-041454-92b6y-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@BarrySilbert-shallow-20230115-041454-92b6y-urls.txt	579003	download
urls-transfer.archivete.am-twitter-@BarrySilbert-shallow-20230115-041454-92b6y.json	340	download job
urls-transfer.archivete.am-twitter-@Centristi_ita-shallow-20230115-153718-8gu6e-00000.warc.gz	239121024	download job
urls-transfer.archivete.am-twitter-@Centristi_ita-shallow-20230115-153718-8gu6e-00000.warc.os.cdx.gz	290624	download
urls-transfer.archivete.am-twitter-@Centristi_ita-shallow-20230115-153718-8gu6e-meta.warc.gz	169263	download job
urls-transfer.archivete.am-twitter-@Centristi_ita-shallow-20230115-153718-8gu6e-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@Centristi_ita-shallow-20230115-153718-8gu6e-urls.txt	14483	download
urls-transfer.archivete.am-twitter-@Centristi_ita-shallow-20230115-153718-8gu6e.json	340	download job
urls-transfer.archivete.am-twitter-@CosmicSummit23-shallow-20230115-143950-2yigg-00000.warc.gz	39897579	download job
urls-transfer.archivete.am-twitter-@CosmicSummit23-shallow-20230115-143950-2yigg-00000.warc.os.cdx.gz	76716	download
urls-transfer.archivete.am-twitter-@CosmicSummit23-shallow-20230115-143950-2yigg-meta.warc.gz	50524	download job
urls-transfer.archivete.am-twitter-@CosmicSummit23-shallow-20230115-143950-2yigg-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@CosmicSummit23-shallow-20230115-143950-2yigg-urls.txt	8246	download
urls-transfer.archivete.am-twitter-@CosmicSummit23-shallow-20230115-143950-2yigg.json	342	download job
urls-transfer.archivete.am-twitter-@Mondoperaio-shallow-20230115-144654-22xhc-00000.warc.gz	103985623	download job
urls-transfer.archivete.am-twitter-@Mondoperaio-shallow-20230115-144654-22xhc-00000.warc.os.cdx.gz	209528	download
urls-transfer.archivete.am-twitter-@Mondoperaio-shallow-20230115-144654-22xhc-meta.warc.gz	155865	download job
urls-transfer.archivete.am-twitter-@Mondoperaio-shallow-20230115-144654-22xhc-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@Mondoperaio-shallow-20230115-144654-22xhc-urls.txt	85177	download
urls-transfer.archivete.am-twitter-@Mondoperaio-shallow-20230115-144654-22xhc.json	334	download job
urls-transfer.archivete.am-twitter-@PaulineBruenger-shallow-20230115-155509-5hj7v-00000.warc.gz	209191926	download job
urls-transfer.archivete.am-twitter-@PaulineBruenger-shallow-20230115-155509-5hj7v-00000.warc.os.cdx.gz	250081	download
urls-transfer.archivete.am-twitter-@PaulineBruenger-shallow-20230115-155509-5hj7v-meta.warc.gz	172763	download job
urls-transfer.archivete.am-twitter-@PaulineBruenger-shallow-20230115-155509-5hj7v-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@PaulineBruenger-shallow-20230115-155509-5hj7v-urls.txt	56643	download
urls-transfer.archivete.am-twitter-@PaulineBruenger-shallow-20230115-155509-5hj7v.json	344	download job
urls-transfer.archivete.am-twitter-@Pierferdinando-shallow-20230115-153902-8zeyq-00000.warc.gz	1339386510	download job
urls-transfer.archivete.am-twitter-@Pierferdinando-shallow-20230115-153902-8zeyq-00000.warc.os.cdx.gz	823449	download
urls-transfer.archivete.am-twitter-@Pierferdinando-shallow-20230115-153902-8zeyq-meta.warc.gz	543439	download job
urls-transfer.archivete.am-twitter-@Pierferdinando-shallow-20230115-153902-8zeyq-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@Pierferdinando-shallow-20230115-153902-8zeyq-urls.txt	269272	download
urls-transfer.archivete.am-twitter-@Pierferdinando-shallow-20230115-153902-8zeyq.json	344	download job
urls-transfer.archivete.am-twitter-@ROMA_News-shallow-20230115-144859-95pgr-00000.warc.gz	3867590244	download job
urls-transfer.archivete.am-twitter-@ROMA_News-shallow-20230115-144859-95pgr-00000.warc.os.cdx.gz	3310647	download
urls-transfer.archivete.am-twitter-@ROMA_News-shallow-20230115-144859-95pgr-meta.warc.gz	2619997	download job
urls-transfer.archivete.am-twitter-@ROMA_News-shallow-20230115-144859-95pgr-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@ROMA_News-shallow-20230115-144859-95pgr-urls.txt	374735	download
urls-transfer.archivete.am-twitter-@ROMA_News-shallow-20230115-144859-95pgr.json	332	download job
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00000.warc.gz	5375396744	download job
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00000.warc.os.cdx.gz	8514845	download
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00001.warc.gz	5370642306	download job
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00001.warc.os.cdx.gz	806848	download
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00002.warc.gz	5432604828	download job
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00002.warc.os.cdx.gz	602251	download
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00003.warc.gz	5369549638	download job
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00003.warc.os.cdx.gz	972011	download
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00004.warc.gz	5442622868	download job
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00004.warc.os.cdx.gz	1119888	download
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00005.warc.gz	5415778243	download job
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00005.warc.os.cdx.gz	935844	download
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00006.warc.gz	5482978350	download job
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00006.warc.os.cdx.gz	741305	download
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00007.warc.gz	5380175504	download job
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00007.warc.os.cdx.gz	1289463	download
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00008.warc.gz	5369755833	download job
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00008.warc.os.cdx.gz	1328913	download
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00009.warc.gz	5368946125	download job
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00009.warc.os.cdx.gz	1405688	download
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00010.warc.gz	5368851154	download job
urls-transfer.archivete.am-twitter-@blakehounshell-shallow-20230114-225719-cbrji-00010.warc.os.cdx.gz	1481442	download
urls-transfer.archivete.am-twitter-@david_dresen-shallow-20230115-154924-ewb9q-00000.warc.gz	1329228498	download job
urls-transfer.archivete.am-twitter-@david_dresen-shallow-20230115-154924-ewb9q-00000.warc.os.cdx.gz	573821	download
urls-transfer.archivete.am-twitter-@david_dresen-shallow-20230115-154924-ewb9q-meta.warc.gz	389568	download job
urls-transfer.archivete.am-twitter-@david_dresen-shallow-20230115-154924-ewb9q-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@david_dresen-shallow-20230115-154924-ewb9q-urls.txt	78334	download
urls-transfer.archivete.am-twitter-@david_dresen-shallow-20230115-154924-ewb9q.json	338	download job
urls-transfer.archivete.am-twitter-@demosolidale-shallow-20230115-144726-183fy-00000.warc.gz	1617167377	download job
urls-transfer.archivete.am-twitter-@demosolidale-shallow-20230115-144726-183fy-00000.warc.os.cdx.gz	1028297	download
urls-transfer.archivete.am-twitter-@demosolidale-shallow-20230115-144726-183fy-meta.warc.gz	672429	download job
urls-transfer.archivete.am-twitter-@demosolidale-shallow-20230115-144726-183fy-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@demosolidale-shallow-20230115-144726-183fy-urls.txt	126736	download
urls-transfer.archivete.am-twitter-@demosolidale-shallow-20230115-144726-183fy.json	338	download job
urls-transfer.archivete.am-twitter-@howtubeofficial-shallow-20230115-144023-333s2-00000.warc.gz	16289481	download job
urls-transfer.archivete.am-twitter-@howtubeofficial-shallow-20230115-144023-333s2-00000.warc.os.cdx.gz	33157	download
urls-transfer.archivete.am-twitter-@howtubeofficial-shallow-20230115-144023-333s2-meta.warc.gz	24778	download job
urls-transfer.archivete.am-twitter-@howtubeofficial-shallow-20230115-144023-333s2-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@howtubeofficial-shallow-20230115-144023-333s2-urls.txt	608	download
urls-transfer.archivete.am-twitter-@howtubeofficial-shallow-20230115-144023-333s2.json	344	download job
urls-transfer.archivete.am-twitter-@inspiredbycharm-shallow-20230114-195046-1l8pt-00002.warc.gz	5174673546	download job
urls-transfer.archivete.am-twitter-@inspiredbycharm-shallow-20230114-195046-1l8pt-00002.warc.os.cdx.gz	2874856	download
urls-transfer.archivete.am-twitter-@inspiredbycharm-shallow-20230114-195046-1l8pt-meta.warc.gz	5920588	download job
urls-transfer.archivete.am-twitter-@inspiredbycharm-shallow-20230114-195046-1l8pt-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@inspiredbycharm-shallow-20230114-195046-1l8pt-urls.txt	2103721	download
urls-transfer.archivete.am-twitter-@inspiredbycharm-shallow-20230114-195046-1l8pt.json	344	download job
urls-transfer.archivete.am-twitter-@randallwcarlson-shallow-20230115-144018-4kju3-00000.warc.gz	613347763	download job
urls-transfer.archivete.am-twitter-@randallwcarlson-shallow-20230115-144018-4kju3-00000.warc.os.cdx.gz	345911	download
urls-transfer.archivete.am-twitter-@randallwcarlson-shallow-20230115-144018-4kju3-meta.warc.gz	218107	download job
urls-transfer.archivete.am-twitter-@randallwcarlson-shallow-20230115-144018-4kju3-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@randallwcarlson-shallow-20230115-144018-4kju3-urls.txt	36501	download
urls-transfer.archivete.am-twitter-@randallwcarlson-shallow-20230115-144018-4kju3.json	342	download job
urls-transfer.archivete.am-twitter-profile-@LuetziBleibt-shallow-20230115-130136-effq7-00000.warc.gz	2824247207	download job
urls-transfer.archivete.am-twitter-profile-@LuetziBleibt-shallow-20230115-130136-effq7-00000.warc.os.cdx.gz	1313137	download
urls-transfer.archivete.am-twitter-profile-@LuetziBleibt-shallow-20230115-130136-effq7-meta.warc.gz	866063	download job
urls-transfer.archivete.am-twitter-profile-@LuetziBleibt-shallow-20230115-130136-effq7-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-profile-@LuetziBleibt-shallow-20230115-130136-effq7-urls.txt	238195	download
urls-transfer.archivete.am-twitter-profile-@LuetziBleibt-shallow-20230115-130136-effq7.json	354	download job
urls-transfer.archivete.am-twitter-profile-@LuetziTicker22-shallow-20230115-130051-9uq20-00000.warc.gz	672659649	download job
urls-transfer.archivete.am-twitter-profile-@LuetziTicker22-shallow-20230115-130051-9uq20-00000.warc.os.cdx.gz	543181	download
urls-transfer.archivete.am-twitter-profile-@LuetziTicker22-shallow-20230115-130051-9uq20-meta.warc.gz	344159	download job
urls-transfer.archivete.am-twitter-profile-@LuetziTicker22-shallow-20230115-130051-9uq20-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-profile-@LuetziTicker22-shallow-20230115-130051-9uq20-urls.txt	30145	download
urls-transfer.archivete.am-twitter-profile-@LuetziTicker22-shallow-20230115-130051-9uq20.json	358	download job
urls-transfer.archivete.am-twitter-profile-@LuetziTickerEn-shallow-20230115-130101-8wuhc-00000.warc.gz	635170580	download job
urls-transfer.archivete.am-twitter-profile-@LuetziTickerEn-shallow-20230115-130101-8wuhc-00000.warc.os.cdx.gz	487373	download
urls-transfer.archivete.am-twitter-profile-@LuetziTickerEn-shallow-20230115-130101-8wuhc-meta.warc.gz	307228	download job
urls-transfer.archivete.am-twitter-profile-@LuetziTickerEn-shallow-20230115-130101-8wuhc-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-profile-@LuetziTickerEn-shallow-20230115-130101-8wuhc-urls.txt	27995	download
urls-transfer.archivete.am-twitter-profile-@LuetziTickerEn-shallow-20230115-130101-8wuhc.json	358	download job
westernstatescenter.medium.com-inf-20230115-053132-cnbms-00005.warc.gz	5455044158	download job
westernstatescenter.medium.com-inf-20230115-053132-cnbms-00005.warc.os.cdx.gz	1562013	download
westernstatescenter.medium.com-inf-20230115-053132-cnbms-00006.warc.gz	5497971880	download job
westernstatescenter.medium.com-inf-20230115-053132-cnbms-00006.warc.os.cdx.gz	645899	download
westernstatescenter.medium.com-inf-20230115-053132-cnbms-00007.warc.gz	5446726845	download job
westernstatescenter.medium.com-inf-20230115-053132-cnbms-00007.warc.os.cdx.gz	2147	download
westernstatescenter.medium.com-inf-20230115-053132-cnbms-00008.warc.gz	6655639984	download job
westernstatescenter.medium.com-inf-20230115-053132-cnbms-00008.warc.os.cdx.gz	9196	download
westernstatescenter.medium.com-inf-20230115-053132-cnbms-00009.warc.gz	5369215773	download job
westernstatescenter.medium.com-inf-20230115-053132-cnbms-00009.warc.os.cdx.gz	698194	download
westernstatescenter.medium.com-inf-20230115-053132-cnbms-00010.warc.gz	7321369735	download job
westernstatescenter.medium.com-inf-20230115-053132-cnbms-00010.warc.os.cdx.gz	1210185	download
westernstatescenter.medium.com-inf-20230115-053132-cnbms-00011.warc.gz	1835958	download job
westernstatescenter.medium.com-inf-20230115-053132-cnbms-00011.warc.os.cdx.gz	18024	download
westernstatescenter.medium.com-inf-20230115-053132-cnbms-meta.warc.gz	3823243	download job
westernstatescenter.medium.com-inf-20230115-053132-cnbms-meta.warc.os.cdx.gz	47	download
westernstatescenter.medium.com-inf-20230115-053132-cnbms.json	260	download job
wireguard.fr-inf-20230104-005115-d212n-00020.warc.gz	5368713155	download job
wireguard.fr-inf-20230104-005115-d212n-00020.warc.os.cdx.gz	3702803	download
www.alle-doerfer-bleiben.de-inf-20230115-155045-13fu5-00000.warc.gz	5369970067	download job
www.alle-doerfer-bleiben.de-inf-20230115-155045-13fu5-00000.warc.os.cdx.gz	1304418	download
www.cs.umd.edu-inf-20230108-205104-91e5w-00062.warc.gz	5885447111	download job
www.cs.umd.edu-inf-20230108-205104-91e5w-00062.warc.os.cdx.gz	3644293	download
www.cs.umd.edu-inf-20230108-205104-91e5w-00063.warc.gz	5371971151	download job
www.cs.umd.edu-inf-20230108-205104-91e5w-00063.warc.os.cdx.gz	99270	download
www.cs.umd.edu-inf-20230108-205104-91e5w-00064.warc.gz	5388599684	download job
www.cs.umd.edu-inf-20230108-205104-91e5w-00064.warc.os.cdx.gz	327795	download
www.cs.umd.edu-inf-20230108-205104-91e5w-00065.warc.gz	5429655424	download job
www.cs.umd.edu-inf-20230108-205104-91e5w-00065.warc.os.cdx.gz	233358	download
www.duplication.ca-inf-20230114-191927-a3x06-00001.warc.gz	821940211	download job
www.duplication.ca-inf-20230114-191927-a3x06-00001.warc.os.cdx.gz	1625580	download
www.duplication.ca-inf-20230114-191927-a3x06-meta.warc.gz	3383755	download job
www.duplication.ca-inf-20230114-191927-a3x06-meta.warc.os.cdx.gz	47	download
www.duplication.ca-inf-20230114-191927-a3x06.json	249	download job
www.facebook.com-shallow-20230115-145135-36es3-00000.warc.gz	265329	download job
www.facebook.com-shallow-20230115-145135-36es3-00000.warc.os.cdx.gz	2480	download
www.facebook.com-shallow-20230115-145135-36es3-meta.warc.gz	4828	download job
www.facebook.com-shallow-20230115-145135-36es3-meta.warc.os.cdx.gz	47	download
www.facebook.com-shallow-20230115-145135-36es3.json	280	download job
www.fao.org-inf-20221202-163326-a3i5o-00220.warc.gz	5368918946	download job
www.fao.org-inf-20221202-163326-a3i5o-00220.warc.os.cdx.gz	5186534	download
www.fao.org-inf-20221202-163326-a3i5o-00221.warc.gz	6759419335	download job
www.fao.org-inf-20221202-163326-a3i5o-00221.warc.os.cdx.gz	2721382	download
www.filebaike.com-inf-20221229-060834-448jp-00003.warc.gz	5368712576	download job
www.filebaike.com-inf-20221229-060834-448jp-00003.warc.os.cdx.gz	41792053	download
www.flickr.com-inf-20230115-155257-8xrlh-00000.warc.gz	5368971808	download job
www.flickr.com-inf-20230115-155257-8xrlh-00000.warc.os.cdx.gz	688498	download
www.inaturalist.org-inf-20230114-185600-1ppfl-00003.warc.gz	5369021803	download job
www.inaturalist.org-inf-20230114-185600-1ppfl-00003.warc.os.cdx.gz	3121921	download
www.isna.ir-inf-20221204-183438-46ang-00309.warc.gz	5369224741	download job
www.isna.ir-inf-20221204-183438-46ang-00309.warc.os.cdx.gz	3775162	download
www.mollymoon.com-inf-20230115-060830-bgdpo-meta.warc.gz	1647178	download job
www.mollymoon.com-inf-20230115-060830-bgdpo-meta.warc.os.cdx.gz	47	download
www.mollymoon.com-inf-20230115-060830-bgdpo.json	248	download job
www.naturalista.mx-inf-20230114-205748-7eq5a-00004.warc.gz	5368838944	download job
www.naturalista.mx-inf-20230114-205748-7eq5a-00004.warc.os.cdx.gz	2997060	download
www.naturalista.mx-inf-20230114-205748-7eq5a-00005.warc.gz	5370872058	download job
www.naturalista.mx-inf-20230114-205748-7eq5a-00005.warc.os.cdx.gz	2611155	download
www.naturalista.mx-inf-20230114-205748-7eq5a-00006.warc.gz	5368981873	download job
www.naturalista.mx-inf-20230114-205748-7eq5a-00006.warc.os.cdx.gz	2612465	download
www.nicepapertoys.com-inf-20230113-071143-bv13v-00008.warc.gz	5368901654	download job
www.nicepapertoys.com-inf-20230113-071143-bv13v-00008.warc.os.cdx.gz	2747028	download
www.nicepapertoys.com-inf-20230113-071143-bv13v-00009.warc.gz	5368852597	download job
www.nicepapertoys.com-inf-20230113-071143-bv13v-00009.warc.os.cdx.gz	2508744	download
www.onrpg.com-inf-20230111-163501-ac4gs-00015.warc.gz	5375885430	download job
www.onrpg.com-inf-20230111-163501-ac4gs-00015.warc.os.cdx.gz	11933750	download
www.patreon.com-shallow-20230115-144749-an1rv-00000.warc.gz	9364	download job
www.patreon.com-shallow-20230115-144749-an1rv-00000.warc.os.cdx.gz	267	download
www.patreon.com-shallow-20230115-144749-an1rv-meta.warc.gz	3447	download job
www.patreon.com-shallow-20230115-144749-an1rv-meta.warc.os.cdx.gz	47	download
www.patreon.com-shallow-20230115-144749-an1rv.json	293	download job
www.protocol.com-inf-20221115-235455-5irbu-00120.warc.gz	5469243874	download job
www.protocol.com-inf-20221115-235455-5irbu-00120.warc.os.cdx.gz	436601	download
www.protocol.com-inf-20221115-235455-5irbu-00121.warc.gz	5420940056	download job
www.protocol.com-inf-20221115-235455-5irbu-00121.warc.os.cdx.gz	360039	download
www.searspartsdirect.com-inf-20221228-031307-bf729-00050.warc.gz	5368793831	download job
www.searspartsdirect.com-inf-20221228-031307-bf729-00050.warc.os.cdx.gz	2888505	download
www.searspartsdirect.com-inf-20221228-031307-bf729-00051.warc.gz	5369849521	download job
www.searspartsdirect.com-inf-20221228-031307-bf729-00051.warc.os.cdx.gz	2875290	download
www.skepdoc.info-inf-20230114-220415-8agus-00005.warc.gz	4051964436	download job
www.skepdoc.info-inf-20230114-220415-8agus-00005.warc.os.cdx.gz	4257472	download
www.skepdoc.info-inf-20230114-220415-8agus-meta.warc.gz	7459681	download job
www.skepdoc.info-inf-20230114-220415-8agus-meta.warc.os.cdx.gz	47	download
www.skepdoc.info-inf-20230114-220415-8agus.json	251	download job
www.sportzpics.co.za-inf-20221227-013147-7191o-00122.warc.gz	5369442472	download job
www.sportzpics.co.za-inf-20221227-013147-7191o-00122.warc.os.cdx.gz	4388132	download
www.sportzpics.co.za-inf-20221227-013147-7191o-00123.warc.gz	5369532770	download job
www.sportzpics.co.za-inf-20221227-013147-7191o-00123.warc.os.cdx.gz	3880763	download
www.sportzpics.co.za-inf-20221227-013147-7191o-00124.warc.gz	5368739331	download job
www.sportzpics.co.za-inf-20221227-013147-7191o-00124.warc.os.cdx.gz	4497523	download
www.uktrainsim.com-inf-20230114-230515-c60u5-00000.warc.gz	5368861102	download job
www.uktrainsim.com-inf-20230114-230515-c60u5-00000.warc.os.cdx.gz	9074429	download
www.youtube.com-shallow-20230115-145148-7b8wp-00000.warc.gz	6565061	download job
www.youtube.com-shallow-20230115-145148-7b8wp-00000.warc.os.cdx.gz	10981	download
www.youtube.com-shallow-20230115-145148-7b8wp-meta.warc.gz	9730	download job
www.youtube.com-shallow-20230115-145148-7b8wp-meta.warc.os.cdx.gz	47	download
www.youtube.com-shallow-20230115-145148-7b8wp.json	281	download job