Item archiveteam_archivebot_go_20230618181736_ff7a5166

Filename	Size
100cosecosi.blogspot.com-inf-20230525-004802-bz8f9-00052.warc.gz	5368783504	download job
100cosecosi.blogspot.com-inf-20230525-004802-bz8f9-00052.warc.os.cdx.gz	20398943	download
archiveteam_archivebot_go_20230618181736_ff7a5166.cdx.gz	181220198	download
archiveteam_archivebot_go_20230618181736_ff7a5166.cdx.idx	188474	download
archiveteam_archivebot_go_20230618181736_ff7a5166_files.xml	0	download
archiveteam_archivebot_go_20230618181736_ff7a5166_meta.sqlite	348160	download
archiveteam_archivebot_go_20230618181736_ff7a5166_meta.xml	997	download
bestspeed.v2rayserver.ga-inf-20230603-092607-aiih1-00046.warc.gz	5370250838	download job
bestspeed.v2rayserver.ga-inf-20230603-092607-aiih1-00046.warc.os.cdx.gz	1312710	download
bestspeed.v2rayserver.ga-inf-20230603-092607-aiih1-00047.warc.gz	5543530326	download job
bestspeed.v2rayserver.ga-inf-20230603-092607-aiih1-00047.warc.os.cdx.gz	618731	download
ccafs.cgiar.org-inf-20230616-122042-ege6h-00011.warc.gz	5368726830	download job
ccafs.cgiar.org-inf-20230616-122042-ege6h-00011.warc.os.cdx.gz	8392902	download
data.worldagroforestry.org-inf-20230618-012933-447mo-00000.warc.gz	5368720907	download job
data.worldagroforestry.org-inf-20230618-012933-447mo-00000.warc.os.cdx.gz	8597739	download
digitalarchive.worldfishcenter.org-inf-20230617-202252-5ixlt-00002.warc.gz	2062666136	download job
digitalarchive.worldfishcenter.org-inf-20230617-202252-5ixlt-00002.warc.os.cdx.gz	3259872	download
digitalarchive.worldfishcenter.org-inf-20230617-202252-5ixlt-meta.warc.gz	3916997	download job
digitalarchive.worldfishcenter.org-inf-20230617-202252-5ixlt-meta.warc.os.cdx.gz	47	download
digitalarchive.worldfishcenter.org-inf-20230617-202252-5ixlt.json	264	download job
digitalcommons.fiu.edu-inf-20230609-224142-8evrm-00033.warc.gz	5537812593	download job
digitalcommons.fiu.edu-inf-20230609-224142-8evrm-00033.warc.os.cdx.gz	883	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00194.warc.gz	5798873417	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00194.warc.os.cdx.gz	7182622	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00195.warc.gz	6031247785	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00195.warc.os.cdx.gz	2611	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00196.warc.gz	6251037798	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00196.warc.os.cdx.gz	1025	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00197.warc.gz	5551507760	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00197.warc.os.cdx.gz	1386	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00198.warc.gz	6909494162	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00198.warc.os.cdx.gz	1373	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00199.warc.gz	7359694001	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00199.warc.os.cdx.gz	1457	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00200.warc.gz	6255432903	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00200.warc.os.cdx.gz	912	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00201.warc.gz	8513331246	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00201.warc.os.cdx.gz	1477	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00202.warc.gz	8496447887	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00202.warc.os.cdx.gz	1371	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00203.warc.gz	7609064332	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00203.warc.os.cdx.gz	1461	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00204.warc.gz	6641784736	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00204.warc.os.cdx.gz	2342	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00205.warc.gz	8493288520	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00205.warc.os.cdx.gz	1106	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00206.warc.gz	7549999572	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00206.warc.os.cdx.gz	1712	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00207.warc.gz	7119105091	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00207.warc.os.cdx.gz	1234	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00208.warc.gz	8401132293	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00208.warc.os.cdx.gz	1512	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00209.warc.gz	7000239705	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00209.warc.os.cdx.gz	2379	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00210.warc.gz	7426976436	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00210.warc.os.cdx.gz	1014	download
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00211.warc.gz	7236716721	download job
digitalcommons.georgiasouthern.edu-inf-20230611-204111-4as3d-00211.warc.os.cdx.gz	789	download
digitalcommons.iwu.edu-inf-20230618-041813-7ozzo-00007.warc.gz	5368715668	download job
digitalcommons.iwu.edu-inf-20230618-041813-7ozzo-00007.warc.os.cdx.gz	998405	download
digitalcommons.iwu.edu-inf-20230618-041813-7ozzo-00008.warc.gz	5370804910	download job
digitalcommons.iwu.edu-inf-20230618-041813-7ozzo-00008.warc.os.cdx.gz	2409146	download
digitalcommons.iwu.edu-inf-20230618-041813-7ozzo-00009.warc.gz	5368709613	download job
digitalcommons.iwu.edu-inf-20230618-041813-7ozzo-00009.warc.os.cdx.gz	1402051	download
digitalcommons.iwu.edu-inf-20230618-041813-7ozzo-00010.warc.gz	718030324	download job
digitalcommons.iwu.edu-inf-20230618-041813-7ozzo-00010.warc.os.cdx.gz	574019	download
digitalcommons.iwu.edu-inf-20230618-041813-7ozzo-meta.warc.gz	6528362	download job
digitalcommons.iwu.edu-inf-20230618-041813-7ozzo-meta.warc.os.cdx.gz	47	download
digitalcommons.iwu.edu-inf-20230618-041813-7ozzo.json	252	download job
download.mono-project.com-inf-20230611-121642-b5iyk-00469.warc.gz	5370733345	download job
download.mono-project.com-inf-20230611-121642-b5iyk-00469.warc.os.cdx.gz	283963	download
download.mono-project.com-inf-20230611-121642-b5iyk-00470.warc.gz	5417857528	download job
download.mono-project.com-inf-20230611-121642-b5iyk-00470.warc.os.cdx.gz	264505	download
download.mono-project.com-inf-20230611-121642-b5iyk-00471.warc.gz	5443886175	download job
download.mono-project.com-inf-20230611-121642-b5iyk-00471.warc.os.cdx.gz	322007	download
download.mono-project.com-inf-20230611-121642-b5iyk-00472.warc.gz	5370116249	download job
download.mono-project.com-inf-20230611-121642-b5iyk-00472.warc.os.cdx.gz	277162	download
download.mono-project.com-inf-20230611-121642-b5iyk-00473.warc.gz	5370691901	download job
download.mono-project.com-inf-20230611-121642-b5iyk-00473.warc.os.cdx.gz	259981	download
educacaoetransformacaooficial.blogspot.com-inf-20230618-105754-91out-00000.warc.gz	5368738159	download job
educacaoetransformacaooficial.blogspot.com-inf-20230618-105754-91out-00000.warc.os.cdx.gz	1358114	download
educacaoetransformacaooficial.blogspot.com-inf-20230618-105754-91out-00001.warc.gz	5369087154	download job
educacaoetransformacaooficial.blogspot.com-inf-20230618-105754-91out-00001.warc.os.cdx.gz	1361811	download
educacaoetransformacaooficial.blogspot.com-inf-20230618-105754-91out-00002.warc.gz	5369012858	download job
educacaoetransformacaooficial.blogspot.com-inf-20230618-105754-91out-00002.warc.os.cdx.gz	1474069	download
en.wikipedia.org-shallow-20230618-134721-92xd6-00000.warc.gz	634336	download job
en.wikipedia.org-shallow-20230618-134721-92xd6-00000.warc.os.cdx.gz	6123	download
en.wikipedia.org-shallow-20230618-134721-92xd6-meta.warc.gz	7132	download job
en.wikipedia.org-shallow-20230618-134721-92xd6-meta.warc.os.cdx.gz	47	download
en.wikipedia.org-shallow-20230618-134721-92xd6.json	275	download job
en.wikipedia.org-shallow-20230618-134727-dpx19-00000.warc.gz	338209	download job
en.wikipedia.org-shallow-20230618-134727-dpx19-00000.warc.os.cdx.gz	6096	download
en.wikipedia.org-shallow-20230618-134727-dpx19-meta.warc.gz	7084	download job
en.wikipedia.org-shallow-20230618-134727-dpx19-meta.warc.os.cdx.gz	47	download
en.wikipedia.org-shallow-20230618-134727-dpx19.json	303	download job
forums.dolphin-emu.org-inf-20230610-054419-dptsb-00007.warc.gz	5378881741	download job
forums.dolphin-emu.org-inf-20230610-054419-dptsb-00007.warc.os.cdx.gz	637546	download
forums.dolphin-emu.org-inf-20230610-054419-dptsb-00008.warc.gz	5383702672	download job
forums.dolphin-emu.org-inf-20230610-054419-dptsb-00008.warc.os.cdx.gz	521827	download
forums.dolphin-emu.org-inf-20230610-054419-dptsb-00009.warc.gz	5368800940	download job
forums.dolphin-emu.org-inf-20230610-054419-dptsb-00009.warc.os.cdx.gz	1940651	download
freewechat.com-inf-20221128-202335-8k26b-01986.warc.gz	5370417516	download job
freewechat.com-inf-20221128-202335-8k26b-01986.warc.os.cdx.gz	3001058	download
freewechat.com-inf-20221128-202335-8k26b-01987.warc.gz	5368985935	download job
freewechat.com-inf-20221128-202335-8k26b-01987.warc.os.cdx.gz	3128478	download
isource.com-inf-20230618-005903-7718s-00001.warc.gz	5371187585	download job
isource.com-inf-20230618-005903-7718s-00001.warc.os.cdx.gz	2985943	download
neeva.com-inf-20230521-043218-blusz-00112.warc.gz	5589204011	download job
neeva.com-inf-20230521-043218-blusz-00112.warc.os.cdx.gz	2009507	download
nextnewvedios.blogspot.com-inf-20230618-110000-73klw-00000.warc.gz	194417351	download job
nextnewvedios.blogspot.com-inf-20230618-110000-73klw-00000.warc.os.cdx.gz	1050577	download
nextnewvedios.blogspot.com-inf-20230618-110000-73klw-meta.warc.gz	646616	download job
nextnewvedios.blogspot.com-inf-20230618-110000-73klw-meta.warc.os.cdx.gz	47	download
nextnewvedios.blogspot.com-inf-20230618-110000-73klw.json	259	download job
rolka.me-inf-20230419-095405-dnlln-00026.warc.gz	5369293221	download job
rolka.me-inf-20230419-095405-dnlln-00026.warc.os.cdx.gz	7778395	download
sagan4.jcink.net-inf-20230617-092848-bnf0n-00001.warc.gz	665918857	download job
sagan4.jcink.net-inf-20230617-092848-bnf0n-00001.warc.os.cdx.gz	2965977	download
sagan4.jcink.net-inf-20230617-092848-bnf0n-meta.warc.gz	3682043	download job
sagan4.jcink.net-inf-20230617-092848-bnf0n-meta.warc.os.cdx.gz	47	download
sagan4.jcink.net-inf-20230617-092848-bnf0n.json	248	download job
sauverlesgrands-pres.org-inf-20230618-155012-6h0h1-00000.warc.gz	162642748	download job
sauverlesgrands-pres.org-inf-20230618-155012-6h0h1-00000.warc.os.cdx.gz	206659	download
sauverlesgrands-pres.org-inf-20230618-155012-6h0h1-meta.warc.gz	126293	download job
sauverlesgrands-pres.org-inf-20230618-155012-6h0h1-meta.warc.os.cdx.gz	47	download
sauverlesgrands-pres.org-inf-20230618-155012-6h0h1.json	251	download job
senegaldairy.wordpress.com-inf-20230618-154926-3q7qb-00000.warc.gz	607656018	download job
senegaldairy.wordpress.com-inf-20230618-154926-3q7qb-00000.warc.os.cdx.gz	431434	download
senegaldairy.wordpress.com-inf-20230618-154926-3q7qb-meta.warc.gz	284316	download job
senegaldairy.wordpress.com-inf-20230618-154926-3q7qb-meta.warc.os.cdx.gz	47	download
senegaldairy.wordpress.com-inf-20230618-154926-3q7qb.json	256	download job
soylentnews.org-inf-20230523-205459-bxyzg-00267.warc.gz	5369483924	download job
soylentnews.org-inf-20230523-205459-bxyzg-00267.warc.os.cdx.gz	1822028	download
soylentnews.org-inf-20230523-205459-bxyzg-00268.warc.gz	5854521653	download job
soylentnews.org-inf-20230523-205459-bxyzg-00268.warc.os.cdx.gz	1468437	download
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00573.warc.gz	5369490893	download job
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00573.warc.os.cdx.gz	1213506	download
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00574.warc.gz	5369378463	download job
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00574.warc.os.cdx.gz	1173561	download
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00575.warc.gz	5374985703	download job
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00575.warc.os.cdx.gz	964375	download
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00576.warc.gz	5374085521	download job
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00576.warc.os.cdx.gz	1225917	download
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00577.warc.gz	5374951963	download job
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00577.warc.os.cdx.gz	1060569	download
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00578.warc.gz	5380497704	download job
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00578.warc.os.cdx.gz	1402715	download
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00579.warc.gz	5369357497	download job
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00579.warc.os.cdx.gz	1097459	download
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00580.warc.gz	5370856969	download job
spockvarietyhour.tumblr.com-inf-20230601-082859-e7qti-00580.warc.os.cdx.gz	1048518	download
stadt-bremerhaven.de-inf-20230612-184928-6s8rf-00030.warc.gz	6127842740	download job
stadt-bremerhaven.de-inf-20230612-184928-6s8rf-00030.warc.os.cdx.gz	2109424	download
stadt-bremerhaven.de-inf-20230612-184928-6s8rf-00031.warc.gz	5988557191	download job
stadt-bremerhaven.de-inf-20230612-184928-6s8rf-00031.warc.os.cdx.gz	708638	download
stadt-bremerhaven.de-inf-20230612-184928-6s8rf-00032.warc.gz	6088894216	download job
stadt-bremerhaven.de-inf-20230612-184928-6s8rf-00032.warc.os.cdx.gz	331964	download
stadt-bremerhaven.de-inf-20230612-184928-6s8rf-00033.warc.gz	6754489992	download job
stadt-bremerhaven.de-inf-20230612-184928-6s8rf-00033.warc.os.cdx.gz	1055	download
stadt-bremerhaven.de-inf-20230612-184928-6s8rf-00034.warc.gz	5590819272	download job
stadt-bremerhaven.de-inf-20230612-184928-6s8rf-00034.warc.os.cdx.gz	3923	download
swazibeefschemes.wordpress.com-inf-20230618-152949-cnk7z-00000.warc.gz	481941205	download job
swazibeefschemes.wordpress.com-inf-20230618-152949-cnk7z-00000.warc.os.cdx.gz	411679	download
swazibeefschemes.wordpress.com-inf-20230618-152949-cnk7z-meta.warc.gz	252644	download job
swazibeefschemes.wordpress.com-inf-20230618-152949-cnk7z-meta.warc.os.cdx.gz	47	download
swazibeefschemes.wordpress.com-inf-20230618-152949-cnk7z.json	260	download job
tinsnip.tumblr.com-inf-20230526-210622-47hmw-00316.warc.gz	5369021540	download job
tinsnip.tumblr.com-inf-20230526-210622-47hmw-00316.warc.os.cdx.gz	7050644	download
tinsnip.tumblr.com-inf-20230526-210622-47hmw-00317.warc.gz	5368728619	download job
tinsnip.tumblr.com-inf-20230526-210622-47hmw-00317.warc.os.cdx.gz	4058268	download
tirlaeyn.tumblr.com-inf-20230601-232422-35u1m-00186.warc.gz	5369247503	download job
tirlaeyn.tumblr.com-inf-20230601-232422-35u1m-00186.warc.os.cdx.gz	11926579	download
tools4seedsystems.org-inf-20230618-152423-b7dvj-00000.warc.gz	386586295	download job
tools4seedsystems.org-inf-20230618-152423-b7dvj-00000.warc.os.cdx.gz	946988	download
tools4seedsystems.org-inf-20230618-152423-b7dvj-meta.warc.gz	588855	download job
tools4seedsystems.org-inf-20230618-152423-b7dvj-meta.warc.os.cdx.gz	47	download
tools4seedsystems.org-inf-20230618-152423-b7dvj.json	251	download job
urls-transfer.notkiska.pw-irc-urls-20230614-shallow-20230615-050135-q39st-00007.warc.gz	501849947	download job
urls-transfer.notkiska.pw-irc-urls-20230614-shallow-20230615-050135-q39st-00007.warc.os.cdx.gz	284275	download
urls-transfer.notkiska.pw-irc-urls-20230614-shallow-20230615-050135-q39st-meta.warc.gz	4315216	download job
urls-transfer.notkiska.pw-irc-urls-20230614-shallow-20230615-050135-q39st-meta.warc.os.cdx.gz	47	download
urls-transfer.notkiska.pw-irc-urls-20230614-shallow-20230615-050135-q39st-urls.txt	269741	download
urls-transfer.notkiska.pw-irc-urls-20230614-shallow-20230615-050135-q39st.json	325	download job
urls-transfer.notkiska.pw-irc-urls-20230616-shallow-20230617-141729-cnoqn-00005.warc.gz	5525585380	download job
urls-transfer.notkiska.pw-irc-urls-20230616-shallow-20230617-141729-cnoqn-00005.warc.os.cdx.gz	2092773	download
urls-transfer.notkiska.pw-irc-urls-20230617-shallow-20230618-072713-dy256-00000.warc.gz	11066457170	download job
urls-transfer.notkiska.pw-irc-urls-20230617-shallow-20230618-072713-dy256-00000.warc.os.cdx.gz	1773680	download
urls-transfer.notkiska.pw-irc-urls-20230617-shallow-20230618-072713-dy256-00001.warc.gz	5369335733	download job
urls-transfer.notkiska.pw-irc-urls-20230617-shallow-20230618-072713-dy256-00001.warc.os.cdx.gz	878128	download
vslp.org-inf-20230618-123836-727mb-00000.warc.gz	1285523412	download job
vslp.org-inf-20230618-123836-727mb-00000.warc.os.cdx.gz	1209005	download
vslp.org-inf-20230618-123836-727mb-meta.warc.gz	782094	download job
vslp.org-inf-20230618-123836-727mb-meta.warc.os.cdx.gz	47	download
vslp.org-inf-20230618-123836-727mb.json	238	download job
wetheitalians.com-inf-20230513-010427-7qx5s-00118.warc.gz	5404900009	download job
wetheitalians.com-inf-20230513-010427-7qx5s-00118.warc.os.cdx.gz	10215	download
wetheitalians.com-inf-20230513-010427-7qx5s-00119.warc.gz	5426470874	download job
wetheitalians.com-inf-20230513-010427-7qx5s-00119.warc.os.cdx.gz	13203	download
wetheitalians.com-inf-20230513-010427-7qx5s-00120.warc.gz	5544129875	download job
wetheitalians.com-inf-20230513-010427-7qx5s-00120.warc.os.cdx.gz	7207	download
wetheitalians.com-inf-20230513-010427-7qx5s-00121.warc.gz	5390424159	download job
wetheitalians.com-inf-20230513-010427-7qx5s-00121.warc.os.cdx.gz	13557	download
wetheitalians.com-inf-20230513-010427-7qx5s-00122.warc.gz	5441389965	download job
wetheitalians.com-inf-20230513-010427-7qx5s-00122.warc.os.cdx.gz	12647	download
wetheitalians.com-inf-20230513-010427-7qx5s-00123.warc.gz	5516619052	download job
wetheitalians.com-inf-20230513-010427-7qx5s-00123.warc.os.cdx.gz	12543	download
wetheitalians.com-inf-20230513-010427-7qx5s-00124.warc.gz	5371441052	download job
wetheitalians.com-inf-20230513-010427-7qx5s-00124.warc.os.cdx.gz	256155	download
wetheitalians.com-inf-20230513-010427-7qx5s-00125.warc.gz	5369545009	download job
wetheitalians.com-inf-20230513-010427-7qx5s-00125.warc.os.cdx.gz	248519	download
wololo.net-inf-20230618-023424-1f8qe-00000.warc.gz	5368974967	download job
wololo.net-inf-20230618-023424-1f8qe-00000.warc.os.cdx.gz	2820715	download
www.argentina.gob.ar-inf-20230604-065217-dg9n0-00046.warc.gz	5368879151	download job
www.argentina.gob.ar-inf-20230604-065217-dg9n0-00046.warc.os.cdx.gz	1341850	download
www.artgallery.nsw.gov.au-inf-20230605-005908-21cn0-00008.warc.gz	5368762584	download job
www.artgallery.nsw.gov.au-inf-20230605-005908-21cn0-00008.warc.os.cdx.gz	2891860	download
www.buzzfeednews.com-inf-20230420-160602-d4rha-00844.warc.gz	5368996698	download job
www.buzzfeednews.com-inf-20230420-160602-d4rha-00844.warc.os.cdx.gz	1524580	download
www.buzzfeednews.com-inf-20230420-160602-d4rha-00845.warc.gz	5368972127	download job
www.buzzfeednews.com-inf-20230420-160602-d4rha-00845.warc.os.cdx.gz	1189961	download
www.lesgrandspres.ch-inf-20230618-155526-4d03k-00000.warc.gz	62404696	download job
www.lesgrandspres.ch-inf-20230618-155526-4d03k-00000.warc.os.cdx.gz	77289	download
www.lesgrandspres.ch-inf-20230618-155526-4d03k-meta.warc.gz	49306	download job
www.lesgrandspres.ch-inf-20230618-155526-4d03k-meta.warc.os.cdx.gz	47	download
www.lesgrandspres.ch-inf-20230618-155526-4d03k.json	247	download job
www.motherjones.com-inf-20230614-183835-2x6sz-00052.warc.gz	5368740323	download job
www.motherjones.com-inf-20230614-183835-2x6sz-00052.warc.os.cdx.gz	443265	download
www.motherjones.com-inf-20230614-183835-2x6sz-00053.warc.gz	5376267635	download job
www.motherjones.com-inf-20230614-183835-2x6sz-00053.warc.os.cdx.gz	2108393	download
www.motherjones.com-inf-20230614-183835-2x6sz-00054.warc.gz	5372950205	download job
www.motherjones.com-inf-20230614-183835-2x6sz-00054.warc.os.cdx.gz	263051	download
www.non-initiative-grands-pres.ch-inf-20230618-155612-1wftp-00000.warc.gz	50445328	download job
www.non-initiative-grands-pres.ch-inf-20230618-155612-1wftp-00000.warc.os.cdx.gz	56566	download
www.non-initiative-grands-pres.ch-inf-20230618-155612-1wftp-meta.warc.gz	38849	download job
www.non-initiative-grands-pres.ch-inf-20230618-155612-1wftp-meta.warc.os.cdx.gz	47	download
www.non-initiative-grands-pres.ch-inf-20230618-155612-1wftp.json	260	download job
www.prnewswire.com-inf-20230617-081047-15kt1-00001.warc.gz	5401332771	download job
www.prnewswire.com-inf-20230617-081047-15kt1-00001.warc.os.cdx.gz	2779554	download
www.rtb-bananaresearchpriorities.org-inf-20230618-170532-cpuzx-00000.warc.gz	4211259	download job
www.rtb-bananaresearchpriorities.org-inf-20230618-170532-cpuzx-00000.warc.os.cdx.gz	7937	download
www.rtb-bananaresearchpriorities.org-inf-20230618-170532-cpuzx-meta.warc.gz	8090	download job
www.rtb-bananaresearchpriorities.org-inf-20230618-170532-cpuzx-meta.warc.os.cdx.gz	47	download
www.rtb-bananaresearchpriorities.org-inf-20230618-170532-cpuzx.json	265	download job
www.shrinemaiden.com-inf-20230618-011113-c2xs2-00000.warc.gz	5414087896	download job
www.shrinemaiden.com-inf-20230618-011113-c2xs2-00000.warc.os.cdx.gz	4962044	download
www.shrinemaiden.com-inf-20230618-011113-c2xs2-00001.warc.gz	719679909	download job
www.shrinemaiden.com-inf-20230618-011113-c2xs2-00001.warc.os.cdx.gz	1478368	download
www.shrinemaiden.com-inf-20230618-011113-c2xs2-meta.warc.gz	4291397	download job
www.shrinemaiden.com-inf-20230618-011113-c2xs2-meta.warc.os.cdx.gz	47	download
www.shrinemaiden.com-inf-20230618-011113-c2xs2.json	257	download job
www.shrinemaiden.org-inf-20230618-010914-5l61y-00001.warc.gz	5370394472	download job
www.shrinemaiden.org-inf-20230618-010914-5l61y-00001.warc.os.cdx.gz	5537029	download
www.simplemost.com-inf-20230610-044317-at6jv-00097.warc.gz	5481837422	download job
www.simplemost.com-inf-20230610-044317-at6jv-00097.warc.os.cdx.gz	1133457	download
www.simplemost.com-inf-20230610-044317-at6jv-00098.warc.gz	5407678964	download job
www.simplemost.com-inf-20230610-044317-at6jv-00098.warc.os.cdx.gz	1876348	download
www.simplemost.com-inf-20230610-044317-at6jv-00099.warc.gz	5369614683	download job
www.simplemost.com-inf-20230610-044317-at6jv-00099.warc.os.cdx.gz	1895083	download
www.simplemost.com-inf-20230610-044317-at6jv-00100.warc.gz	5446213235	download job
www.simplemost.com-inf-20230610-044317-at6jv-00100.warc.os.cdx.gz	1837464	download
www.sweclockers.com-inf-20230422-074104-f0uya-00060.warc.gz	5368957131	download job
www.sweclockers.com-inf-20230422-074104-f0uya-00060.warc.os.cdx.gz	4625887	download
www.taptap.io-inf-20230604-091342-do8aj-00015.warc.gz	5368754911	download job
www.taptap.io-inf-20230604-091342-do8aj-00015.warc.os.cdx.gz	5957492	download
www.theaterbellevue.nl-shallow-20230618-134816-aiyt3-00000.warc.gz	1665645	download job
www.theaterbellevue.nl-shallow-20230618-134816-aiyt3-00000.warc.os.cdx.gz	4327	download
www.theaterbellevue.nl-shallow-20230618-134816-aiyt3-meta.warc.gz	6278	download job
www.theaterbellevue.nl-shallow-20230618-134816-aiyt3-meta.warc.os.cdx.gz	47	download
www.theaterbellevue.nl-shallow-20230618-134816-aiyt3.json	377	download job
www.transformingfoodsystems.com-inf-20230618-150150-27ugu-00000.warc.gz	76527552	download job
www.transformingfoodsystems.com-inf-20230618-150150-27ugu-00000.warc.os.cdx.gz	83593	download
www.transformingfoodsystems.com-inf-20230618-150150-27ugu-meta.warc.gz	57806	download job
www.transformingfoodsystems.com-inf-20230618-150150-27ugu-meta.warc.os.cdx.gz	47	download
www.transformingfoodsystems.com-inf-20230618-150150-27ugu.json	261	download job
www.vice.com-inf-20230502-094429-3m7tt-00478.warc.gz	5368709890	download job
www.vice.com-inf-20230502-094429-3m7tt-00478.warc.os.cdx.gz	2132592	download
www.virtualnights.com-inf-20230612-185151-dez6r-00033.warc.gz	5370136029	download job
www.virtualnights.com-inf-20230612-185151-dez6r-00033.warc.os.cdx.gz	5460096	download