Item archiveteam_archivebot_go_20210816160001

Filename	Size
afgevents.com-inf-20210816-113529-3zq1o-00000.warc.gz	842003363	download job
afgevents.com-inf-20210816-113529-3zq1o-00000.warc.os.cdx.gz	642462	download
afgevents.com-inf-20210816-113529-3zq1o-meta.warc.gz	443019	download job
afgevents.com-inf-20210816-113529-3zq1o-meta.warc.os.cdx.gz	47	download
afgevents.com-inf-20210816-113529-3zq1o.json	236	download job
afghanwomensymposium.af-inf-20210816-125434-599h5-00000.warc.gz	397219666	download job
afghanwomensymposium.af-inf-20210816-125434-599h5-00000.warc.os.cdx.gz	152656	download
afghanwomensymposium.af-inf-20210816-125434-599h5-meta.warc.gz	92456	download job
afghanwomensymposium.af-inf-20210816-125434-599h5-meta.warc.os.cdx.gz	47	download
afghanwomensymposium.af-inf-20210816-125434-599h5.json	247	download job
amgreatness.com-inf-20210808-212555-2gk7t-00155.warc.gz	5397524617	download job
amgreatness.com-inf-20210808-212555-2gk7t-00155.warc.os.cdx.gz	630168	download
amgreatness.com-inf-20210808-212555-2gk7t-00156.warc.gz	5368728478	download job
amgreatness.com-inf-20210808-212555-2gk7t-00156.warc.os.cdx.gz	652238	download
amgreatness.com-inf-20210808-212555-2gk7t-00157.warc.gz	5377222525	download job
amgreatness.com-inf-20210808-212555-2gk7t-00157.warc.os.cdx.gz	1215789	download
amgreatness.com-inf-20210808-212555-2gk7t-00158.warc.gz	5415873762	download job
amgreatness.com-inf-20210808-212555-2gk7t-00158.warc.os.cdx.gz	541245	download
archiveteam_archivebot_go_20210816160001.cdx.gz	109153677	download
archiveteam_archivebot_go_20210816160001.cdx.idx	126816	download
archiveteam_archivebot_go_20210816160001_files.xml	0	download
archiveteam_archivebot_go_20210816160001_meta.sqlite	352256	download
archiveteam_archivebot_go_20210816160001_meta.xml	969	download
becauseipcc.thesuccession.ca-inf-20210816-112226-5k6k5-00000.warc.gz	599049583	download job
becauseipcc.thesuccession.ca-inf-20210816-112226-5k6k5-00000.warc.os.cdx.gz	373637	download
becauseipcc.thesuccession.ca-inf-20210816-112226-5k6k5-meta.warc.gz	278032	download job
becauseipcc.thesuccession.ca-inf-20210816-112226-5k6k5-meta.warc.os.cdx.gz	47	download
becauseipcc.thesuccession.ca-inf-20210816-112226-5k6k5.json	258	download job
charity.gofundme.com-shallow-20210816-112607-6c6a8-00000.warc.gz	446910	download job
charity.gofundme.com-shallow-20210816-112607-6c6a8-00000.warc.os.cdx.gz	1944	download
charity.gofundme.com-shallow-20210816-112607-6c6a8-meta.warc.gz	5145	download job
charity.gofundme.com-shallow-20210816-112607-6c6a8-meta.warc.os.cdx.gz	47	download
charity.gofundme.com-shallow-20210816-112607-6c6a8.json	278	download job
cr.dab.gov.af-inf-20210816-141853-7qxnz-00000.warc.gz	2429543	download job
cr.dab.gov.af-inf-20210816-141853-7qxnz-00000.warc.os.cdx.gz	11915	download
cr.dab.gov.af-inf-20210816-141853-7qxnz-meta.warc.gz	10702	download job
cr.dab.gov.af-inf-20210816-141853-7qxnz-meta.warc.os.cdx.gz	47	download
cr.dab.gov.af-inf-20210816-141853-7qxnz.json	240	download job
firstlady.gov.af-inf-20210816-124042-3paih-00000.warc.gz	176653416	download job
firstlady.gov.af-inf-20210816-124042-3paih-00000.warc.os.cdx.gz	105054	download
firstlady.gov.af-inf-20210816-124042-3paih-meta.warc.gz	63659	download job
firstlady.gov.af-inf-20210816-124042-3paih-meta.warc.os.cdx.gz	47	download
firstlady.gov.af-inf-20210816-124042-3paih.json	240	download job
flge.gov.af-inf-20210816-124016-8upaz-00000.warc.gz	30980230	download job
flge.gov.af-inf-20210816-124016-8upaz-00000.warc.os.cdx.gz	46040	download
flge.gov.af-inf-20210816-124016-8upaz-meta.warc.gz	31590	download job
flge.gov.af-inf-20210816-124016-8upaz-meta.warc.os.cdx.gz	47	download
flge.gov.af-inf-20210816-124016-8upaz.json	235	download job
helpdesk.mfa.gov.af-inf-20210816-131530-bh32p-00000.warc.gz	13881756	download job
helpdesk.mfa.gov.af-inf-20210816-131530-bh32p-00000.warc.os.cdx.gz	36403	download
helpdesk.mfa.gov.af-inf-20210816-131530-bh32p-meta.warc.gz	22732	download job
helpdesk.mfa.gov.af-inf-20210816-131530-bh32p-meta.warc.os.cdx.gz	47	download
helpdesk.mfa.gov.af-inf-20210816-131530-bh32p.json	246	download job
ipccfan.club-inf-20210816-112748-15jbf-00000.warc.gz	3615716	download job
ipccfan.club-inf-20210816-112748-15jbf-00000.warc.os.cdx.gz	6420	download
ipccfan.club-inf-20210816-112748-15jbf-meta.warc.gz	7328	download job
ipccfan.club-inf-20210816-112748-15jbf-meta.warc.os.cdx.gz	47	download
ipccfan.club-inf-20210816-112748-15jbf.json	242	download job
ipccfan.wordpress.com-inf-20210816-112715-8tbj6-00000.warc.gz	3617319	download job
ipccfan.wordpress.com-inf-20210816-112715-8tbj6-00000.warc.os.cdx.gz	6446	download
ipccfan.wordpress.com-inf-20210816-112715-8tbj6-meta.warc.gz	7331	download job
ipccfan.wordpress.com-inf-20210816-112715-8tbj6-meta.warc.os.cdx.gz	47	download
ipccfan.wordpress.com-inf-20210816-112715-8tbj6.json	251	download job
ipccfanclub.thesuccession.ca-inf-20210816-112816-4hp51-00000.warc.gz	110644123	download job
ipccfanclub.thesuccession.ca-inf-20210816-112816-4hp51-00000.warc.os.cdx.gz	168613	download
ipccfanclub.thesuccession.ca-inf-20210816-112816-4hp51-meta.warc.gz	131526	download job
ipccfanclub.thesuccession.ca-inf-20210816-112816-4hp51-meta.warc.os.cdx.gz	47	download
ipccfanclub.thesuccession.ca-inf-20210816-112816-4hp51.json	258	download job
kmapi.km.gov.af-inf-20210816-143512-d8axg-00000.warc.gz	24569	download job
kmapi.km.gov.af-inf-20210816-143512-d8axg-00000.warc.os.cdx.gz	713	download
kmapi.km.gov.af-inf-20210816-143512-d8axg-meta.warc.gz	3850	download job
kmapi.km.gov.af-inf-20210816-143512-d8axg-meta.warc.os.cdx.gz	47	download
kmapi.km.gov.af-inf-20210816-143512-d8axg.json	243	download job
moph-dw.gov.af-shallow-20210816-134058-av3tm-00000.warc.gz	341184	download job
moph-dw.gov.af-shallow-20210816-134058-av3tm-00000.warc.os.cdx.gz	1564	download
moph-dw.gov.af-shallow-20210816-134058-av3tm-meta.warc.gz	4430	download job
moph-dw.gov.af-shallow-20210816-134058-av3tm-meta.warc.os.cdx.gz	47	download
moph-dw.gov.af-shallow-20210816-134058-av3tm.json	246	download job
online.dab.gov.af-inf-20210816-145136-1xjn5-00000.warc.gz	18899223	download job
online.dab.gov.af-inf-20210816-145136-1xjn5-00000.warc.os.cdx.gz	25438	download
online.dab.gov.af-inf-20210816-145136-1xjn5-meta.warc.gz	19049	download job
online.dab.gov.af-inf-20210816-145136-1xjn5-meta.warc.os.cdx.gz	47	download
online.dab.gov.af-inf-20210816-145136-1xjn5.json	245	download job
polandball.fandom.com-inf-20210810-171119-15nui-00082.warc.gz	5368891278	download job
polandball.fandom.com-inf-20210810-171119-15nui-00082.warc.os.cdx.gz	3498185	download
polandball.fandom.com-inf-20210810-171119-15nui-00083.warc.gz	5369104991	download job
polandball.fandom.com-inf-20210810-171119-15nui-00083.warc.os.cdx.gz	3487340	download
polandball.fandom.com-inf-20210810-171119-15nui-00084.warc.gz	5368748121	download job
polandball.fandom.com-inf-20210810-171119-15nui-00084.warc.os.cdx.gz	3555320	download
polandball.fandom.com-inf-20210810-171119-15nui-00085.warc.gz	5368807345	download job
polandball.fandom.com-inf-20210810-171119-15nui-00085.warc.os.cdx.gz	3355905	download
t.me-inf-20210816-125016-56a33-00000.warc.gz	1411069480	download job
t.me-inf-20210816-125016-56a33-00000.warc.os.cdx.gz	5040717	download
t.me-inf-20210816-125016-56a33-meta.warc.gz	2879615	download job
t.me-inf-20210816-125016-56a33-meta.warc.os.cdx.gz	47	download
t.me-inf-20210816-125016-56a33.json	244	download job
the-earth-league.org-inf-20210816-122006-bo6up-00000.warc.gz	2474636742	download job
the-earth-league.org-inf-20210816-122006-bo6up-00000.warc.os.cdx.gz	740931	download
the-earth-league.org-inf-20210816-122006-bo6up-meta.warc.gz	490375	download job
the-earth-league.org-inf-20210816-122006-bo6up-meta.warc.os.cdx.gz	47	download
the-earth-league.org-inf-20210816-122006-bo6up.json	250	download job
thesuccession.ca-inf-20210816-113911-bknzl-00000.warc.gz	91168034	download job
thesuccession.ca-inf-20210816-113911-bknzl-00000.warc.os.cdx.gz	173962	download
thesuccession.ca-inf-20210816-113911-bknzl-meta.warc.gz	128067	download job
thesuccession.ca-inf-20210816-113911-bknzl-meta.warc.os.cdx.gz	47	download
thesuccession.ca-inf-20210816-113911-bknzl.json	246	download job
thesuccession.wordpress.com-inf-20210816-113825-er0mc-00000.warc.gz	10917171	download job
thesuccession.wordpress.com-inf-20210816-113825-er0mc-00000.warc.os.cdx.gz	5850	download
thesuccession.wordpress.com-inf-20210816-113825-er0mc-meta.warc.gz	6734	download job
thesuccession.wordpress.com-inf-20210816-113825-er0mc-meta.warc.os.cdx.gz	47	download
thesuccession.wordpress.com-inf-20210816-113825-er0mc.json	257	download job
urls-transfer.archivete.am-twitter-%23sdgs-shallow-20210613-005138-efxoq-00203.warc.gz	5374362113	download job
urls-transfer.archivete.am-twitter-%23sdgs-shallow-20210613-005138-efxoq-00203.warc.os.cdx.gz	3399127	download
urls-transfer.archivete.am-twitter-@AfganTurkMaarif-shallow-20210816-134118-c610z-00000.warc.gz	1020044423	download job
urls-transfer.archivete.am-twitter-@AfganTurkMaarif-shallow-20210816-134118-c610z-00000.warc.os.cdx.gz	887213	download
urls-transfer.archivete.am-twitter-@AfganTurkMaarif-shallow-20210816-134118-c610z-meta.warc.gz	518006	download job
urls-transfer.archivete.am-twitter-@AfganTurkMaarif-shallow-20210816-134118-c610z-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@AfganTurkMaarif-shallow-20210816-134118-c610z-urls.txt	138640	download
urls-transfer.archivete.am-twitter-@AfganTurkMaarif-shallow-20210816-134118-c610z.json	344	download job
urls-transfer.archivete.am-twitter-@AmrullahSaleh2-shallow-20210816-092728-82lmv-00000.warc.gz	1391175675	download job
urls-transfer.archivete.am-twitter-@AmrullahSaleh2-shallow-20210816-092728-82lmv-00000.warc.os.cdx.gz	2264149	download
urls-transfer.archivete.am-twitter-@AmrullahSaleh2-shallow-20210816-092728-82lmv-meta.warc.gz	1292536	download job
urls-transfer.archivete.am-twitter-@AmrullahSaleh2-shallow-20210816-092728-82lmv-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@AmrullahSaleh2-shallow-20210816-092728-82lmv-urls.txt	193954	download
urls-transfer.archivete.am-twitter-@AmrullahSaleh2-shallow-20210816-092728-82lmv.json	342	download job
urls-transfer.archivete.am-twitter-@BakhtarNA-shallow-20210816-081408-1ahn9-00000.warc.gz	3488680634	download job
urls-transfer.archivete.am-twitter-@BakhtarNA-shallow-20210816-081408-1ahn9-00000.warc.os.cdx.gz	7491946	download
urls-transfer.archivete.am-twitter-@BakhtarNA-shallow-20210816-081408-1ahn9-meta.warc.gz	4818000	download job
urls-transfer.archivete.am-twitter-@BakhtarNA-shallow-20210816-081408-1ahn9-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@BakhtarNA-shallow-20210816-081408-1ahn9-urls.txt	4493957	download
urls-transfer.archivete.am-twitter-@BakhtarNA-shallow-20210816-081408-1ahn9.json	332	download job
urls-transfer.archivete.am-twitter-@OfficialANIM-shallow-20210816-134332-755e9-00000.warc.gz	1533473371	download job
urls-transfer.archivete.am-twitter-@OfficialANIM-shallow-20210816-134332-755e9-00000.warc.os.cdx.gz	98436	download
urls-transfer.archivete.am-twitter-@OfficialANIM-shallow-20210816-134332-755e9-meta.warc.gz	74732	download job
urls-transfer.archivete.am-twitter-@OfficialANIM-shallow-20210816-134332-755e9-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@OfficialANIM-shallow-20210816-134332-755e9-urls.txt	3644	download
urls-transfer.archivete.am-twitter-@OfficialANIM-shallow-20210816-134332-755e9.json	338	download job
urls-transfer.archivete.am-twitter-@TOLOnews-shallow-20210816-101450-bf2sr-00000.warc.gz	5368756153	download job
urls-transfer.archivete.am-twitter-@TOLOnews-shallow-20210816-101450-bf2sr-00000.warc.os.cdx.gz	6659144	download
urls-transfer.archivete.am-twitter-@TheEarthLeague-shallow-20210816-121953-ev78o-00000.warc.gz	1171818743	download job
urls-transfer.archivete.am-twitter-@TheEarthLeague-shallow-20210816-121953-ev78o-00000.warc.os.cdx.gz	1021120	download
urls-transfer.archivete.am-twitter-@TheEarthLeague-shallow-20210816-121953-ev78o-meta.warc.gz	652184	download job
urls-transfer.archivete.am-twitter-@TheEarthLeague-shallow-20210816-121953-ev78o-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@TheEarthLeague-shallow-20210816-121953-ev78o-urls.txt	67166	download
urls-transfer.archivete.am-twitter-@TheEarthLeague-shallow-20210816-121953-ev78o.json	342	download job
urls-transfer.archivete.am-twitter-@VPdanesh-shallow-20210816-124736-82y2e-00000.warc.gz	276908998	download job
urls-transfer.archivete.am-twitter-@VPdanesh-shallow-20210816-124736-82y2e-00000.warc.os.cdx.gz	237502	download
urls-transfer.archivete.am-twitter-@VPdanesh-shallow-20210816-124736-82y2e-meta.warc.gz	132718	download job
urls-transfer.archivete.am-twitter-@VPdanesh-shallow-20210816-124736-82y2e-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@VPdanesh-shallow-20210816-124736-82y2e-urls.txt	47069	download
urls-transfer.archivete.am-twitter-@VPdanesh-shallow-20210816-124736-82y2e.json	330	download job
urls-transfer.archivete.am-twitter-@arezo_tv-shallow-20210816-111145-atssi-00000.warc.gz	913497515	download job
urls-transfer.archivete.am-twitter-@arezo_tv-shallow-20210816-111145-atssi-00000.warc.os.cdx.gz	2396833	download
urls-transfer.archivete.am-twitter-@arezo_tv-shallow-20210816-111145-atssi-meta.warc.gz	1295000	download job
urls-transfer.archivete.am-twitter-@arezo_tv-shallow-20210816-111145-atssi-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@arezo_tv-shallow-20210816-111145-atssi-urls.txt	618381	download
urls-transfer.archivete.am-twitter-@arezo_tv-shallow-20210816-111145-atssi.json	330	download job
urls-transfer.archivete.am-twitter-@khaama-shallow-20210816-081459-54o1u-00000.warc.gz	5368804717	download job
urls-transfer.archivete.am-twitter-@khaama-shallow-20210816-081459-54o1u-00000.warc.os.cdx.gz	8533428	download
urls-transfer.archivete.am-twitter-@morkazemian-shallow-20210816-100727-docp8-00000.warc.gz	1577186478	download job
urls-transfer.archivete.am-twitter-@morkazemian-shallow-20210816-100727-docp8-00000.warc.os.cdx.gz	1813624	download
urls-transfer.archivete.am-twitter-@morkazemian-shallow-20210816-100727-docp8-meta.warc.gz	1013154	download job
urls-transfer.archivete.am-twitter-@morkazemian-shallow-20210816-100727-docp8-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-twitter-@morkazemian-shallow-20210816-100727-docp8-urls.txt	328693	download
urls-transfer.archivete.am-twitter-@morkazemian-shallow-20210816-100727-docp8.json	336	download job
urls-transfer.archivete.am-twitter-@pajhwok-shallow-20210816-083534-d2pzf-00000.warc.gz	5368766315	download job
urls-transfer.archivete.am-twitter-@pajhwok-shallow-20210816-083534-d2pzf-00000.warc.os.cdx.gz	10091032	download
www.afganturkmaarif.org-inf-20210816-133956-22fne-meta.warc.gz	546701	download job
www.afganturkmaarif.org-inf-20210816-133956-22fne-meta.warc.os.cdx.gz	47	download
www.afganturkmaarif.org-inf-20210816-133956-22fne.json	247	download job
www.afghanaid.org.uk-inf-20210816-113636-2ta0i-00000.warc.gz	2058021245	download job
www.afghanaid.org.uk-inf-20210816-113636-2ta0i-00000.warc.os.cdx.gz	1781043	download
www.afghanaid.org.uk-inf-20210816-113636-2ta0i-meta.warc.gz	1217602	download job
www.afghanaid.org.uk-inf-20210816-113636-2ta0i-meta.warc.os.cdx.gz	47	download
www.afghanaid.org.uk-inf-20210816-113636-2ta0i.json	244	download job
www.anim-music.org-inf-20210816-134311-1h5oh-00000.warc.gz	283566778	download job
www.anim-music.org-inf-20210816-134311-1h5oh-00000.warc.os.cdx.gz	156080	download
www.anim-music.org-inf-20210816-134311-1h5oh-meta.warc.gz	130562	download job
www.anim-music.org-inf-20210816-134311-1h5oh-meta.warc.os.cdx.gz	47	download
www.anim-music.org-inf-20210816-134311-1h5oh.json	242	download job
www.c64.com-inf-20210602-182305-axufc-00011.warc.gz	5368722074	download job
www.c64.com-inf-20210602-182305-axufc-00011.warc.os.cdx.gz	26648491	download
www.econsulate.gov.af-inf-20210816-124102-qioj3-00000.warc.gz	103600620	download job
www.econsulate.gov.af-inf-20210816-124102-qioj3-00000.warc.os.cdx.gz	74005	download
www.econsulate.gov.af-inf-20210816-124102-qioj3-meta.warc.gz	55631	download job
www.econsulate.gov.af-inf-20210816-124102-qioj3-meta.warc.os.cdx.gz	47	download
www.econsulate.gov.af-inf-20210816-124102-qioj3.json	245	download job
www.flickr.com-inf-20210816-125744-39eyo-aborted-00000.warc.gz	2248329950	download job
www.flickr.com-inf-20210816-125744-39eyo-aborted-00000.warc.os.cdx.gz	500373	download
www.flickr.com-inf-20210816-125744-39eyo-aborted-wpull.log.gz	260436	download
www.flickr.com-inf-20210816-125744-39eyo-aborted.json	257	download job
www.flickr.com-inf-20210816-130752-5roxm-00000.warc.gz	441376598	download job
www.flickr.com-inf-20210816-130752-5roxm-00000.warc.os.cdx.gz	204475	download
www.flickr.com-inf-20210816-130752-5roxm-meta.warc.gz	132133	download job
www.flickr.com-inf-20210816-130752-5roxm-meta.warc.os.cdx.gz	47	download
www.flickr.com-inf-20210816-130752-5roxm.json	260	download job
www.flickr.com-inf-20210816-133401-diplw-00000.warc.gz	1615647863	download job
www.flickr.com-inf-20210816-133401-diplw-00000.warc.os.cdx.gz	351516	download
www.flickr.com-inf-20210816-133401-diplw-meta.warc.gz	196667	download job
www.flickr.com-inf-20210816-133401-diplw-meta.warc.os.cdx.gz	47	download
www.flickr.com-inf-20210816-133401-diplw.json	260	download job
www.gta5-mods.com-inf-20210712-031756-5t7u1-00076.warc.gz	5368840097	download job
www.gta5-mods.com-inf-20210712-031756-5t7u1-00076.warc.os.cdx.gz	580210	download
www.gta5-mods.com-inf-20210712-031756-5t7u1-00077.warc.gz	5402451828	download job
www.gta5-mods.com-inf-20210712-031756-5t7u1-00077.warc.os.cdx.gz	420888	download
www.hoa.gov.af-inf-20210816-130152-youuf-00000.warc.gz	539413405	download job
www.hoa.gov.af-inf-20210816-130152-youuf-00000.warc.os.cdx.gz	596929	download
www.hoa.gov.af-inf-20210816-130152-youuf-meta.warc.gz	384634	download job
www.hoa.gov.af-inf-20210816-130152-youuf-meta.warc.os.cdx.gz	47	download
www.hoa.gov.af-inf-20210816-130152-youuf.json	242	download job
www.hrw.org-shallow-20210816-113657-eiffq-00000.warc.gz	2158495	download job
www.hrw.org-shallow-20210816-113657-eiffq-00000.warc.os.cdx.gz	6008	download
www.hrw.org-shallow-20210816-113657-eiffq-meta.warc.gz	7251	download job
www.hrw.org-shallow-20210816-113657-eiffq-meta.warc.os.cdx.gz	47	download
www.hrw.org-shallow-20210816-113657-eiffq.json	255	download job
www.humanrightsfirst.org-inf-20210816-114411-6dotw-00000.warc.gz	97247	download job
www.humanrightsfirst.org-inf-20210816-114411-6dotw-00000.warc.os.cdx.gz	270	download
www.humanrightsfirst.org-inf-20210816-114411-6dotw-meta.warc.gz	3528	download job
www.humanrightsfirst.org-inf-20210816-114411-6dotw-meta.warc.os.cdx.gz	47	download
www.humanrightsfirst.org-inf-20210816-114411-6dotw.json	314	download job
www.jihadwatch.org-inf-20210808-223108-csv0d-00035.warc.gz	5370203626	download job
www.jihadwatch.org-inf-20210808-223108-csv0d-00035.warc.os.cdx.gz	1805642	download
www.jihadwatch.org-inf-20210808-223108-csv0d-00036.warc.gz	5372614573	download job
www.jihadwatch.org-inf-20210808-223108-csv0d-00036.warc.os.cdx.gz	1421365	download
www.khaama.com-inf-20210815-130804-1k72j-00013.warc.gz	5421117947	download job
www.khaama.com-inf-20210815-130804-1k72j-00013.warc.os.cdx.gz	8198752	download
www.marxists.org-inf-20210811-200645-e61sv-00113.warc.gz	5382001443	download job
www.marxists.org-inf-20210811-200645-e61sv-00113.warc.os.cdx.gz	202296	download
www.marxists.org-inf-20210811-200645-e61sv-00114.warc.gz	5399935920	download job
www.marxists.org-inf-20210811-200645-e61sv-00114.warc.os.cdx.gz	108347	download
www.marxists.org-inf-20210811-200645-e61sv-00115.warc.gz	5431300510	download job
www.marxists.org-inf-20210811-200645-e61sv-00115.warc.os.cdx.gz	106953	download
www.marxists.org-inf-20210811-200645-e61sv-00116.warc.gz	5389894221	download job
www.marxists.org-inf-20210811-200645-e61sv-00116.warc.os.cdx.gz	91234	download
www.marxists.org-inf-20210811-200645-e61sv-00117.warc.gz	5383200423	download job
www.marxists.org-inf-20210811-200645-e61sv-00117.warc.os.cdx.gz	139457	download
www.marxists.org-inf-20210811-200645-e61sv-00118.warc.gz	5371507690	download job
www.marxists.org-inf-20210811-200645-e61sv-00118.warc.os.cdx.gz	76531	download
www.marxists.org-inf-20210811-200645-e61sv-00119.warc.gz	5397687746	download job
www.marxists.org-inf-20210811-200645-e61sv-00119.warc.os.cdx.gz	68588	download
www.mohia.gov.af-inf-20210815-125525-35zow-00000.warc.gz	975233134	download job
www.mohia.gov.af-inf-20210815-125525-35zow-00000.warc.os.cdx.gz	323813	download
www.mohia.gov.af-inf-20210815-125525-35zow-meta.warc.gz	378981	download job
www.mohia.gov.af-inf-20210815-125525-35zow-meta.warc.os.cdx.gz	47	download
www.mohia.gov.af-inf-20210815-125525-35zow.json	240	download job
www.nationalheraldindia.com-shallow-20210816-124242-6i64p-00000.warc.gz	1223862	download job
www.nationalheraldindia.com-shallow-20210816-124242-6i64p-00000.warc.os.cdx.gz	4628	download
www.nationalheraldindia.com-shallow-20210816-124242-6i64p-meta.warc.gz	6348	download job
www.nationalheraldindia.com-shallow-20210816-124242-6i64p-meta.warc.os.cdx.gz	47	download
www.nationalheraldindia.com-shallow-20210816-124242-6i64p.json	371	download job
xn--bndnis-rechtsarbeit-asyl-vsc.ch-inf-20210816-153706-55xzx-00000.warc.gz	410164678	download job
xn--bndnis-rechtsarbeit-asyl-vsc.ch-inf-20210816-153706-55xzx-00000.warc.os.cdx.gz	131944	download