Item archiveteam_archivebot_go_20260430201721_3978cb11

Filename	Size
84.22.143.158-inf-20260429-195059-81z4l-00040.warc.gz	5391488295	download job
84.22.143.158-inf-20260429-195059-81z4l-00040.warc.os.cdx.gz	5635	download
archiveteam_archivebot_go_20260430201721_3978cb11.cdx.gz	4516180	download
archiveteam_archivebot_go_20260430201721_3978cb11.cdx.idx	4277	download
archiveteam_archivebot_go_20260430201721_3978cb11_files.xml	0	download
archiveteam_archivebot_go_20260430201721_3978cb11_meta.sqlite	192512	download
archiveteam_archivebot_go_20260430201721_3978cb11_meta.xml	1046	download
bahasa.lang.sg-inf-20260430-195909-eteoe-00000.warc.gz	6318	download job
bahasa.lang.sg-inf-20260430-195909-eteoe-00000.warc.os.cdx.gz	298	download
bahasa.lang.sg-inf-20260430-195909-eteoe-meta.warc.gz	3631	download job
bahasa.lang.sg-inf-20260430-195909-eteoe-meta.warc.os.cdx.gz	47	download
bahasa.lang.sg-inf-20260430-195909-eteoe.json	245	download job
cemetery.lang.sg-inf-20260430-200412-3svt4-00000.warc.gz	2468	download job
cemetery.lang.sg-inf-20260430-200412-3svt4-00000.warc.os.cdx.gz	47	download
cemetery.lang.sg-inf-20260430-200412-3svt4-meta.warc.gz	3557	download job
cemetery.lang.sg-inf-20260430-200412-3svt4-meta.warc.os.cdx.gz	47	download
cemetery.lang.sg-inf-20260430-200412-3svt4.json	247	download job
cemetry.lang.sg-inf-20260430-200422-ehs9n-00000.warc.gz	2461	download job
cemetry.lang.sg-inf-20260430-200422-ehs9n-00000.warc.os.cdx.gz	47	download
cemetry.lang.sg-inf-20260430-200422-ehs9n-meta.warc.gz	3476	download job
cemetry.lang.sg-inf-20260430-200422-ehs9n-meta.warc.os.cdx.gz	47	download
cemetry.lang.sg-inf-20260430-200422-ehs9n.json	246	download job
das.sdss.org-inf-20250226-051304-5s39o-07652.warc.gz	5368959020	download job
das.sdss.org-inf-20250226-051304-5s39o-07652.warc.os.cdx.gz	364226	download
emilyhall.lang.sg-inf-20260430-200023-5rv06-00000.warc.gz	13063	download job
emilyhall.lang.sg-inf-20260430-200023-5rv06-00000.warc.os.cdx.gz	333	download
emilyhall.lang.sg-inf-20260430-200023-5rv06-meta.warc.gz	3629	download job
emilyhall.lang.sg-inf-20260430-200023-5rv06-meta.warc.os.cdx.gz	47	download
emilyhall.lang.sg-inf-20260430-200023-5rv06.json	248	download job
eric.lang.sg-inf-20260430-200122-6fsbo-00000.warc.gz	18842628	download job
eric.lang.sg-inf-20260430-200122-6fsbo-00000.warc.os.cdx.gz	3723	download
eric.lang.sg-inf-20260430-200122-6fsbo-meta.warc.gz	5621	download job
eric.lang.sg-inf-20260430-200122-6fsbo-meta.warc.os.cdx.gz	47	download
eric.lang.sg-inf-20260430-200122-6fsbo.json	243	download job
ericmlang.com-inf-20260430-195813-ab5v7-00000.warc.gz	376858677	download job
ericmlang.com-inf-20260430-195813-ab5v7-00000.warc.os.cdx.gz	309118	download
ericmlang.com-inf-20260430-195813-ab5v7-meta.warc.gz	189296	download job
ericmlang.com-inf-20260430-195813-ab5v7-meta.warc.os.cdx.gz	47	download
ericmlang.com-inf-20260430-195813-ab5v7.json	244	download job
foreveryoung.sapo.pt-inf-20260430-154812-9tsfc-00001.warc.gz	5368866278	download job
foreveryoung.sapo.pt-inf-20260430-154812-9tsfc-00001.warc.os.cdx.gz	3258527	download
globalnews.ca-inf-20250821-223546-ejnq1-03294.warc.gz	5389974783	download job
globalnews.ca-inf-20250821-223546-ejnq1-03294.warc.os.cdx.gz	658703	download
history.okeq.org-inf-20260429-221415-a1p7h-00010.warc.gz	5369024357	download job
history.okeq.org-inf-20260429-221415-a1p7h-00010.warc.os.cdx.gz	1905122	download
inventory.herniarchiv.cz-inf-20260430-063210-4n0jq-00015.warc.gz	5370582889	download job
inventory.herniarchiv.cz-inf-20260430-063210-4n0jq-00015.warc.os.cdx.gz	115088	download
islam.lang.sg-inf-20260430-200455-wo8nb-00000.warc.gz	2457	download job
islam.lang.sg-inf-20260430-200455-wo8nb-00000.warc.os.cdx.gz	47	download
islam.lang.sg-inf-20260430-200455-wo8nb-meta.warc.gz	3464	download job
islam.lang.sg-inf-20260430-200455-wo8nb-meta.warc.os.cdx.gz	47	download
islam.lang.sg-inf-20260430-200455-wo8nb.json	244	download job
kreativekorp.com-inf-20260430-200701-unsqr-00000.warc.gz	11920243	download job
kreativekorp.com-inf-20260430-200701-unsqr-00000.warc.os.cdx.gz	1938	download
kreativekorp.com-inf-20260430-200701-unsqr-meta.warc.gz	4516	download job
kreativekorp.com-inf-20260430-200701-unsqr-meta.warc.os.cdx.gz	47	download
kreativekorp.com-inf-20260430-200701-unsqr.json	247	download job
lang.sg-inf-20260430-195755-3q11n-00000.warc.gz	34011491	download job
lang.sg-inf-20260430-195755-3q11n-00000.warc.os.cdx.gz	35457	download
lang.sg-inf-20260430-195755-3q11n-meta.warc.gz	22050	download job
lang.sg-inf-20260430-195755-3q11n-meta.warc.os.cdx.gz	47	download
lang.sg-inf-20260430-195755-3q11n.json	238	download job
lapatilla.com-inf-20260103-120259-25p18-00615.warc.gz	5436466145	download job
lapatilla.com-inf-20260103-120259-25p18-00615.warc.os.cdx.gz	2499235	download
nexxtpress.de-inf-20260430-111454-ci5wf-00017.warc.gz	5805603815	download job
nexxtpress.de-inf-20260430-111454-ci5wf-00017.warc.os.cdx.gz	345417	download
nhjournal.com-inf-20260428-215528-eg6e7-00047.warc.gz	5828518948	download job
nhjournal.com-inf-20260428-215528-eg6e7-00047.warc.os.cdx.gz	6557	download
nhjournal.com-inf-20260428-215528-eg6e7-00048.warc.gz	5391569292	download job
nhjournal.com-inf-20260428-215528-eg6e7-00048.warc.os.cdx.gz	8071	download
nhjournal.com-inf-20260428-215528-eg6e7-00049.warc.gz	5567316731	download job
nhjournal.com-inf-20260428-215528-eg6e7-00049.warc.os.cdx.gz	7925	download
nimi.li-inf-20260430-193725-19m22-00000.warc.gz	664918473	download job
nimi.li-inf-20260430-193725-19m22-00000.warc.os.cdx.gz	546238	download
nimi.li-inf-20260430-193725-19m22-meta.warc.gz	344263	download job
nimi.li-inf-20260430-193725-19m22-meta.warc.os.cdx.gz	47	download
nimi.li-inf-20260430-193725-19m22.json	238	download job
nri-na.com-inf-20260430-175612-ex66u-00000.warc.gz	5372416055	download job
nri-na.com-inf-20260430-175612-ex66u-00000.warc.os.cdx.gz	2767702	download
ranaseme.org.lang.sg-inf-20260430-200139-2pld1-00000.warc.gz	30442467	download job
ranaseme.org.lang.sg-inf-20260430-200139-2pld1-00000.warc.os.cdx.gz	1944	download
ranaseme.org.lang.sg-inf-20260430-200139-2pld1-meta.warc.gz	4709	download job
ranaseme.org.lang.sg-inf-20260430-200139-2pld1-meta.warc.os.cdx.gz	47	download
ranaseme.org.lang.sg-inf-20260430-200139-2pld1.json	251	download job
ru.lang.sg-inf-20260430-200505-7txc2-00000.warc.gz	2453	download job
ru.lang.sg-inf-20260430-200505-7txc2-00000.warc.os.cdx.gz	47	download
ru.lang.sg-inf-20260430-200505-7txc2-meta.warc.gz	3534	download job
ru.lang.sg-inf-20260430-200505-7txc2-meta.warc.os.cdx.gz	47	download
ru.lang.sg-inf-20260430-200505-7txc2.json	241	download job
shirin.lang.sg-inf-20260430-200513-4ucru-00000.warc.gz	2463	download job
shirin.lang.sg-inf-20260430-200513-4ucru-00000.warc.os.cdx.gz	47	download
shirin.lang.sg-inf-20260430-200513-4ucru-meta.warc.gz	3552	download job
shirin.lang.sg-inf-20260430-200513-4ucru-meta.warc.os.cdx.gz	47	download
shirin.lang.sg-inf-20260430-200513-4ucru.json	245	download job
sitelenpona.com-inf-20260430-200601-91pjh-00000.warc.gz	53279585	download job
sitelenpona.com-inf-20260430-200601-91pjh-00000.warc.os.cdx.gz	49781	download
sitelenpona.com-inf-20260430-200601-91pjh-meta.warc.gz	29928	download job
sitelenpona.com-inf-20260430-200601-91pjh-meta.warc.os.cdx.gz	47	download
sitelenpona.com-inf-20260430-200601-91pjh.json	246	download job
sitelenpona.lang.sg-inf-20260430-200248-1v78a-00000.warc.gz	1613745	download job
sitelenpona.lang.sg-inf-20260430-200248-1v78a-00000.warc.os.cdx.gz	6286	download
sitelenpona.lang.sg-inf-20260430-200248-1v78a-meta.warc.gz	6583	download job
sitelenpona.lang.sg-inf-20260430-200248-1v78a-meta.warc.os.cdx.gz	47	download
sitelenpona.lang.sg-inf-20260430-200248-1v78a.json	250	download job
sitelenponacom.lang.sg-shallow-20260430-200950-eujdt-00000.warc.gz	65621	download job
sitelenponacom.lang.sg-shallow-20260430-200950-eujdt-00000.warc.os.cdx.gz	406	download
sitelenponacom.lang.sg-shallow-20260430-200950-eujdt-meta.warc.gz	3713	download job
sitelenponacom.lang.sg-shallow-20260430-200950-eujdt-meta.warc.os.cdx.gz	47	download
sitelenponacom.lang.sg-shallow-20260430-200950-eujdt.json	257	download job
sonjalang.lang.sg-inf-20260430-200519-b07tb-00000.warc.gz	2470	download job
sonjalang.lang.sg-inf-20260430-200519-b07tb-00000.warc.os.cdx.gz	47	download
sonjalang.lang.sg-inf-20260430-200519-b07tb-meta.warc.gz	3543	download job
sonjalang.lang.sg-inf-20260430-200519-b07tb-meta.warc.os.cdx.gz	47	download
sonjalang.lang.sg-inf-20260430-200519-b07tb.json	248	download job
sunosama.lang.sg-inf-20260430-200301-2p0m1-00000.warc.gz	30442202	download job
sunosama.lang.sg-inf-20260430-200301-2p0m1-00000.warc.os.cdx.gz	1924	download
sunosama.lang.sg-inf-20260430-200301-2p0m1-meta.warc.gz	4685	download job
sunosama.lang.sg-inf-20260430-200301-2p0m1-meta.warc.os.cdx.gz	47	download
sunosama.lang.sg-inf-20260430-200301-2p0m1.json	247	download job
tokipona.lang.sg-inf-20260430-200350-eidym-00000.warc.gz	85202039	download job
tokipona.lang.sg-inf-20260430-200350-eidym-00000.warc.os.cdx.gz	86293	download
tokipona.lang.sg-inf-20260430-200350-eidym-meta.warc.gz	44511	download job
tokipona.lang.sg-inf-20260430-200350-eidym-meta.warc.os.cdx.gz	47	download
tokipona.lang.sg-inf-20260430-200350-eidym.json	247	download job
urls-transfer.archivete.am-damtoolbox.org_error_retry.txt-shallow-20260430-195452-9jsu9-00000.warc.gz	963295862	download job
urls-transfer.archivete.am-damtoolbox.org_error_retry.txt-shallow-20260430-195452-9jsu9-00000.warc.os.cdx.gz	41202	download
urls-transfer.archivete.am-damtoolbox.org_error_retry.txt-shallow-20260430-195452-9jsu9-meta.warc.gz	24893	download job
urls-transfer.archivete.am-damtoolbox.org_error_retry.txt-shallow-20260430-195452-9jsu9-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-damtoolbox.org_error_retry.txt-shallow-20260430-195452-9jsu9-urls.txt	28750	download
urls-transfer.archivete.am-damtoolbox.org_error_retry.txt-shallow-20260430-195452-9jsu9.json	356	download job
urls-transfer.archivete.am-noblogs.org_remaining_subdomains_from_67q6qla9panwsfvli1p8daore.txt-inf-20260423-191907-f30pz-00153.warc.gz	5374566223	download job
urls-transfer.archivete.am-noblogs.org_remaining_subdomains_from_67q6qla9panwsfvli1p8daore.txt-inf-20260423-191907-f30pz-00153.warc.os.cdx.gz	12805	download
urls-transfer.archivete.am-noblogs.org_remaining_subdomains_from_67q6qla9panwsfvli1p8daore.txt-inf-20260423-191907-f30pz-00154.warc.gz	5421191565	download job
urls-transfer.archivete.am-noblogs.org_remaining_subdomains_from_67q6qla9panwsfvli1p8daore.txt-inf-20260423-191907-f30pz-00154.warc.os.cdx.gz	12206	download
urls-transfer.archivete.am-quandoo.fi_quandoo.de_quandoo.it_quandoo.nl_quandoo.nz_quandoo.sg_quandoo.ch_quandoo.com.tr_quandoo.co.uk.txt-inf-20260416-211947-apxgp-00039.warc.gz	5368809663	download job
urls-transfer.archivete.am-quandoo.fi_quandoo.de_quandoo.it_quandoo.nl_quandoo.nz_quandoo.sg_quandoo.ch_quandoo.com.tr_quandoo.co.uk.txt-inf-20260416-211947-apxgp-00039.warc.os.cdx.gz	2909235	download
urls-transfer.archivete.am-www.webtoons.com_m.webtoons.com_seed_urls.txt-inf-20251101-194235-eqo6o-01868.warc.gz	5369233823	download job
urls-transfer.archivete.am-www.webtoons.com_m.webtoons.com_seed_urls.txt-inf-20251101-194235-eqo6o-01868.warc.os.cdx.gz	2147917	download
www.5-tv.ru-inf-20260426-201818-3vkhf-00574.warc.gz	5409336600	download job
www.5-tv.ru-inf-20260426-201818-3vkhf-00574.warc.os.cdx.gz	19076	download
www.5-tv.ru-inf-20260426-201818-3vkhf-00575.warc.gz	5617421770	download job
www.5-tv.ru-inf-20260426-201818-3vkhf-00575.warc.os.cdx.gz	18805	download
www.bahasa.lang.sg-inf-20260430-200522-cva2j-00000.warc.gz	6366	download job
www.bahasa.lang.sg-inf-20260430-200522-cva2j-00000.warc.os.cdx.gz	301	download
www.bahasa.lang.sg-inf-20260430-200522-cva2j-meta.warc.gz	3651	download job
www.bahasa.lang.sg-inf-20260430-200522-cva2j-meta.warc.os.cdx.gz	47	download
www.bahasa.lang.sg-inf-20260430-200522-cva2j.json	249	download job
www.dechert.com-inf-20260423-021035-1dw7f-00040.warc.gz	5368760131	download job
www.dechert.com-inf-20260423-021035-1dw7f-00040.warc.os.cdx.gz	3296791	download
www.emilyhall.lang.sg-inf-20260430-200526-8u0z8-00000.warc.gz	13217	download job
www.emilyhall.lang.sg-inf-20260430-200526-8u0z8-00000.warc.os.cdx.gz	342	download
www.emilyhall.lang.sg-inf-20260430-200526-8u0z8-meta.warc.gz	3625	download job
www.emilyhall.lang.sg-inf-20260430-200526-8u0z8-meta.warc.os.cdx.gz	47	download
www.emilyhall.lang.sg-inf-20260430-200526-8u0z8.json	252	download job
www.eric.lang.sg-shallow-20260430-200815-30jix-00000.warc.gz	781353	download job
www.eric.lang.sg-shallow-20260430-200815-30jix-00000.warc.os.cdx.gz	2799	download
www.eric.lang.sg-shallow-20260430-200815-30jix-meta.warc.gz	4908	download job
www.eric.lang.sg-shallow-20260430-200815-30jix-meta.warc.os.cdx.gz	47	download
www.eric.lang.sg-shallow-20260430-200815-30jix.json	251	download job
www.kslaw.com-inf-20260430-012551-akni6-00003.warc.gz	5372699564	download job
www.kslaw.com-inf-20260430-012551-akni6-00003.warc.os.cdx.gz	5169528	download
www.loverslab.com-inf-20260413-151753-a9t2m-00431.warc.gz	5375272565	download job
www.loverslab.com-inf-20260413-151753-a9t2m-00431.warc.os.cdx.gz	2581932	download
www.ranaseme.org.lang.sg-shallow-20260430-200832-3wxc3-00000.warc.gz	702864	download job
www.ranaseme.org.lang.sg-shallow-20260430-200832-3wxc3-00000.warc.os.cdx.gz	1279	download
www.ranaseme.org.lang.sg-shallow-20260430-200832-3wxc3-meta.warc.gz	4257	download job
www.ranaseme.org.lang.sg-shallow-20260430-200832-3wxc3-meta.warc.os.cdx.gz	47	download
www.ranaseme.org.lang.sg-shallow-20260430-200832-3wxc3.json	259	download job
www.sitelenpona.com-inf-20260430-200537-smnoj-00000.warc.gz	1568574	download job
www.sitelenpona.com-inf-20260430-200537-smnoj-00000.warc.os.cdx.gz	8149	download
www.sitelenpona.com-inf-20260430-200537-smnoj-meta.warc.gz	7763	download job
www.sitelenpona.com-inf-20260430-200537-smnoj-meta.warc.os.cdx.gz	47	download
www.sitelenpona.com-inf-20260430-200537-smnoj.json	250	download job
www.sitelenpona.lang.sg-inf-20260430-200533-bs3fd-00000.warc.gz	1614910	download job
www.sitelenpona.lang.sg-inf-20260430-200533-bs3fd-00000.warc.os.cdx.gz	6281	download
www.sitelenpona.lang.sg-inf-20260430-200533-bs3fd-meta.warc.gz	6615	download job
www.sitelenpona.lang.sg-inf-20260430-200533-bs3fd-meta.warc.os.cdx.gz	47	download
www.sitelenpona.lang.sg-inf-20260430-200533-bs3fd.json	254	download job
www.sitelenponacom.lang.sg-shallow-20260430-200935-8n6zu-00000.warc.gz	65080	download job
www.sitelenponacom.lang.sg-shallow-20260430-200935-8n6zu-00000.warc.os.cdx.gz	404	download
www.sitelenponacom.lang.sg-shallow-20260430-200935-8n6zu-meta.warc.gz	3727	download job
www.sitelenponacom.lang.sg-shallow-20260430-200935-8n6zu-meta.warc.os.cdx.gz	47	download
www.sitelenponacom.lang.sg-shallow-20260430-200935-8n6zu.json	261	download job
www.somaliland.com-inf-20260429-174449-2ackk-00005.warc.gz	1475908805	download job
www.somaliland.com-inf-20260429-174449-2ackk-00005.warc.os.cdx.gz	1625442	download
www.somaliland.com-inf-20260429-174449-2ackk-meta.warc.gz	30916110	download job
www.somaliland.com-inf-20260429-174449-2ackk-meta.warc.os.cdx.gz	47	download
www.somaliland.com-inf-20260429-174449-2ackk.json	246	download job
www.sonjalang.com-inf-20260430-200623-b8mpw-00000.warc.gz	5104596	download job
www.sonjalang.com-inf-20260430-200623-b8mpw-00000.warc.os.cdx.gz	11305	download
www.sonjalang.com-inf-20260430-200623-b8mpw-meta.warc.gz	10524	download job
www.sonjalang.com-inf-20260430-200623-b8mpw-meta.warc.os.cdx.gz	47	download
www.sonjalang.com-inf-20260430-200623-b8mpw.json	248	download job
www.sunosama.lang.sg-shallow-20260430-201040-5k6i6-00000.warc.gz	702065	download job
www.sunosama.lang.sg-shallow-20260430-201040-5k6i6-00000.warc.os.cdx.gz	1265	download
www.sunosama.lang.sg-shallow-20260430-201040-5k6i6-meta.warc.gz	4246	download job
www.sunosama.lang.sg-shallow-20260430-201040-5k6i6-meta.warc.os.cdx.gz	47	download
www.sunosama.lang.sg-shallow-20260430-201040-5k6i6.json	255	download job
www.texaspsyc.org-inf-20260428-001852-2m4aw-00000.warc.gz	1857957611	download job
www.texaspsyc.org-inf-20260428-001852-2m4aw-00000.warc.os.cdx.gz	6069087	download
www.texaspsyc.org-inf-20260428-001852-2m4aw-meta.warc.gz	2487730	download job
www.texaspsyc.org-inf-20260428-001852-2m4aw-meta.warc.os.cdx.gz	47	download
www.texaspsyc.org-inf-20260428-001852-2m4aw.json	248	download job
www.tokipona.lang.sg-shallow-20260430-201104-cna9l-00000.warc.gz	26936543	download job
www.tokipona.lang.sg-shallow-20260430-201104-cna9l-00000.warc.os.cdx.gz	25151	download
www.tokipona.lang.sg-shallow-20260430-201104-cna9l-meta.warc.gz	16342	download job
www.tokipona.lang.sg-shallow-20260430-201104-cna9l-meta.warc.os.cdx.gz	47	download
www.tokipona.lang.sg-shallow-20260430-201104-cna9l.json	255	download job