Item archiveteam_archivebot_go_20260505200622_a3a15107

Filename	Size
aituc.net-inf-20260505-200013-8o40x-00000.warc.gz	673621	download job
aituc.net-inf-20260505-200013-8o40x-00000.warc.os.cdx.gz	2008	download
aituc.net-inf-20260505-200013-8o40x-meta.warc.gz	4429	download job
aituc.net-inf-20260505-200013-8o40x-meta.warc.os.cdx.gz	47	download
aituc.net-inf-20260505-200013-8o40x.json	240	download job
allindiaforwardbloc.org-inf-20260505-194005-cyd7g-00000.warc.gz	222367257	download job
allindiaforwardbloc.org-inf-20260505-194005-cyd7g-00000.warc.os.cdx.gz	197029	download
allindiaforwardbloc.org-inf-20260505-194005-cyd7g-meta.warc.gz	123810	download job
allindiaforwardbloc.org-inf-20260505-194005-cyd7g-meta.warc.os.cdx.gz	47	download
allindiaforwardbloc.org-inf-20260505-194005-cyd7g.json	254	download job
archiveteam_archivebot_go_20260505200622_a3a15107.cdx.gz	36995020	download
archiveteam_archivebot_go_20260505200622_a3a15107.cdx.idx	56890	download
archiveteam_archivebot_go_20260505200622_a3a15107_files.xml	0	download
archiveteam_archivebot_go_20260505200622_a3a15107_meta.sqlite	147456	download
archiveteam_archivebot_go_20260505200622_a3a15107_meta.xml	1047	download
cpim.org-inf-20260505-173352-2ofg6-00002.warc.gz	8250909914	download job
cpim.org-inf-20260505-173352-2ofg6-00002.warc.os.cdx.gz	21384	download
ernaehrungsdenkwerkstatt.de-inf-20260502-070522-dzjeu-00048.warc.gz	5387851140	download job
ernaehrungsdenkwerkstatt.de-inf-20260502-070522-dzjeu-00048.warc.os.cdx.gz	850749	download
globalnews.ca-inf-20250821-223546-ejnq1-03355.warc.gz	5369413686	download job
globalnews.ca-inf-20250821-223546-ejnq1-03355.warc.os.cdx.gz	1134029	download
lpsouthdakota.org-inf-20260505-013021-b9y3e-00000.warc.gz	1931023094	download job
lpsouthdakota.org-inf-20260505-013021-b9y3e-00000.warc.os.cdx.gz	9221485	download
lpsouthdakota.org-inf-20260505-013021-b9y3e-meta.warc.gz	5282397	download job
lpsouthdakota.org-inf-20260505-013021-b9y3e-meta.warc.os.cdx.gz	47	download
lpsouthdakota.org-inf-20260505-013021-b9y3e.json	248	download job
newagemukti.com-inf-20260505-194521-ikf53-00000.warc.gz	84731659	download job
newagemukti.com-inf-20260505-194521-ikf53-00000.warc.os.cdx.gz	103834	download
newagemukti.com-inf-20260505-194521-ikf53-meta.warc.gz	69100	download job
newagemukti.com-inf-20260505-194521-ikf53-meta.warc.os.cdx.gz	47	download
newagemukti.com-inf-20260505-194521-ikf53.json	246	download job
openresearch-repository.anu.edu.au-inf-20260430-202033-a51bw-00016.warc.gz	5371871683	download job
openresearch-repository.anu.edu.au-inf-20260430-202033-a51bw-00016.warc.os.cdx.gz	135919	download
poisson.phc.dm.unipi.it-shallow-20260505-195554-1bnua-00000.warc.gz	7333	download job
poisson.phc.dm.unipi.it-shallow-20260505-195554-1bnua-00000.warc.os.cdx.gz	351	download
poisson.phc.dm.unipi.it-shallow-20260505-195554-1bnua-meta.warc.gz	3539	download job
poisson.phc.dm.unipi.it-shallow-20260505-195554-1bnua-meta.warc.os.cdx.gz	47	download
poisson.phc.dm.unipi.it-shallow-20260505-195554-1bnua.json	263	download job
rsp.org.in-inf-20260505-200051-6z65w-00000.warc.gz	2456	download job
rsp.org.in-inf-20260505-200051-6z65w-00000.warc.os.cdx.gz	47	download
rsp.org.in-inf-20260505-200051-6z65w-meta.warc.gz	3458	download job
rsp.org.in-inf-20260505-200051-6z65w-meta.warc.os.cdx.gz	47	download
rsp.org.in-inf-20260505-200051-6z65w.json	245	download job
tuccindia.org-inf-20260505-194151-7j1b1-00000.warc.gz	282113158	download job
tuccindia.org-inf-20260505-194151-7j1b1-00000.warc.os.cdx.gz	242905	download
tuccindia.org-inf-20260505-194151-7j1b1-meta.warc.gz	148530	download job
tuccindia.org-inf-20260505-194151-7j1b1-meta.warc.os.cdx.gz	47	download
tuccindia.org-inf-20260505-194151-7j1b1.json	244	download job
urls-transfer.archivete.am-buncombeschools.org_subdomains.txt-inf-20260504-044821-12ndv-00012.warc.gz	5369114854	download job
urls-transfer.archivete.am-buncombeschools.org_subdomains.txt-inf-20260504-044821-12ndv-00012.warc.os.cdx.gz	1425759	download
urls-transfer.archivete.am-downloads.khinsider.com_flac-download-urls_part-1-of-5.txt-shallow-20260502-082609-1elwv-00306.warc.gz	5374677465	download job
urls-transfer.archivete.am-downloads.khinsider.com_flac-download-urls_part-1-of-5.txt-shallow-20260502-082609-1elwv-00306.warc.os.cdx.gz	64467	download
urls-transfer.archivete.am-downloads.khinsider.com_flac-download-urls_part-2-of-5.txt-shallow-20260502-083106-8pkuo-00295.warc.gz	5373598519	download job
urls-transfer.archivete.am-downloads.khinsider.com_flac-download-urls_part-2-of-5.txt-shallow-20260502-083106-8pkuo-00295.warc.os.cdx.gz	39180	download
urls-transfer.archivete.am-downloads.khinsider.com_flac-download-urls_part-5-of-5.txt-shallow-20260504-170200-3yx60-00160.warc.gz	5424916206	download job
urls-transfer.archivete.am-downloads.khinsider.com_flac-download-urls_part-5-of-5.txt-shallow-20260504-170200-3yx60-00160.warc.os.cdx.gz	29748	download
urls-transfer.archivete.am-downloads.khinsider.com_flac-download-urls_part-5-of-5.txt-shallow-20260504-170200-3yx60-00161.warc.gz	5401027935	download job
urls-transfer.archivete.am-downloads.khinsider.com_flac-download-urls_part-5-of-5.txt-shallow-20260504-170200-3yx60-00161.warc.os.cdx.gz	37948	download
urls-transfer.archivete.am-noblogs.org_remaining_subdomains_from_67q6qla9panwsfvli1p8daore.txt-inf-20260423-191907-f30pz-00199.warc.gz	5368713392	download job
urls-transfer.archivete.am-noblogs.org_remaining_subdomains_from_67q6qla9panwsfvli1p8daore.txt-inf-20260423-191907-f30pz-00199.warc.os.cdx.gz	13507390	download
urls-transfer.archivete.am-services.arcgis.com_P3ePLMYs2RVChkJx_arcgis_urls_nca-atlas-nationalclimate.hub.arcgis.com_was_atlas.globalchange.gov.txt-shallow-20251009-023936-jyia4-00131.warc.gz	5368880067	download job
urls-transfer.archivete.am-services.arcgis.com_P3ePLMYs2RVChkJx_arcgis_urls_nca-atlas-nationalclimate.hub.arcgis.com_was_atlas.globalchange.gov.txt-shallow-20251009-023936-jyia4-00131.warc.os.cdx.gz	743500	download
urls-transfer.archivete.am-www.artsonia.com_img_105m_110m.txt-shallow-20260504-152354-ehlvf-00236.warc.gz	5368809610	download job
urls-transfer.archivete.am-www.artsonia.com_img_105m_110m.txt-shallow-20260504-152354-ehlvf-00236.warc.os.cdx.gz	499984	download
urls-transfer.archivete.am-www.artsonia.com_img_105m_110m.txt-shallow-20260504-152354-ehlvf-00237.warc.gz	5368782118	download job
urls-transfer.archivete.am-www.artsonia.com_img_105m_110m.txt-shallow-20260504-152354-ehlvf-00237.warc.os.cdx.gz	478056	download
urls-transfer.archivete.am-www.artsonia.com_img_110m_115m.txt-shallow-20260504-152543-acv9d-00242.warc.gz	5369247471	download job
urls-transfer.archivete.am-www.artsonia.com_img_110m_115m.txt-shallow-20260504-152543-acv9d-00242.warc.os.cdx.gz	471624	download
urls-transfer.archivete.am-www.artsonia.com_img_115m_120m.txt-shallow-20260504-152802-uu3w3-00155.warc.gz	5368744510	download job
urls-transfer.archivete.am-www.artsonia.com_img_115m_120m.txt-shallow-20260504-152802-uu3w3-00155.warc.os.cdx.gz	487930	download
urls-transfer.archivete.am-www.artsonia.com_img_120M_125M.txt-shallow-20260504-152953-e3mfd-00164.warc.gz	5369163530	download job
urls-transfer.archivete.am-www.artsonia.com_img_120M_125M.txt-shallow-20260504-152953-e3mfd-00164.warc.os.cdx.gz	482422	download
urls-transfer.archivete.am-www.artsonia.com_img_120M_125M.txt-shallow-20260504-152953-e3mfd-00165.warc.gz	5368984447	download job
urls-transfer.archivete.am-www.artsonia.com_img_120M_125M.txt-shallow-20260504-152953-e3mfd-00165.warc.os.cdx.gz	471338	download
vtcnews.vn-inf-20260422-180952-5dk5f-00471.warc.gz	5389988941	download job
vtcnews.vn-inf-20260422-180952-5dk5f-00471.warc.os.cdx.gz	588732	download
www.aituc.net-inf-20260505-195850-24s3l-00000.warc.gz	673840	download job
www.aituc.net-inf-20260505-195850-24s3l-00000.warc.os.cdx.gz	2018	download
www.aituc.net-inf-20260505-195850-24s3l-meta.warc.gz	4421	download job
www.aituc.net-inf-20260505-195850-24s3l-meta.warc.os.cdx.gz	47	download
www.aituc.net-inf-20260505-195850-24s3l.json	244	download job
www.bms.org.in-inf-20260505-172325-25cjt-00000.warc.gz	1178785318	download job
www.bms.org.in-inf-20260505-172325-25cjt-00000.warc.os.cdx.gz	1324185	download
www.bms.org.in-inf-20260505-172325-25cjt-meta.warc.gz	961894	download job
www.bms.org.in-inf-20260505-172325-25cjt-meta.warc.os.cdx.gz	47	download
www.bms.org.in-inf-20260505-172325-25cjt.json	245	download job
www.facebook.com-inf-20260505-054727-b8jjj-aborted-00002.warc.gz	3588971170	download job
www.facebook.com-inf-20260505-054727-b8jjj-aborted-00002.warc.os.cdx.gz	4567789	download
www.facebook.com-inf-20260505-054727-b8jjj-aborted-wpull.log.gz	8211853	download
www.facebook.com-inf-20260505-054727-b8jjj-aborted.json	258	download job
www.lawfulpath.com-inf-20260502-184941-ay163-00054.warc.gz	6747868724	download job
www.lawfulpath.com-inf-20260502-184941-ay163-00054.warc.os.cdx.gz	81470	download
www.rsp.org.in-inf-20260505-200037-dymzt-00000.warc.gz	2465	download job
www.rsp.org.in-inf-20260505-200037-dymzt-00000.warc.os.cdx.gz	47	download
www.rsp.org.in-inf-20260505-200037-dymzt-meta.warc.gz	3482	download job
www.rsp.org.in-inf-20260505-200037-dymzt-meta.warc.os.cdx.gz	47	download
www.rsp.org.in-inf-20260505-200037-dymzt.json	249	download job
www.self.com-inf-20260420-191906-aziu7-00179.warc.gz	5394423055	download job
www.self.com-inf-20260420-191906-aziu7-00179.warc.os.cdx.gz	1189178	download
www.thatprivacyguy.com-inf-20260505-195137-8q7g0.json	285	download job