Item archiveteam_archivebot_go_20250405072320_9d9aee04

Filename	Size
akadalymentes.2010-2014.kormany.hu-inf-20250405-071245-2mots-00000.warc.gz	76992	download job
akadalymentes.2010-2014.kormany.hu-inf-20250405-071245-2mots-00000.warc.os.cdx.gz	573	download
akadalymentes.2010-2014.kormany.hu-inf-20250405-071245-2mots-meta.warc.gz	3616	download job
akadalymentes.2010-2014.kormany.hu-inf-20250405-071245-2mots-meta.warc.os.cdx.gz	47	download
akadalymentes.2010-2014.kormany.hu-inf-20250405-071245-2mots.json	262	download job
archiveteam_archivebot_go_20250405072320_9d9aee04.cdx.gz	23385963	download
archiveteam_archivebot_go_20250405072320_9d9aee04.cdx.idx	23964	download
archiveteam_archivebot_go_20250405072320_9d9aee04_files.xml	0	download
archiveteam_archivebot_go_20250405072320_9d9aee04_meta.sqlite	143360	download
archiveteam_archivebot_go_20250405072320_9d9aee04_meta.xml	1047	download
brusszel.eu.kormany.hu-inf-20250405-071456-6s4n3-00000.warc.gz	8534781	download job
brusszel.eu.kormany.hu-inf-20250405-071456-6s4n3-00000.warc.os.cdx.gz	16455	download
brusszel.eu.kormany.hu-inf-20250405-071456-6s4n3-meta.warc.gz	12225	download job
brusszel.eu.kormany.hu-inf-20250405-071456-6s4n3-meta.warc.os.cdx.gz	47	download
brusszel.eu.kormany.hu-inf-20250405-071456-6s4n3.json	250	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-05704.warc.gz	7234925531	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-05704.warc.os.cdx.gz	867	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-05705.warc.gz	5877855087	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-05705.warc.os.cdx.gz	624	download
das.sdss.org-inf-20250226-051304-5s39o-00574.warc.gz	5372948764	download job
das.sdss.org-inf-20250226-051304-5s39o-00574.warc.os.cdx.gz	301052	download
dubossary.ru-inf-20250404-172244-cjmiv-aborted-00000.warc.gz	101173995	download job
dubossary.ru-inf-20250404-172244-cjmiv-aborted-00000.warc.os.cdx.gz	123877	download
dubossary.ru-inf-20250404-172244-cjmiv-aborted-wpull.log.gz	73979	download
dubossary.ru-inf-20250404-172244-cjmiv-aborted.json	239	download job
investors.rocketlabusa.com-inf-20250405-071830-8ebwt-00000.warc.gz	11379	download job
investors.rocketlabusa.com-inf-20250405-071830-8ebwt-00000.warc.os.cdx.gz	342	download
investors.rocketlabusa.com-inf-20250405-071830-8ebwt-meta.warc.gz	3499	download job
investors.rocketlabusa.com-inf-20250405-071830-8ebwt-meta.warc.os.cdx.gz	47	download
investors.rocketlabusa.com-inf-20250405-071830-8ebwt.json	257	download job
readovka67.ru-inf-20250326-183312-4y0gb-00027.warc.gz	5368713451	download job
readovka67.ru-inf-20250326-183312-4y0gb-00027.warc.os.cdx.gz	3716899	download
realchems.nl-inf-20250404-214721-5555r-00000.warc.gz	5358140911	download job
realchems.nl-inf-20250404-214721-5555r-00000.warc.os.cdx.gz	4978027	download
realchems.nl-inf-20250404-214721-5555r-meta.warc.gz	3234943	download job
realchems.nl-inf-20250404-214721-5555r-meta.warc.os.cdx.gz	47	download
realchems.nl-inf-20250404-214721-5555r.json	239	download job
svp.edcar.pbs.org-shallow-20250405-072023-6nv74-00000.warc.gz	33135474	download job
svp.edcar.pbs.org-shallow-20250405-072023-6nv74-00000.warc.os.cdx.gz	19860	download
svp.edcar.pbs.org-shallow-20250405-072023-6nv74-meta.warc.gz	14632	download job
svp.edcar.pbs.org-shallow-20250405-072023-6nv74-meta.warc.os.cdx.gz	47	download
svp.edcar.pbs.org-shallow-20250405-072023-6nv74.json	249	download job
tci.fiu.edu-inf-20250405-061139-esqjx-00000.warc.gz	2203976099	download job
tci.fiu.edu-inf-20250405-061139-esqjx-00000.warc.os.cdx.gz	1215452	download
tci.fiu.edu-inf-20250405-061139-esqjx-meta.warc.gz	719410	download job
tci.fiu.edu-inf-20250405-061139-esqjx-meta.warc.os.cdx.gz	47	download
tci.fiu.edu-inf-20250405-061139-esqjx.json	242	download job
thenewamerican.com-inf-20250403-031403-49e0d-00025.warc.gz	5392035624	download job
thenewamerican.com-inf-20250403-031403-49e0d-00025.warc.os.cdx.gz	227112	download
urls-transfer.archivete.am-www.pubpub.org_subdomains.txt-inf-20250311-024436-4me3d-00097.warc.gz	7801472968	download job
urls-transfer.archivete.am-www.pubpub.org_subdomains.txt-inf-20250311-024436-4me3d-00097.warc.os.cdx.gz	1131088	download
urls-transfer.archivete.am-www.taiganet.com_seed_urls.txt-inf-20250405-071136-898ex-00000.warc.gz	5880807	download job
urls-transfer.archivete.am-www.taiganet.com_seed_urls.txt-inf-20250405-071136-898ex-00000.warc.os.cdx.gz	4894	download
urls-transfer.archivete.am-www.taiganet.com_seed_urls.txt-inf-20250405-071136-898ex-meta.warc.gz	6823	download job
urls-transfer.archivete.am-www.taiganet.com_seed_urls.txt-inf-20250405-071136-898ex-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-www.taiganet.com_seed_urls.txt-inf-20250405-071136-898ex-urls.txt	120	download
urls-transfer.archivete.am-www.taiganet.com_seed_urls.txt-inf-20250405-071136-898ex.json	366	download job
vienna.io.gov.hu-inf-20250405-071352-an3xp-00000.warc.gz	6168	download job
vienna.io.gov.hu-inf-20250405-071352-an3xp-00000.warc.os.cdx.gz	270	download
vienna.io.gov.hu-inf-20250405-071352-an3xp-meta.warc.gz	3467	download job
vienna.io.gov.hu-inf-20250405-071352-an3xp-meta.warc.os.cdx.gz	47	download
vienna.io.gov.hu-inf-20250405-071352-an3xp.json	244	download job
www.centrepompidou.fr-inf-20250331-112126-b22je-00029.warc.gz	5432955364	download job
www.centrepompidou.fr-inf-20250331-112126-b22je-00029.warc.os.cdx.gz	2297588	download
www.centrepompidou.fr-inf-20250331-112126-b22je-00030.warc.gz	5470756153	download job
www.centrepompidou.fr-inf-20250331-112126-b22je-00030.warc.os.cdx.gz	38234	download
www.drought.gov-inf-20250404-032744-4i2a2-00003.warc.gz	5368782845	download job
www.drought.gov-inf-20250404-032744-4i2a2-00003.warc.os.cdx.gz	2517243	download
www.eschatonblog.com-inf-20250404-053812-cmzcs-00014.warc.gz	5376980937	download job
www.eschatonblog.com-inf-20250404-053812-cmzcs-00014.warc.os.cdx.gz	629310	download
www.history.navy.mil-inf-20250401-032717-c1m68-00085.warc.gz	5373068448	download job
www.history.navy.mil-inf-20250401-032717-c1m68-00085.warc.os.cdx.gz	65445	download
www.minv.sk-inf-20250126-115326-f1co8-00029.warc.gz	1218001416	download job
www.minv.sk-inf-20250126-115326-f1co8-00029.warc.os.cdx.gz	5120452	download
www.minv.sk-inf-20250126-115326-f1co8-meta.warc.gz	192430802	download job
www.minv.sk-inf-20250126-115326-f1co8-meta.warc.os.cdx.gz	47	download
www.minv.sk-inf-20250126-115326-f1co8.json	239	download job
www.pbs.org-inf-20250330-092508-bykmh-00495.warc.gz	5462576840	download job
www.pbs.org-inf-20250330-092508-bykmh-00495.warc.os.cdx.gz	17101	download
www.pbs.org-inf-20250330-092508-bykmh-00496.warc.gz	5445239518	download job
www.pbs.org-inf-20250330-092508-bykmh-00496.warc.os.cdx.gz	12866	download
www.sciencebase.gov-inf-20250204-024621-3gyep-02665.warc.gz	5588732912	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-02665.warc.os.cdx.gz	114660	download
www.sectorintelectualdoporto.pcp.pt-inf-20250405-071724-71k0l-00000.warc.gz	13908	download job
www.sectorintelectualdoporto.pcp.pt-inf-20250405-071724-71k0l-00000.warc.os.cdx.gz	370	download
www.sectorintelectualdoporto.pcp.pt-inf-20250405-071724-71k0l-meta.warc.gz	3602	download job
www.sectorintelectualdoporto.pcp.pt-inf-20250405-071724-71k0l-meta.warc.os.cdx.gz	47	download
www.sectorintelectualdoporto.pcp.pt-inf-20250405-071724-71k0l.json	263	download job
www.seixal.pcp.pt-inf-20250405-071749-a1cp4-00000.warc.gz	5999	download job
www.seixal.pcp.pt-inf-20250405-071749-a1cp4-00000.warc.os.cdx.gz	296	download
www.seixal.pcp.pt-inf-20250405-071749-a1cp4-meta.warc.gz	3475	download job
www.seixal.pcp.pt-inf-20250405-071749-a1cp4-meta.warc.os.cdx.gz	47	download
www.seixal.pcp.pt-inf-20250405-071749-a1cp4.json	245	download job
www.svaboda.org-inf-20250320-052615-7mcvc-00186.warc.gz	5729166086	download job
www.svaboda.org-inf-20250320-052615-7mcvc-00186.warc.os.cdx.gz	62479	download
www.voaafrica.com-inf-20250318-081912-1fye9-01893.warc.gz	5490784138	download job
www.voaafrica.com-inf-20250318-081912-1fye9-01893.warc.os.cdx.gz	5512	download
www.voadeewanews.com-inf-20250318-081603-6w6oc-01113.warc.gz	5689641094	download job
www.voadeewanews.com-inf-20250318-081603-6w6oc-01113.warc.os.cdx.gz	5793	download
www.voanews.com-inf-20250317-033633-biyl5-01311.warc.gz	5370694375	download job
www.voanews.com-inf-20250317-033633-biyl5-01311.warc.os.cdx.gz	375275	download
www.wired.com-inf-20250222-101923-dg2iq-00369.warc.gz	5371092058	download job
www.wired.com-inf-20250222-101923-dg2iq-00369.warc.os.cdx.gz	1091916	download