Item archiveteam_archivebot_go_20250406043715_10bd7485

Filename	Size
archive.legmt.gov-inf-20250405-194400-4a7gf-00037.warc.gz	6775324365	download job
archive.legmt.gov-inf-20250405-194400-4a7gf-00037.warc.os.cdx.gz	1786	download
archiveteam_archivebot_go_20250406043715_10bd7485.cdx.gz	4423117	download
archiveteam_archivebot_go_20250406043715_10bd7485.cdx.idx	4433	download
archiveteam_archivebot_go_20250406043715_10bd7485_files.xml	0	download
archiveteam_archivebot_go_20250406043715_10bd7485_meta.sqlite	61440	download
archiveteam_archivebot_go_20250406043715_10bd7485_meta.xml	881	download
arcticwildlifeknowledge.com-inf-20250406-035227-c7bks-00000.warc.gz	3099254187	download job
arcticwildlifeknowledge.com-inf-20250406-035227-c7bks-00000.warc.os.cdx.gz	619724	download
arcticwildlifeknowledge.com-inf-20250406-035227-c7bks-meta.warc.gz	476840	download job
arcticwildlifeknowledge.com-inf-20250406-035227-c7bks-meta.warc.os.cdx.gz	47	download
arcticwildlifeknowledge.com-inf-20250406-035227-c7bks.json	258	download job
brightsblog.wordpress.com-inf-20250330-133212-6fhzf-00106.warc.gz	5368842256	download job
brightsblog.wordpress.com-inf-20250330-133212-6fhzf-00106.warc.os.cdx.gz	454193	download
catalog.extension.org-inf-20250406-041536-830fe-00000.warc.gz	274383282	download job
catalog.extension.org-inf-20250406-041536-830fe-00000.warc.os.cdx.gz	204306	download
catalog.extension.org-inf-20250406-041536-830fe-meta.warc.gz	127205	download job
catalog.extension.org-inf-20250406-041536-830fe-meta.warc.os.cdx.gz	47	download
catalog.extension.org-inf-20250406-041536-830fe.json	252	download job
cdsarc.cds.unistra.fr-inf-20250316-091614-2ddo1-00482.warc.gz	5992743031	download job
cdsarc.cds.unistra.fr-inf-20250316-091614-2ddo1-00482.warc.os.cdx.gz	8222	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-05829.warc.gz	6422268146	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-05829.warc.os.cdx.gz	1653	download
fondationsegre.org-inf-20250406-042611-4ck6n-00000.warc.gz	7042191	download job
fondationsegre.org-inf-20250406-042611-4ck6n-00000.warc.os.cdx.gz	11090	download
fondationsegre.org-inf-20250406-042611-4ck6n-meta.warc.gz	10079	download job
fondationsegre.org-inf-20250406-042611-4ck6n-meta.warc.os.cdx.gz	47	download
fondationsegre.org-inf-20250406-042611-4ck6n.json	249	download job
fundraise.defenders.org-inf-20250406-041454-bbqzq-00000.warc.gz	176443055	download job
fundraise.defenders.org-inf-20250406-041454-bbqzq-00000.warc.os.cdx.gz	219674	download
fundraise.defenders.org-inf-20250406-041454-bbqzq-meta.warc.gz	118589	download job
fundraise.defenders.org-inf-20250406-041454-bbqzq-meta.warc.os.cdx.gz	47	download
fundraise.defenders.org-inf-20250406-041454-bbqzq.json	254	download job
papersailship.tumblr.com-inf-20250329-105409-bm692-00098.warc.gz	5386371025	download job
papersailship.tumblr.com-inf-20250329-105409-bm692-00098.warc.os.cdx.gz	1123074	download
tamanduabandeira.org-inf-20250406-042350-b5frf-00000.warc.gz	4112012	download job
tamanduabandeira.org-inf-20250406-042350-b5frf-00000.warc.os.cdx.gz	10941	download
tamanduabandeira.org-inf-20250406-042350-b5frf.json	251	download job
thenewamerican.com-inf-20250403-031403-49e0d-00093.warc.gz	5528413365	download job
thenewamerican.com-inf-20250403-031403-49e0d-00093.warc.os.cdx.gz	6646	download
www.ars.usda.gov-inf-20250306-151524-z1x7l-00517.warc.gz	38175549328	download job
www.ars.usda.gov-inf-20250306-151524-z1x7l-00517.warc.os.cdx.gz	352	download
www.fondationsegre.org-inf-20250406-042636-73fyq-aborted-00000.warc.gz	72955073	download job
www.fondationsegre.org-inf-20250406-042636-73fyq-aborted-00000.warc.os.cdx.gz	37630	download
www.fondationsegre.org-inf-20250406-042636-73fyq-aborted-wpull.log.gz	26956	download
www.fondationsegre.org-inf-20250406-042636-73fyq-aborted.json	252	download job
www.gamesclips.com-inf-20250405-193737-3x3a2-00006.warc.gz	5370153501	download job
www.gamesclips.com-inf-20250405-193737-3x3a2-00006.warc.os.cdx.gz	676777	download
www.history.navy.mil-inf-20250401-032717-c1m68-00113.warc.gz	5372329794	download job
www.history.navy.mil-inf-20250401-032717-c1m68-00113.warc.os.cdx.gz	64525	download
www.pbs.org-inf-20250330-092508-bykmh-00628.warc.gz	5677481522	download job
www.pbs.org-inf-20250330-092508-bykmh-00628.warc.os.cdx.gz	12095	download
www.sciencebase.gov-inf-20250204-024621-3gyep-02775.warc.gz	5493306464	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-02775.warc.os.cdx.gz	134132	download
www.sciencebase.gov-inf-20250204-024621-3gyep-02776.warc.gz	5403274771	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-02776.warc.os.cdx.gz	111239	download
www.tamanduabandeira.org-inf-20250406-042525-edr56-00000.warc.gz	260099350	download job
www.tamanduabandeira.org-inf-20250406-042525-edr56-00000.warc.os.cdx.gz	139837	download
www.tamanduabandeira.org-inf-20250406-042525-edr56-meta.warc.gz	83541	download job
www.tamanduabandeira.org-inf-20250406-042525-edr56-meta.warc.os.cdx.gz	47	download
www.tamanduabandeira.org-inf-20250406-042525-edr56.json	255	download job
www.voaafrica.com-inf-20250318-081912-1fye9-01988.warc.gz	5373628185	download job
www.voaafrica.com-inf-20250318-081912-1fye9-01988.warc.os.cdx.gz	627163	download
www.voaafrica.com-inf-20250318-081912-1fye9-01989.warc.gz	5373435571	download job
www.voaafrica.com-inf-20250318-081912-1fye9-01989.warc.os.cdx.gz	46212	download
www.voaafrica.com-inf-20250318-081912-1fye9-01990.warc.gz	5384556971	download job
www.voaafrica.com-inf-20250318-081912-1fye9-01990.warc.os.cdx.gz	46154	download