Item archiveteam_archivebot_go_20250424230303_0478e9ab

Filename	Size
annualreports-staging.gillfoundation.org-inf-20250424-182923-3l898-00000.warc.gz	5368738258	download job
annualreports-staging.gillfoundation.org-inf-20250424-182923-3l898-00000.warc.os.cdx.gz	4305549	download
archiveteam_archivebot_go_20250424230303_0478e9ab.cdx.gz	4196297	download
archiveteam_archivebot_go_20250424230303_0478e9ab.cdx.idx	4748	download
archiveteam_archivebot_go_20250424230303_0478e9ab_files.xml	0	download
archiveteam_archivebot_go_20250424230303_0478e9ab_meta.sqlite	20480	download
archiveteam_archivebot_go_20250424230303_0478e9ab_meta.xml	881	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-07320.warc.gz	6772005212	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-07320.warc.os.cdx.gz	799	download
documentedny.com-inf-20250420-075236-5jyxb-00008.warc.gz	5372073914	download job
documentedny.com-inf-20250420-075236-5jyxb-00008.warc.os.cdx.gz	218759	download
library.harvard.edu-inf-20250422-154013-9gfft-00046.warc.gz	6136216055	download job
library.harvard.edu-inf-20250422-154013-9gfft-00046.warc.os.cdx.gz	10340	download
news.exchristian.net-inf-20250424-204558-dg4jp-00000.warc.gz	5790730102	download job
news.exchristian.net-inf-20250424-204558-dg4jp-00000.warc.os.cdx.gz	1358306	download
urls-transfer.archivete.am-4dnucleome.org_subdomains.txt-inf-20250411-044610-9dhhx-00134.warc.gz	41998498175	download job
urls-transfer.archivete.am-4dnucleome.org_subdomains.txt-inf-20250411-044610-9dhhx-00134.warc.os.cdx.gz	2384	download
urls-transfer.archivete.am-cozen.com_subdomains.txt-inf-20250423-183005-bc1fb-00027.warc.gz	5547136850	download job
urls-transfer.archivete.am-cozen.com_subdomains.txt-inf-20250423-183005-bc1fb-00027.warc.os.cdx.gz	714013	download
urls-transfer.archivete.am-data.nber.org_conference.nber.org_back.nber.org_users.nber.org_taxsim.nber.org_seed_urls.txt-inf-20250420-200407-beeo4-00083.warc.gz	5487872746	download job
urls-transfer.archivete.am-data.nber.org_conference.nber.org_back.nber.org_users.nber.org_taxsim.nber.org_seed_urls.txt-inf-20250420-200407-beeo4-00083.warc.os.cdx.gz	356838	download
urls-transfer.archivete.am-skinregeneration.org_subdomains.txt-inf-20250411-045441-8aqot-00193.warc.gz	5368869205	download job
urls-transfer.archivete.am-skinregeneration.org_subdomains.txt-inf-20250411-045441-8aqot-00193.warc.os.cdx.gz	1758816	download
urls-transfer.archivete.am-www.biblioteca-digitala.ro.txt-inf-20250414-185922-8dp4c-00358.warc.gz	5372724046	download job
urls-transfer.archivete.am-www.biblioteca-digitala.ro.txt-inf-20250414-185922-8dp4c-00358.warc.os.cdx.gz	141819	download
www.gazeteduvar.com.tr-inf-20250313-223802-94e2e-00020.warc.gz	5574851345	download job
www.gazeteduvar.com.tr-inf-20250313-223802-94e2e-00020.warc.os.cdx.gz	2658000	download
www.pbs.org-inf-20250330-092508-bykmh-02704.warc.gz	5431830589	download job
www.pbs.org-inf-20250330-092508-bykmh-02704.warc.os.cdx.gz	14407	download
www.sciencebase.gov-inf-20250204-024621-3gyep-06072.warc.gz	5392800926	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-06072.warc.os.cdx.gz	162702	download
www.sciencebase.gov-inf-20250204-024621-3gyep-06073.warc.gz	5390239699	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-06073.warc.os.cdx.gz	209245	download
www.sourcewatch.org-inf-20250302-190121-52kdv-00049.warc.gz	5626813115	download job
www.sourcewatch.org-inf-20250302-190121-52kdv-00049.warc.os.cdx.gz	1949712	download