Item archiveteam_archivebot_go_20250418142057_e23bfe6b

Filename	Size
archive.physionet.org-inf-20250411-000907-260ld-00186.warc.gz	5374656702	download job
archive.physionet.org-inf-20250411-000907-260ld-00186.warc.os.cdx.gz	234972	download
archiveteam_archivebot_go_20250418142057_e23bfe6b.cdx.gz	227821	download
archiveteam_archivebot_go_20250418142057_e23bfe6b.cdx.idx	206	download
archiveteam_archivebot_go_20250418142057_e23bfe6b_files.xml	0	download
archiveteam_archivebot_go_20250418142057_e23bfe6b_meta.sqlite	73728	download
archiveteam_archivebot_go_20250418142057_e23bfe6b_meta.xml	1045	download
careers.simons-rock.edu-inf-20250418-132535-akw0r-00000.warc.gz	1931666381	download job
careers.simons-rock.edu-inf-20250418-132535-akw0r-00000.warc.os.cdx.gz	891253	download
careers.simons-rock.edu-inf-20250418-132535-akw0r-meta.warc.gz	538454	download job
careers.simons-rock.edu-inf-20250418-132535-akw0r-meta.warc.os.cdx.gz	47	download
careers.simons-rock.edu-inf-20250418-132535-akw0r.json	252	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-06917.warc.gz	5781810218	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-06917.warc.os.cdx.gz	649	download
dumskaya.net-inf-20250417-084446-1cb2y-00004.warc.gz	5368729849	download job
dumskaya.net-inf-20250417-084446-1cb2y-00004.warc.os.cdx.gz	3559226	download
emerging-europe.com-inf-20250413-140856-3cnst-00019.warc.gz	5375138218	download job
emerging-europe.com-inf-20250413-140856-3cnst-00019.warc.os.cdx.gz	868674	download
lemmy.zip-inf-20250312-165238-aa83x-00251.warc.gz	5464304345	download job
lemmy.zip-inf-20250312-165238-aa83x-00251.warc.os.cdx.gz	2556922	download
nashaniva.com-inf-20250406-132646-25j9d-00055.warc.gz	5372808028	download job
nashaniva.com-inf-20250406-132646-25j9d-00055.warc.os.cdx.gz	146555	download
news.simons-rock.edu-inf-20250418-132557-7bz01-00000.warc.gz	1932791881	download job
news.simons-rock.edu-inf-20250418-132557-7bz01-00000.warc.os.cdx.gz	891878	download
news.simons-rock.edu-inf-20250418-132557-7bz01-meta.warc.gz	538164	download job
news.simons-rock.edu-inf-20250418-132557-7bz01-meta.warc.os.cdx.gz	47	download
news.simons-rock.edu-inf-20250418-132557-7bz01.json	249	download job
paleofuture.com-inf-20250416-222401-bpfpd-00019.warc.gz	6197238205	download job
paleofuture.com-inf-20250416-222401-bpfpd-00019.warc.os.cdx.gz	329859	download
portal.nersc.gov-inf-20250411-235739-duomw-00239.warc.gz	5389194542	download job
portal.nersc.gov-inf-20250411-235739-duomw-00239.warc.os.cdx.gz	1685	download
tria.ge-inf-20240613-210600-6m46p-00392.warc.gz	5368717098	download job
tria.ge-inf-20240613-210600-6m46p-00392.warc.os.cdx.gz	14803793	download
urls-transfer.archivete.am-2025-04-18_mirror.reenigne.net_2jmc92jux0fpj88b85ulzfdr0_failures.txt-shallow-20250418-013713-6bcn9-00040.warc.gz	6266123192	download job
urls-transfer.archivete.am-2025-04-18_mirror.reenigne.net_2jmc92jux0fpj88b85ulzfdr0_failures.txt-shallow-20250418-013713-6bcn9-00040.warc.os.cdx.gz	363	download
urls-transfer.archivete.am-2025-04-18_mirror.reenigne.net_2jmc92jux0fpj88b85ulzfdr0_failures.txt-shallow-20250418-013713-6bcn9-00041.warc.gz	5643200036	download job
urls-transfer.archivete.am-2025-04-18_mirror.reenigne.net_2jmc92jux0fpj88b85ulzfdr0_failures.txt-shallow-20250418-013713-6bcn9-00041.warc.os.cdx.gz	690	download
urls-transfer.archivete.am-ebi.ac.uk_subdomains.txt-inf-20250412-060252-cl3rw-00071.warc.gz	6908801431	download job
urls-transfer.archivete.am-ebi.ac.uk_subdomains.txt-inf-20250412-060252-cl3rw-00071.warc.os.cdx.gz	738	download
urls-transfer.archivete.am-ebi.ac.uk_subdomains.txt-inf-20250412-060252-cl3rw-00072.warc.gz	7827087324	download job
urls-transfer.archivete.am-ebi.ac.uk_subdomains.txt-inf-20250412-060252-cl3rw-00072.warc.os.cdx.gz	594	download
urls-transfer.archivete.am-mchs.gov.ru_seed-urls.txt-inf-20250221-133328-259v3-00070.warc.gz	5441347054	download job
urls-transfer.archivete.am-mchs.gov.ru_seed-urls.txt-inf-20250221-133328-259v3-00070.warc.os.cdx.gz	589466	download
urls-transfer.archivete.am-plala.jp_seed_urls.txt-inf-20250330-064232-1z311-00103.warc.gz	5370055182	download job
urls-transfer.archivete.am-plala.jp_seed_urls.txt-inf-20250330-064232-1z311-00103.warc.os.cdx.gz	3225299	download
urls-transfer.archivete.am-www.electronicsandbooks.com.txt-inf-20250103-223214-boqpe-01585.warc.gz	5371208801	download job
urls-transfer.archivete.am-www.electronicsandbooks.com.txt-inf-20250103-223214-boqpe-01585.warc.os.cdx.gz	71947	download
www.pbs.org-inf-20250330-092508-bykmh-02137.warc.gz	5502972424	download job
www.pbs.org-inf-20250330-092508-bykmh-02137.warc.os.cdx.gz	9331	download
www.pbs.org-inf-20250330-092508-bykmh-02138.warc.gz	6305518145	download job
www.pbs.org-inf-20250330-092508-bykmh-02138.warc.os.cdx.gz	24236	download
www.sciencebase.gov-inf-20250204-024621-3gyep-04826.warc.gz	5400635579	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-04826.warc.os.cdx.gz	104823	download
www.sciencebase.gov-inf-20250204-024621-3gyep-04827.warc.gz	5542532506	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-04827.warc.os.cdx.gz	81917	download