Item archiveteam_archivebot_go_20250418061027_28a10e16

Filename	Size
archiveteam_archivebot_go_20250418061027_28a10e16.cdx.gz	16456882	download
archiveteam_archivebot_go_20250418061027_28a10e16.cdx.idx	16797	download
archiveteam_archivebot_go_20250418061027_28a10e16_files.xml	0	download
archiveteam_archivebot_go_20250418061027_28a10e16_meta.sqlite	40960	download
archiveteam_archivebot_go_20250418061027_28a10e16_meta.xml	881	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-06893.warc.gz	6047471299	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-06893.warc.os.cdx.gz	699	download
das.sdss.org-inf-20250226-051304-5s39o-00780.warc.gz	5370091128	download job
das.sdss.org-inf-20250226-051304-5s39o-00780.warc.os.cdx.gz	314985	download
download.brainimagelibrary.org-inf-20250411-005122-dxu1p-00139.warc.gz	6028912369	download job
download.brainimagelibrary.org-inf-20250411-005122-dxu1p-00139.warc.os.cdx.gz	980	download
dsgonline.com-inf-20250418-044822-3hhzu-00000.warc.gz	5371267426	download job
dsgonline.com-inf-20250418-044822-3hhzu-00000.warc.os.cdx.gz	1592667	download
emptymindfilms.com-inf-20250418-035053-9eh2h-00002.warc.gz	5605511508	download job
emptymindfilms.com-inf-20250418-035053-9eh2h-00002.warc.os.cdx.gz	28285	download
ipsw.me-inf-20241201-145231-9lrev-07586.warc.gz	6382453104	download job
ipsw.me-inf-20241201-145231-9lrev-07586.warc.os.cdx.gz	1166	download
ospo.noaa.gov-inf-20250404-151509-euinz-00343.warc.gz	5370661563	download job
ospo.noaa.gov-inf-20250404-151509-euinz-00343.warc.os.cdx.gz	167379	download
portal.nersc.gov-inf-20250411-235739-duomw-00211.warc.gz	5485404367	download job
portal.nersc.gov-inf-20250411-235739-duomw-00211.warc.os.cdx.gz	1860	download
urls-transfer.archivete.am-2025-04-18_mirror.reenigne.net_2jmc92jux0fpj88b85ulzfdr0_failures.txt-shallow-20250418-013713-6bcn9-00012.warc.gz	7616224097	download job
urls-transfer.archivete.am-2025-04-18_mirror.reenigne.net_2jmc92jux0fpj88b85ulzfdr0_failures.txt-shallow-20250418-013713-6bcn9-00012.warc.os.cdx.gz	383	download
urls-transfer.archivete.am-cdn-prod.playfirst.com_urls_part_08.txt-shallow-20250414-223308-ecoym-00046.warc.gz	5369809341	download job
urls-transfer.archivete.am-cdn-prod.playfirst.com_urls_part_08.txt-shallow-20250414-223308-ecoym-00046.warc.os.cdx.gz	9198679	download
urls-transfer.archivete.am-plala.jp_seed_urls.txt-inf-20250330-064232-1z311-00102.warc.gz	5384238382	download job
urls-transfer.archivete.am-plala.jp_seed_urls.txt-inf-20250330-064232-1z311-00102.warc.os.cdx.gz	2418500	download
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00464.warc.gz	5378160809	download job
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00464.warc.os.cdx.gz	35839	download
urls-transfer.archivete.am-www.biblioteca-digitala.ro.txt-inf-20250414-185922-8dp4c-00155.warc.gz	5369522257	download job
urls-transfer.archivete.am-www.biblioteca-digitala.ro.txt-inf-20250414-185922-8dp4c-00155.warc.os.cdx.gz	85890	download
worstgen.alwaysdata.net-inf-20250403-072755-61ozc-00093.warc.gz	5397812862	download job
worstgen.alwaysdata.net-inf-20250403-072755-61ozc-00093.warc.os.cdx.gz	1195676	download
www.exidegroup.com-inf-20250417-141955-7u1q1-00027.warc.gz	5518731114	download job
www.exidegroup.com-inf-20250417-141955-7u1q1-00027.warc.os.cdx.gz	467744	download
www.flickr.com-inf-20250416-205607-3guaa-00040.warc.gz	5371446030	download job
www.flickr.com-inf-20250416-205607-3guaa-00040.warc.os.cdx.gz	244000	download
www.jeffkoons.com-inf-20250418-012549-s2bh1-00003.warc.gz	5614316607	download job
www.jeffkoons.com-inf-20250418-012549-s2bh1-00003.warc.os.cdx.gz	4495	download
www.pbs.org-inf-20250330-092508-bykmh-02096.warc.gz	5499031261	download job
www.pbs.org-inf-20250330-092508-bykmh-02096.warc.os.cdx.gz	21065	download
www.sciencebase.gov-inf-20250204-024621-3gyep-04753.warc.gz	5492414026	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-04753.warc.os.cdx.gz	120240	download
www.sciencebase.gov-inf-20250204-024621-3gyep-04754.warc.gz	5419167940	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-04754.warc.os.cdx.gz	69761	download
www.voanews.com-inf-20250317-033633-biyl5-01615.warc.gz	5369054662	download job
www.voanews.com-inf-20250317-033633-biyl5-01615.warc.os.cdx.gz	782855	download