Item archiveteam_archivebot_go_20240229235529_97248e94

Filename	Size
archiveswest.orbiscascade.org-inf-20240226-171052-689rj-00038.warc.gz	5373612047	download job
archiveswest.orbiscascade.org-inf-20240226-171052-689rj-00038.warc.os.cdx.gz	43900	download
archiveswest.orbiscascade.org-inf-20240226-171052-689rj-00039.warc.gz	5396760825	download job
archiveswest.orbiscascade.org-inf-20240226-171052-689rj-00039.warc.os.cdx.gz	42231	download
archiveswest.orbiscascade.org-inf-20240226-171052-689rj-00040.warc.gz	5413487966	download job
archiveswest.orbiscascade.org-inf-20240226-171052-689rj-00040.warc.os.cdx.gz	35876	download
archiveteam_archivebot_go_20240229235529_97248e94.cdx.gz	6251429	download
archiveteam_archivebot_go_20240229235529_97248e94.cdx.idx	6443	download
archiveteam_archivebot_go_20240229235529_97248e94_files.xml	0	download
archiveteam_archivebot_go_20240229235529_97248e94_meta.sqlite	20480	download
archiveteam_archivebot_go_20240229235529_97248e94_meta.xml	830	download
de.indymedia.org-inf-20240229-004856-cco5t-00007.warc.gz	5444424039	download job
de.indymedia.org-inf-20240229-004856-cco5t-00007.warc.os.cdx.gz	1770780	download
digitalcommons.usf.edu-inf-20240223-195923-1xr4l-00087.warc.gz	5368907485	download job
digitalcommons.usf.edu-inf-20240223-195923-1xr4l-00087.warc.os.cdx.gz	21787	download
dl.fireon.live-shallow-20240229-234448-slnhj-00000.warc.gz	147784	download job
dl.fireon.live-shallow-20240229-234448-slnhj-00000.warc.os.cdx.gz	255	download
dl.fireon.live-shallow-20240229-234448-slnhj-meta.warc.gz	3501	download job
dl.fireon.live-shallow-20240229-234448-slnhj-meta.warc.os.cdx.gz	47	download
dl.fireon.live-shallow-20240229-234448-slnhj.json	290	download job
dumps.wikimedia.org-inf-20240229-191647-e4ti9-00004.warc.gz	5383459091	download job
dumps.wikimedia.org-inf-20240229-191647-e4ti9-00004.warc.os.cdx.gz	9694	download
dumps.wikimedia.org-inf-20240229-192025-egwmh-00003.warc.gz	5426635387	download job
dumps.wikimedia.org-inf-20240229-192025-egwmh-00003.warc.os.cdx.gz	3929	download
dumps.wikimedia.org-inf-20240229-192922-2d9tb-00006.warc.gz	6769252337	download job
dumps.wikimedia.org-inf-20240229-192922-2d9tb-00006.warc.os.cdx.gz	2505	download
dumps.wikimedia.org-inf-20240229-193123-6rmcu-00008.warc.gz	5397192725	download job
dumps.wikimedia.org-inf-20240229-193123-6rmcu-00008.warc.os.cdx.gz	4328	download
dumps.wikimedia.org-inf-20240229-202804-d055c-00001.warc.gz	2479	download job
dumps.wikimedia.org-inf-20240229-202804-d055c-00001.warc.os.cdx.gz	47	download
dumps.wikimedia.org-inf-20240229-202804-d055c-meta.warc.gz	3599	download job
dumps.wikimedia.org-inf-20240229-202804-d055c-meta.warc.os.cdx.gz	47	download
dumps.wikimedia.org-inf-20240229-202804-d055c.json	264	download job
europepmc.org-inf-20240212-215511-8x1ov-00495.warc.gz	5369342300	download job
europepmc.org-inf-20240212-215511-8x1ov-00495.warc.os.cdx.gz	90443	download
ibew1245.com-inf-20240229-144227-ealhe-00001.warc.gz	5858358641	download job
ibew1245.com-inf-20240229-144227-ealhe-00001.warc.os.cdx.gz	982286	download
ibew396.org-inf-20240229-220524-chkg0-00000.warc.gz	940426538	download job
ibew396.org-inf-20240229-220524-chkg0-00000.warc.os.cdx.gz	1136006	download
ibew396.org-inf-20240229-220524-chkg0-meta.warc.gz	620503	download job
ibew396.org-inf-20240229-220524-chkg0-meta.warc.os.cdx.gz	47	download
ibew396.org-inf-20240229-220524-chkg0.json	243	download job
pitchfork.com-inf-20240121-031358-6jyle-00618.warc.gz	5453939734	download job
pitchfork.com-inf-20240121-031358-6jyle-00618.warc.os.cdx.gz	314172	download
thunderstore.io-inf-20240226-023619-97uti-00094.warc.gz	5409294766	download job
thunderstore.io-inf-20240226-023619-97uti-00094.warc.os.cdx.gz	66551	download
timeweb.com-inf-20240203-043853-erq28-00397.warc.gz	5369782541	download job
timeweb.com-inf-20240203-043853-erq28-00397.warc.os.cdx.gz	827678	download
transfer.archivete.am-shallow-20240229-231812-egc6g-00000.warc.gz	489779	download job
transfer.archivete.am-shallow-20240229-231812-egc6g-00000.warc.os.cdx.gz	248	download
transfer.archivete.am-shallow-20240229-231812-egc6g-meta.warc.gz	3455	download job
transfer.archivete.am-shallow-20240229-231812-egc6g-meta.warc.os.cdx.gz	47	download
transfer.archivete.am-shallow-20240229-231812-egc6g.json	282	download job
transfer.archivete.am-shallow-20240229-231904-1i4h5-00000.warc.gz	25170	download job
transfer.archivete.am-shallow-20240229-231904-1i4h5-00000.warc.os.cdx.gz	249	download
transfer.archivete.am-shallow-20240229-231904-1i4h5-meta.warc.gz	3534	download job
transfer.archivete.am-shallow-20240229-231904-1i4h5-meta.warc.os.cdx.gz	47	download
transfer.archivete.am-shallow-20240229-231904-1i4h5.json	284	download job
transfer.archivete.am-shallow-20240229-234817-5d3kz-00000.warc.gz	150114673	download job
transfer.archivete.am-shallow-20240229-234817-5d3kz-00000.warc.os.cdx.gz	264	download
transfer.archivete.am-shallow-20240229-234817-5d3kz-meta.warc.gz	3512	download job
transfer.archivete.am-shallow-20240229-234817-5d3kz-meta.warc.os.cdx.gz	47	download
transfer.archivete.am-shallow-20240229-234817-5d3kz.json	283	download job
transfer.archivete.am-shallow-20240229-235110-dv9l5-00000.warc.gz	4372	download job
transfer.archivete.am-shallow-20240229-235110-dv9l5-00000.warc.os.cdx.gz	252	download
transfer.archivete.am-shallow-20240229-235110-dv9l5-meta.warc.gz	3513	download job
transfer.archivete.am-shallow-20240229-235110-dv9l5-meta.warc.os.cdx.gz	47	download
transfer.archivete.am-shallow-20240229-235110-dv9l5.json	287	download job
urls-transfer.archivete.am-cdn.gea.esac.esa.int-inf-20240216-175935-5jhse-remainder-shallow-20240228-163104-y5t9y-00095.warc.gz	6691663983	download job
urls-transfer.archivete.am-cdn.gea.esac.esa.int-inf-20240216-175935-5jhse-remainder-shallow-20240228-163104-y5t9y-00095.warc.os.cdx.gz	691	download
urls-transfer.archivete.am-images.pexels.com_photos_jpeg_12M_to_13M.txt-shallow-20240228-200435-cnep0-00052.warc.gz	5368851552	download job
urls-transfer.archivete.am-images.pexels.com_photos_jpeg_12M_to_13M.txt-shallow-20240228-200435-cnep0-00052.warc.os.cdx.gz	216668	download
urls-transfer.archivete.am-thf_media.s3.amazonaws.com_scraped_urls.txt-shallow-20240229-230501-dlljz-00000.warc.gz	5369799583	download job
urls-transfer.archivete.am-thf_media.s3.amazonaws.com_scraped_urls.txt-shallow-20240229-230501-dlljz-00000.warc.os.cdx.gz	362403	download
urls-transfer.archivete.am-thf_media.s3.amazonaws.com_scraped_urls.txt-shallow-20240229-230501-dlljz-00001.warc.gz	131614796	download job
urls-transfer.archivete.am-thf_media.s3.amazonaws.com_scraped_urls.txt-shallow-20240229-230501-dlljz-00001.warc.os.cdx.gz	23092	download
urls-transfer.archivete.am-thf_media.s3.amazonaws.com_scraped_urls.txt-shallow-20240229-230501-dlljz-meta.warc.gz	186843	download job
urls-transfer.archivete.am-thf_media.s3.amazonaws.com_scraped_urls.txt-shallow-20240229-230501-dlljz-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-thf_media.s3.amazonaws.com_scraped_urls.txt-shallow-20240229-230501-dlljz-urls.txt	514975	download
urls-transfer.archivete.am-thf_media.s3.amazonaws.com_scraped_urls.txt-shallow-20240229-230501-dlljz.json	384	download job
urls-transfer.archivete.am-www.curseforge.com_mod_download_404s_resume.txt-shallow-20240219-030715-cpamk-00709.warc.gz	5369308572	download job
urls-transfer.archivete.am-www.curseforge.com_mod_download_404s_resume.txt-shallow-20240219-030715-cpamk-00709.warc.os.cdx.gz	43840	download
video.ictp.it-inf-20240227-163244-d3zhc-00195.warc.gz	5843648762	download job
video.ictp.it-inf-20240227-163244-d3zhc-00195.warc.os.cdx.gz	773	download
www.ibew494.com-inf-20240229-232001-cf1qp-00000.warc.gz	699592018	download job
www.ibew494.com-inf-20240229-232001-cf1qp-00000.warc.os.cdx.gz	443161	download
www.ibew494.com-inf-20240229-232001-cf1qp-meta.warc.gz	270522	download job
www.ibew494.com-inf-20240229-232001-cf1qp-meta.warc.os.cdx.gz	47	download
www.ibew494.com-inf-20240229-232001-cf1qp.json	248	download job
www.ibew583.com-inf-20240229-234722-9p0p0-00000.warc.gz	7981	download job
www.ibew583.com-inf-20240229-234722-9p0p0-00000.warc.os.cdx.gz	47	download
www.ibew583.com-inf-20240229-234722-9p0p0-meta.warc.gz	3600	download job
www.ibew583.com-inf-20240229-234722-9p0p0-meta.warc.os.cdx.gz	47	download
www.ibew583.com-inf-20240229-234722-9p0p0.json	248	download job