Item archiveteam_archivebot_go_20250428015045_46b5807f

Filename	Size
archiveteam_archivebot_go_20250428015045_46b5807f.cdx.gz	1235949	download
archiveteam_archivebot_go_20250428015045_46b5807f.cdx.idx	1336	download
archiveteam_archivebot_go_20250428015045_46b5807f_files.xml	0	download
archiveteam_archivebot_go_20250428015045_46b5807f_meta.sqlite	102400	download
archiveteam_archivebot_go_20250428015045_46b5807f_meta.xml	1046	download
armandvaillancourt.com-inf-20250428-014650-735tm-00000.warc.gz	9700	download job
armandvaillancourt.com-inf-20250428-014650-735tm-00000.warc.os.cdx.gz	402	download
armandvaillancourt.com-inf-20250428-014650-735tm-meta.warc.gz	3528	download job
armandvaillancourt.com-inf-20250428-014650-735tm-meta.warc.os.cdx.gz	47	download
armandvaillancourt.com-inf-20250428-014650-735tm.json	253	download job
blog.flickr.net-inf-20250417-070550-2yvt6-00137.warc.gz	5368970118	download job
blog.flickr.net-inf-20250417-070550-2yvt6-00137.warc.os.cdx.gz	1281585	download
blog.muc.ccc.de-inf-20250427-085216-dgqds-meta.warc.gz	6132424	download job
blog.muc.ccc.de-inf-20250427-085216-dgqds-meta.warc.os.cdx.gz	47	download
bowlingballfansubs.it-inf-20250421-214929-9m47g-00254.warc.gz	5391875194	download job
bowlingballfansubs.it-inf-20250421-214929-9m47g-00254.warc.os.cdx.gz	2072	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-07469.warc.gz	5763296773	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-07469.warc.os.cdx.gz	448	download
neatmethod.com-inf-20250427-203323-a5f9f-00004.warc.gz	6523197497	download job
neatmethod.com-inf-20250427-203323-a5f9f-00004.warc.os.cdx.gz	18853	download
portal.nersc.gov-inf-20250411-235739-duomw-00681.warc.gz	5660829993	download job
portal.nersc.gov-inf-20250411-235739-duomw-00681.warc.os.cdx.gz	1567	download
shariki.online-inf-20250428-012658-8x38b-00000.warc.gz	243448925	download job
shariki.online-inf-20250428-012658-8x38b-00000.warc.os.cdx.gz	215245	download
shariki.online-inf-20250428-012658-8x38b-meta.warc.gz	143723	download job
shariki.online-inf-20250428-012658-8x38b-meta.warc.os.cdx.gz	47	download
shariki.online-inf-20250428-012658-8x38b.json	239	download job
sharkpie.com-inf-20250428-012724-de6k7-00000.warc.gz	212606323	download job
sharkpie.com-inf-20250428-012724-de6k7-00000.warc.os.cdx.gz	108738	download
sharkpie.com-inf-20250428-012724-de6k7-meta.warc.gz	52974	download job
sharkpie.com-inf-20250428-012724-de6k7-meta.warc.os.cdx.gz	47	download
sharkpie.com-inf-20250428-012724-de6k7.json	236	download job
theculinarychase.com-inf-20250427-064914-cm5xs-00004.warc.gz	5405113783	download job
theculinarychase.com-inf-20250427-064914-cm5xs-00004.warc.os.cdx.gz	5107289	download
urls-transfer.archivete.am-3-wheelers.com_flymall.org_seed_urls.txt-inf-20250427-182506-1i82c-00003.warc.gz	5371906834	download job
urls-transfer.archivete.am-3-wheelers.com_flymall.org_seed_urls.txt-inf-20250427-182506-1i82c-00003.warc.os.cdx.gz	475935	download
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00721.warc.gz	5385100238	download job
urls-transfer.archivete.am-s3.amazonaws.com_pastperfectonline_bulk.txt-shallow-20250409-225214-ec8sy-00721.warc.os.cdx.gz	14654	download
urls-transfer.archivete.am-wisconsinrightnow.com_subdomains.txt-inf-20250425-230131-1mua5-00024.warc.gz	5563068539	download job
urls-transfer.archivete.am-wisconsinrightnow.com_subdomains.txt-inf-20250425-230131-1mua5-00024.warc.os.cdx.gz	417873	download
urls-transfer.archivete.am-www.airfieldsfreeman.com_airfieldsfreeman.com.txt-inf-20250427-231743-c3hgv-00000.warc.gz	5368963086	download job
urls-transfer.archivete.am-www.airfieldsfreeman.com_airfieldsfreeman.com.txt-inf-20250427-231743-c3hgv-00000.warc.os.cdx.gz	2312009	download
urls-transfer.archivete.am-www.electronicsandbooks.com.txt-inf-20250103-223214-boqpe-01652.warc.gz	5368776578	download job
urls-transfer.archivete.am-www.electronicsandbooks.com.txt-inf-20250103-223214-boqpe-01652.warc.os.cdx.gz	668111	download
videocast.nih.gov-inf-20250411-131031-4l9c9-01033.warc.gz	6719750582	download job
videocast.nih.gov-inf-20250411-131031-4l9c9-01033.warc.os.cdx.gz	800	download
wiki.muc.ccc.de-inf-20250427-090335-1u2mn-00004.warc.gz	1172554856	download job
wiki.muc.ccc.de-inf-20250427-090335-1u2mn-00004.warc.os.cdx.gz	2970549	download
wiki.muc.ccc.de-inf-20250427-090335-1u2mn-meta.warc.gz	8047419	download job
wiki.muc.ccc.de-inf-20250427-090335-1u2mn-meta.warc.os.cdx.gz	47	download
wiki.muc.ccc.de-inf-20250427-090335-1u2mn.json	243	download job
www.armandvaillancourt.com-inf-20250428-014545-6yneb-00000.warc.gz	9754	download job
www.armandvaillancourt.com-inf-20250428-014545-6yneb-00000.warc.os.cdx.gz	407	download
www.armandvaillancourt.com-inf-20250428-014545-6yneb-meta.warc.gz	3553	download job
www.armandvaillancourt.com-inf-20250428-014545-6yneb-meta.warc.os.cdx.gz	47	download
www.armandvaillancourt.com-inf-20250428-014545-6yneb.json	257	download job
www.flickr.com-inf-20250424-223237-7v090-00163.warc.gz	5398858045	download job
www.flickr.com-inf-20250424-223237-7v090-00163.warc.os.cdx.gz	100418	download
www.pbs.org-inf-20250330-092508-bykmh-03014.warc.gz	6070075903	download job
www.pbs.org-inf-20250330-092508-bykmh-03014.warc.os.cdx.gz	37643	download
www.pbs.org-inf-20250330-092508-bykmh-03015.warc.gz	5442037202	download job
www.pbs.org-inf-20250330-092508-bykmh-03015.warc.os.cdx.gz	22093	download
www.sciencebase.gov-inf-20250204-024621-3gyep-06609.warc.gz	5420478581	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-06609.warc.os.cdx.gz	103307	download
www.sciencebase.gov-inf-20250204-024621-3gyep-06610.warc.gz	5393627761	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-06610.warc.os.cdx.gz	115620	download
www.sciencebase.gov-inf-20250204-024621-3gyep-06611.warc.gz	5658807114	download job
www.sciencebase.gov-inf-20250204-024621-3gyep-06611.warc.os.cdx.gz	117175	download
www.seat61.com-inf-20250427-213811-ax65a-00000.warc.gz	5374254031	download job
www.seat61.com-inf-20250427-213811-ax65a-00000.warc.os.cdx.gz	3035646	download
www.tutlanguage.com-inf-20250428-013401-bou4t-00000.warc.gz	687644	download job
www.tutlanguage.com-inf-20250428-013401-bou4t-00000.warc.os.cdx.gz	2678	download
www.tutlanguage.com-inf-20250428-013401-bou4t-meta.warc.gz	4746	download job
www.tutlanguage.com-inf-20250428-013401-bou4t-meta.warc.os.cdx.gz	47	download
www.tutlanguage.com-inf-20250428-013401-bou4t.json	245	download job
www.usgs.gov-inf-20250404-060507-d6v2m-00325.warc.gz	5522279917	download job
www.usgs.gov-inf-20250404-060507-d6v2m-00325.warc.os.cdx.gz	14515	download
www.voanews.com-inf-20250317-033633-biyl5-01819.warc.gz	5384837224	download job
www.voanews.com-inf-20250317-033633-biyl5-01819.warc.os.cdx.gz	915247	download