Item archiveteam_archivebot_go_20240727143529_35b9e0b4

Filename	Size
7rdj.com-inf-20240527-195302-f1gwl-00221.warc.gz	5424410048	download job
7rdj.com-inf-20240527-195302-f1gwl-00221.warc.os.cdx.gz	106842	download
archive.nytimes.com-inf-20240726-093636-5el9v-00013.warc.gz	5371090823	download job
archive.nytimes.com-inf-20240726-093636-5el9v-00013.warc.os.cdx.gz	3114652	download
archiveteam_archivebot_go_20240727143529_35b9e0b4.cdx.gz	104276	download
archiveteam_archivebot_go_20240727143529_35b9e0b4.cdx.idx	67	download
archiveteam_archivebot_go_20240727143529_35b9e0b4_files.xml	0	download
archiveteam_archivebot_go_20240727143529_35b9e0b4_meta.sqlite	49152	download
archiveteam_archivebot_go_20240727143529_35b9e0b4_meta.xml	1045	download
atmos.nmsu.edu-inf-20240204-120807-adxkx-00404.warc.gz	5369003935	download job
atmos.nmsu.edu-inf-20240204-120807-adxkx-00404.warc.os.cdx.gz	822907	download
catalog-legacy.osaarchivum.org-inf-20240519-093136-3c0u6-00293.warc.gz	5368725451	download job
catalog-legacy.osaarchivum.org-inf-20240519-093136-3c0u6-00293.warc.os.cdx.gz	31799993	download
data.worldpop.org-inf-20240515-011446-esx2x-03018.warc.gz	5369723405	download job
data.worldpop.org-inf-20240515-011446-esx2x-03018.warc.os.cdx.gz	7514	download
forum.wacken.com-inf-20240724-042342-ck21e-00007.warc.gz	5375145353	download job
forum.wacken.com-inf-20240724-042342-ck21e-00007.warc.os.cdx.gz	4216987	download
koha.educacion.gob.ar-inf-20231206-055116-n4ld1-00080.warc.gz	5634414508	download job
koha.educacion.gob.ar-inf-20231206-055116-n4ld1-00080.warc.os.cdx.gz	348281	download
license-assets.hashicorp.com-inf-20240424-200548-3vpwy-01474.warc.gz	7656916484	download job
license-assets.hashicorp.com-inf-20240424-200548-3vpwy-01474.warc.os.cdx.gz	617	download
license.hashicorp.com-inf-20240424-223809-8765g-01605.warc.gz	9111981209	download job
license.hashicorp.com-inf-20240424-223809-8765g-01605.warc.os.cdx.gz	246498	download
license.hashicorp.com-inf-20240424-223809-8765g-01606.warc.gz	8328950457	download job
license.hashicorp.com-inf-20240424-223809-8765g-01606.warc.os.cdx.gz	585	download
new.twit.tv-inf-20240714-003218-71uhe-01307.warc.gz	5470338714	download job
new.twit.tv-inf-20240714-003218-71uhe-01307.warc.os.cdx.gz	298964	download
nsportal.ru-inf-20230714-165720-3lzb3-00985.warc.gz	5368776076	download job
nsportal.ru-inf-20230714-165720-3lzb3-00985.warc.os.cdx.gz	5221098	download
twit.tv-inf-20240714-000325-5hbsl-01242.warc.gz	5455823721	download job
twit.tv-inf-20240714-000325-5hbsl-01242.warc.os.cdx.gz	204571	download
twit.tv-inf-20240714-000325-5hbsl-01243.warc.gz	5378692977	download job
twit.tv-inf-20240714-000325-5hbsl-01243.warc.os.cdx.gz	99882	download
urls-transfer.archivete.am-www.rtvs.sk_json_audio5f.json_urls_through_500k.txt-shallow-20240727-044118-a45qu-00004.warc.gz	5416970018	download job
urls-transfer.archivete.am-www.rtvs.sk_json_audio5f.json_urls_through_500k.txt-shallow-20240727-044118-a45qu-00004.warc.os.cdx.gz	14401	download
www.frontiersin.org-inf-20240117-203250-6tu94-01259.warc.gz	5370882186	download job
www.frontiersin.org-inf-20240117-203250-6tu94-01259.warc.os.cdx.gz	2158527	download
www.motortrend.com-inf-20240228-235057-1gguv-00565.warc.gz	5369012113	download job
www.motortrend.com-inf-20240228-235057-1gguv-00565.warc.os.cdx.gz	2452024	download
www.neimanmarcus.com-inf-20240704-001841-6gfiw-00045.warc.gz	5368869528	download job
www.neimanmarcus.com-inf-20240704-001841-6gfiw-00045.warc.os.cdx.gz	3895521	download
www.scientificamerican.com-inf-20240620-163455-bu8jj-00223.warc.gz	5373288724	download job
www.scientificamerican.com-inf-20240620-163455-bu8jj-00223.warc.os.cdx.gz	435607	download