Item archiveteam_archivebot_go_20240502142815_0cc0a082

Filename	Size
archiveteam_archivebot_go_20240502142815_0cc0a082.cdx.gz	6316943	download
archiveteam_archivebot_go_20240502142815_0cc0a082.cdx.idx	5819	download
archiveteam_archivebot_go_20240502142815_0cc0a082_files.xml	0	download
archiveteam_archivebot_go_20240502142815_0cc0a082_meta.sqlite	102400	download
archiveteam_archivebot_go_20240502142815_0cc0a082_meta.xml	1047	download
balloon-juice.com-inf-20240410-205032-ee5cy-00133.warc.gz	5369062688	download job
balloon-juice.com-inf-20240410-205032-ee5cy-00133.warc.os.cdx.gz	817678	download
candlekeep.com-inf-20240501-042517-7itrt-00002.warc.gz	6986549345	download job
candlekeep.com-inf-20240501-042517-7itrt-00002.warc.os.cdx.gz	5629926	download
ebiblio.feedbooks.com-inf-20240329-043352-8p6cj-00067.warc.gz	5372040828	download job
ebiblio.feedbooks.com-inf-20240329-043352-8p6cj-00067.warc.os.cdx.gz	3562442	download
fogu.com-inf-20240430-235402-7ro5n-00007.warc.gz	5369307854	download job
fogu.com-inf-20240430-235402-7ro5n-00007.warc.os.cdx.gz	3312056	download
krxa540.com-inf-20240502-034756-esyio-00004.warc.gz	5411693345	download job
krxa540.com-inf-20240502-034756-esyio-00004.warc.os.cdx.gz	826738	download
stackoverflow.com-shallow-20240502-141744-cwmap-00000.warc.gz	4260	download job
stackoverflow.com-shallow-20240502-141744-cwmap-00000.warc.os.cdx.gz	262	download
stackoverflow.com-shallow-20240502-141744-cwmap-meta.warc.gz	3568	download job
stackoverflow.com-shallow-20240502-141744-cwmap-meta.warc.os.cdx.gz	47	download
stackoverflow.com-shallow-20240502-141744-cwmap.json	313	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-06538.warc.gz	5561437152	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-06538.warc.os.cdx.gz	942	download
storage.googleapis.com-inf-20240301-202801-5jgg7-06539.warc.gz	5755911288	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-06539.warc.os.cdx.gz	945	download
truthout.org-inf-20240408-165731-16a89-00321.warc.gz	5375715008	download job
truthout.org-inf-20240408-165731-16a89-00321.warc.os.cdx.gz	809879	download
urls-transfer.archivete.am-2024-05-02_pickmy_org_mp3s.txt-shallow-20240502-140322-doss8-00000.warc.gz	10569970	download job
urls-transfer.archivete.am-2024-05-02_pickmy_org_mp3s.txt-shallow-20240502-140322-doss8-00000.warc.os.cdx.gz	441	download
urls-transfer.archivete.am-2024-05-02_pickmy_org_mp3s.txt-shallow-20240502-140322-doss8-meta.warc.gz	3678	download job
urls-transfer.archivete.am-2024-05-02_pickmy_org_mp3s.txt-shallow-20240502-140322-doss8-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-2024-05-02_pickmy_org_mp3s.txt-shallow-20240502-140322-doss8-urls.txt	141	download
urls-transfer.archivete.am-2024-05-02_pickmy_org_mp3s.txt-shallow-20240502-140322-doss8.json	352	download job
urls-transfer.archivete.am-images.pexels.com_photos_jpg_5M_to_6M.txt-shallow-20240502-010736-bbm88-00000.warc.gz	472158898	download job
urls-transfer.archivete.am-images.pexels.com_photos_jpg_5M_to_6M.txt-shallow-20240502-010736-bbm88-00000.warc.os.cdx.gz	4832884	download
urls-transfer.archivete.am-images.pexels.com_photos_jpg_5M_to_6M.txt-shallow-20240502-010736-bbm88-meta.warc.gz	4963701	download job
urls-transfer.archivete.am-images.pexels.com_photos_jpg_5M_to_6M.txt-shallow-20240502-010736-bbm88-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-images.pexels.com_photos_jpg_5M_to_6M.txt-shallow-20240502-010736-bbm88-urls.txt	17612958	download
urls-transfer.archivete.am-images.pexels.com_photos_jpg_5M_to_6M.txt-shallow-20240502-010736-bbm88.json	378	download job
urls-transfer.archivete.am-sbnation_Shutdown-Fullcast-Podcast.txt-shallow-20240502-111407-16lnn-00005.warc.gz	5500475903	download job
urls-transfer.archivete.am-sbnation_Shutdown-Fullcast-Podcast.txt-shallow-20240502-111407-16lnn-00005.warc.os.cdx.gz	28944	download
urls-transfer.archivete.am-workshop.abcvg.info_seed_urls.txt-inf-20240425-164117-br34y-00416.warc.gz	5918348044	download job
urls-transfer.archivete.am-workshop.abcvg.info_seed_urls.txt-inf-20240425-164117-br34y-00416.warc.os.cdx.gz	9433	download
wissenschaft3000.wordpress.com-inf-20240430-203453-33pk9-00040.warc.gz	5441082001	download job
wissenschaft3000.wordpress.com-inf-20240430-203453-33pk9-00040.warc.os.cdx.gz	2540294	download
www.911oz.com-inf-20240502-142317-bpo03-00000.warc.gz	29136	download job
www.911oz.com-inf-20240502-142317-bpo03-00000.warc.os.cdx.gz	320	download
www.911oz.com-inf-20240502-142317-bpo03-meta.warc.gz	3448	download job
www.911oz.com-inf-20240502-142317-bpo03-meta.warc.os.cdx.gz	47	download
www.911oz.com-inf-20240502-142317-bpo03.json	244	download job
www.dushanwegner.com-inf-20240501-203729-bf5p8-00025.warc.gz	5459602292	download job
www.dushanwegner.com-inf-20240501-203729-bf5p8-00025.warc.os.cdx.gz	640593	download
www.gutenberg.org-inf-20240317-080231-d1spw-00314.warc.gz	5406024981	download job
www.gutenberg.org-inf-20240317-080231-d1spw-00314.warc.os.cdx.gz	819375	download
www.heinze.de-inf-20240430-185318-2m80a-00025.warc.gz	5376557137	download job
www.heinze.de-inf-20240430-185318-2m80a-00025.warc.os.cdx.gz	4143080	download
www.nakedcapitalism.com-inf-20240327-011540-4qq9p-00463.warc.gz	5960673640	download job
www.nakedcapitalism.com-inf-20240327-011540-4qq9p-00463.warc.os.cdx.gz	473002	download
www.nikke-kr.com-shallow-20240502-140746-4hi0y-00000.warc.gz	8466228	download job
www.nikke-kr.com-shallow-20240502-140746-4hi0y-00000.warc.os.cdx.gz	246	download
www.nikke-kr.com-shallow-20240502-140746-4hi0y-meta.warc.gz	3491	download job
www.nikke-kr.com-shallow-20240502-140746-4hi0y-meta.warc.os.cdx.gz	47	download
www.nikke-kr.com-shallow-20240502-140746-4hi0y.json	277	download job
www.nikke-kr.com-shallow-20240502-141138-c466j-00000.warc.gz	3861	download job
www.nikke-kr.com-shallow-20240502-141138-c466j-00000.warc.os.cdx.gz	234	download
www.nikke-kr.com-shallow-20240502-141138-c466j-meta.warc.gz	3477	download job
www.nikke-kr.com-shallow-20240502-141138-c466j-meta.warc.os.cdx.gz	47	download
www.nikke-kr.com-shallow-20240502-141138-c466j.json	277	download job
www.polskieradio.pl-inf-20231221-075717-djrf2-01720.warc.gz	5369592619	download job
www.polskieradio.pl-inf-20231221-075717-djrf2-01720.warc.os.cdx.gz	909441	download
www.tetrapak.com-inf-20240502-040224-l4ba4-00004.warc.gz	5402750000	download job
www.tetrapak.com-inf-20240502-040224-l4ba4-00004.warc.os.cdx.gz	302498	download
www.truthmove.org-inf-20240501-152332-by643-00028.warc.gz	5368806118	download job
www.truthmove.org-inf-20240501-152332-by643-00028.warc.os.cdx.gz	487816	download
www.truthmove.org-inf-20240501-152332-by643-00029.warc.gz	5397127848	download job
www.truthmove.org-inf-20240501-152332-by643-00029.warc.os.cdx.gz	63546	download
www.truthmove.org-inf-20240501-152332-by643-00030.warc.gz	8783687102	download job
www.truthmove.org-inf-20240501-152332-by643-00030.warc.os.cdx.gz	4143	download