Item archiveteam_archivebot_go_20240627120841_3f7786a8

Filename	Size
archivebot.com-shallow-20240627-111416-22irg-00000.warc.gz	4137	download job
archivebot.com-shallow-20240627-111416-22irg-00000.warc.os.cdx.gz	244	download
archivebot.com-shallow-20240627-111416-22irg.json	296	download job
archiveteam_archivebot_go_20240627120841_3f7786a8.cdx.gz	40277897	download
archiveteam_archivebot_go_20240627120841_3f7786a8.cdx.idx	52943	download
archiveteam_archivebot_go_20240627120841_3f7786a8_files.xml	0	download
archiveteam_archivebot_go_20240627120841_3f7786a8_meta.sqlite	176128	download
archiveteam_archivebot_go_20240627120841_3f7786a8_meta.xml	881	download
comicbook.com-inf-20240627-113627-dzzqe-00000.warc.gz	13583	download job
comicbook.com-inf-20240627-113627-dzzqe-00000.warc.os.cdx.gz	317	download
comicbook.com-inf-20240627-113627-dzzqe-meta.warc.gz	3501	download job
comicbook.com-inf-20240627-113627-dzzqe-meta.warc.os.cdx.gz	47	download
comicbook.com-inf-20240627-113627-dzzqe.json	241	download job
critfc.org-inf-20240627-001453-3g53z-00002.warc.gz	2392869178	download job
critfc.org-inf-20240627-001453-3g53z-00002.warc.os.cdx.gz	3572768	download
critfc.org-inf-20240627-001453-3g53z-meta.warc.gz	5006882	download job
critfc.org-inf-20240627-001453-3g53z-meta.warc.os.cdx.gz	47	download
critfc.org-inf-20240627-001453-3g53z.json	241	download job
data.worldpop.org-inf-20240515-011446-esx2x-01601.warc.gz	6009424037	download job
data.worldpop.org-inf-20240515-011446-esx2x-01601.warc.os.cdx.gz	605	download
data.worldpop.org-inf-20240515-011446-esx2x-01602.warc.gz	6009457021	download job
data.worldpop.org-inf-20240515-011446-esx2x-01602.warc.os.cdx.gz	607	download
docs.jboss.org-inf-20240627-080740-chvtw-00000.warc.gz	4582735179	download job
docs.jboss.org-inf-20240627-080740-chvtw-00000.warc.os.cdx.gz	3430126	download
docs.jboss.org-inf-20240627-080740-chvtw-meta.warc.gz	2254195	download job
docs.jboss.org-inf-20240627-080740-chvtw-meta.warc.os.cdx.gz	47	download
docs.jboss.org-inf-20240627-080740-chvtw.json	264	download job
egu21.eu-inf-20240627-114937-6mjb6-00000.warc.gz	142042057	download job
egu21.eu-inf-20240627-114937-6mjb6-00000.warc.os.cdx.gz	210701	download
egu21.eu-inf-20240627-114937-6mjb6-meta.warc.gz	143032	download job
egu21.eu-inf-20240627-114937-6mjb6-meta.warc.os.cdx.gz	47	download
egu21.eu-inf-20240627-114937-6mjb6.json	236	download job
greekreporter.com-inf-20240620-105556-ozkbm-00047.warc.gz	5378024828	download job
greekreporter.com-inf-20240620-105556-ozkbm-00047.warc.os.cdx.gz	1395973	download
kottke.org-inf-20240627-014043-8stnz-00002.warc.gz	5417135622	download job
kottke.org-inf-20240627-014043-8stnz-00002.warc.os.cdx.gz	2212339	download
lavag.org-inf-20240621-092919-2lw2c-00016.warc.gz	1355614963	download job
lavag.org-inf-20240621-092919-2lw2c-00016.warc.os.cdx.gz	2839031	download
lavag.org-inf-20240621-092919-2lw2c-meta.warc.gz	75771630	download job
lavag.org-inf-20240621-092919-2lw2c-meta.warc.os.cdx.gz	47	download
lavag.org-inf-20240621-092919-2lw2c.json	249	download job
learn.microsoft.com-inf-20240606-084119-1y7vh-00160.warc.gz	5564092915	download job
learn.microsoft.com-inf-20240606-084119-1y7vh-00160.warc.os.cdx.gz	2644966	download
lists.oulu.fi-inf-20240626-095610-dzixm-00007.warc.gz	5369620712	download job
lists.oulu.fi-inf-20240626-095610-dzixm-00007.warc.os.cdx.gz	4716259	download
portadosfundos.com.br-inf-20240627-113418-6jt9n-aborted-00000.warc.gz	3664982	download job
portadosfundos.com.br-inf-20240627-113418-6jt9n-aborted-00000.warc.os.cdx.gz	6588	download
portadosfundos.com.br-inf-20240627-113418-6jt9n-aborted-wpull.log.gz	4618	download
portadosfundos.com.br-inf-20240627-113418-6jt9n-aborted.json	248	download job
soss2024.sciencesconf.org-inf-20240627-115143-48rzp-00000.warc.gz	68651354	download job
soss2024.sciencesconf.org-inf-20240627-115143-48rzp-00000.warc.os.cdx.gz	105622	download
soss2024.sciencesconf.org-inf-20240627-115143-48rzp-meta.warc.gz	60070	download job
soss2024.sciencesconf.org-inf-20240627-115143-48rzp-meta.warc.os.cdx.gz	47	download
soss2024.sciencesconf.org-inf-20240627-115143-48rzp.json	253	download job
vh1.com-inf-20240627-112749-d365e-00000.warc.gz	1671888	download job
vh1.com-inf-20240627-112749-d365e-00000.warc.os.cdx.gz	5371	download
vh1.com-inf-20240627-112749-d365e-meta.warc.gz	6190	download job
vh1.com-inf-20240627-112749-d365e-meta.warc.os.cdx.gz	47	download
vh1.com-inf-20240627-112749-d365e.json	235	download job
www.betchannel.fr-inf-20240627-105008-emwl7-00000.warc.gz	81598528	download job
www.betchannel.fr-inf-20240627-105008-emwl7-00000.warc.os.cdx.gz	129771	download
www.betchannel.fr-inf-20240627-105008-emwl7-meta.warc.gz	83888	download job
www.betchannel.fr-inf-20240627-105008-emwl7-meta.warc.os.cdx.gz	47	download
www.betchannel.fr-inf-20240627-105008-emwl7.json	245	download job
www.comicbook.com-inf-20240627-113618-39djo-00000.warc.gz	13743	download job
www.comicbook.com-inf-20240627-113618-39djo-00000.warc.os.cdx.gz	299	download
www.comicbook.com-inf-20240627-113618-39djo-meta.warc.gz	3506	download job
www.comicbook.com-inf-20240627-113618-39djo-meta.warc.os.cdx.gz	47	download
www.comicbook.com-inf-20240627-113618-39djo.json	245	download job
www.comicbook.com-inf-20240627-113715-39djo-00000.warc.gz	13679	download job
www.comicbook.com-inf-20240627-113715-39djo-00000.warc.os.cdx.gz	296	download
www.comicbook.com-inf-20240627-113715-39djo-meta.warc.gz	3497	download job
www.comicbook.com-inf-20240627-113715-39djo-meta.warc.os.cdx.gz	47	download
www.comicbook.com-inf-20240627-113715-39djo.json	245	download job
www.cs.cmu.edu-inf-20240609-135415-7wa5x-00145.warc.gz	5368842384	download job
www.cs.cmu.edu-inf-20240609-135415-7wa5x-00145.warc.os.cdx.gz	1397633	download
www.egu.eu-inf-20240627-060205-8eua5-00003.warc.gz	5397368113	download job
www.egu.eu-inf-20240627-060205-8eua5-00003.warc.os.cdx.gz	965187	download
www.facebook.com-inf-20240627-112909-4lm1u-00000.warc.gz	4996	download job
www.facebook.com-inf-20240627-112909-4lm1u-00000.warc.os.cdx.gz	218	download
www.facebook.com-inf-20240627-112909-4lm1u-meta.warc.gz	3353	download job
www.facebook.com-inf-20240627-112909-4lm1u-meta.warc.os.cdx.gz	47	download
www.facebook.com-inf-20240627-112909-4lm1u.json	248	download job
www.feierabend.de-inf-20240622-085510-28y19-00107.warc.gz	5620701211	download job
www.feierabend.de-inf-20240622-085510-28y19-00107.warc.os.cdx.gz	2940545	download
www.fintechnexus.com-inf-20240623-151130-3mwjj-00038.warc.gz	5570196072	download job
www.fintechnexus.com-inf-20240623-151130-3mwjj-00038.warc.os.cdx.gz	399749	download
www.fintechnexus.com-inf-20240623-151130-3mwjj-00039.warc.gz	5475980271	download job
www.fintechnexus.com-inf-20240623-151130-3mwjj-00039.warc.os.cdx.gz	220817	download
www.fintechnexus.com-inf-20240623-151130-3mwjj-00040.warc.gz	5381345586	download job
www.fintechnexus.com-inf-20240623-151130-3mwjj-00040.warc.os.cdx.gz	127679	download
www.ghazizadehhashemi.com-inf-20240627-120639-c9ir8-00000.warc.gz	5591358	download job
www.ghazizadehhashemi.com-inf-20240627-120639-c9ir8-00000.warc.os.cdx.gz	8950	download
www.ghazizadehhashemi.com-inf-20240627-120639-c9ir8-meta.warc.gz	8250	download job
www.ghazizadehhashemi.com-inf-20240627-120639-c9ir8-meta.warc.os.cdx.gz	47	download
www.ghazizadehhashemi.com-inf-20240627-120639-c9ir8.json	253	download job
www.influencewatch.org-inf-20240622-121334-d1i3p-00051.warc.gz	5403172471	download job
www.influencewatch.org-inf-20240622-121334-d1i3p-00051.warc.os.cdx.gz	1557995	download
www.mixesdb.com-inf-20240603-014940-tfwdm-00298.warc.gz	5370407345	download job
www.mixesdb.com-inf-20240603-014940-tfwdm-00298.warc.os.cdx.gz	2034441	download
www.out.com-inf-20240501-010715-bn7nn-00186.warc.gz	5368712517	download job
www.out.com-inf-20240501-010715-bn7nn-00186.warc.os.cdx.gz	1651070	download
www.parliament.go.ke-inf-20240626-093233-7o8jc-00007.warc.gz	5407626342	download job
www.parliament.go.ke-inf-20240626-093233-7o8jc-00007.warc.os.cdx.gz	2937625	download
www.popculture.com-inf-20240627-114305-3r728-00000.warc.gz	13748	download job
www.popculture.com-inf-20240627-114305-3r728-00000.warc.os.cdx.gz	300	download
www.popculture.com-inf-20240627-114305-3r728-meta.warc.gz	3500	download job
www.popculture.com-inf-20240627-114305-3r728-meta.warc.os.cdx.gz	47	download
www.popculture.com-inf-20240627-114305-3r728.json	246	download job
www.portadosfundos.com.br-inf-20240627-113509-8bgai-00000.warc.gz	9730551	download job
www.portadosfundos.com.br-inf-20240627-113509-8bgai-00000.warc.os.cdx.gz	15126	download
www.portadosfundos.com.br-inf-20240627-113509-8bgai-meta.warc.gz	12424	download job
www.portadosfundos.com.br-inf-20240627-113509-8bgai-meta.warc.os.cdx.gz	47	download
www.portadosfundos.com.br-inf-20240627-113509-8bgai.json	253	download job
www.remontees-mecaniques.net-inf-20240611-203137-ckt89-00073.warc.gz	5368757275	download job
www.remontees-mecaniques.net-inf-20240611-203137-ckt89-00073.warc.os.cdx.gz	4412063	download
www.technet.org-inf-20240627-013336-by4z9-00004.warc.gz	5368928179	download job
www.technet.org-inf-20240627-013336-by4z9-00004.warc.os.cdx.gz	1717269	download
www.vh1.com-inf-20240627-112817-7wk2w-00000.warc.gz	8780683	download job
www.vh1.com-inf-20240627-112817-7wk2w-00000.warc.os.cdx.gz	16784	download
www.vh1.com-inf-20240627-112817-7wk2w-meta.warc.gz	13190	download job
www.vh1.com-inf-20240627-112817-7wk2w-meta.warc.os.cdx.gz	47	download
www.vh1.com-inf-20240627-112817-7wk2w.json	239	download job