Item archiveteam_archivebot_go_20240618075955_8df43b70

Filename	Size
8020.digital-inf-20240618-062403-56qkv-00000.warc.gz	857747037	download job
8020.digital-inf-20240618-062403-56qkv-00000.warc.os.cdx.gz	686406	download
8020.digital-inf-20240618-062403-56qkv-meta.warc.gz	419708	download job
8020.digital-inf-20240618-062403-56qkv-meta.warc.os.cdx.gz	47	download
8020.digital-inf-20240618-062403-56qkv.json	243	download job
archives.anonradio.net-inf-20240617-012336-4e9zc-00025.warc.gz	5396165907	download job
archives.anonradio.net-inf-20240617-012336-4e9zc-00025.warc.os.cdx.gz	4425	download
archiveteam_archivebot_go_20240618075955_8df43b70.cdx.gz	5096214	download
archiveteam_archivebot_go_20240618075955_8df43b70.cdx.idx	7509	download
archiveteam_archivebot_go_20240618075955_8df43b70_files.xml	0	download
archiveteam_archivebot_go_20240618075955_8df43b70_meta.sqlite	147456	download
archiveteam_archivebot_go_20240618075955_8df43b70_meta.xml	1047	download
cdn-origin.sonnenklar.tv-inf-20240605-081947-7kho2-00067.warc.gz	5368794712	download job
cdn-origin.sonnenklar.tv-inf-20240605-081947-7kho2-00067.warc.os.cdx.gz	4705004	download
data.worldpop.org-inf-20240515-011446-esx2x-01168.warc.gz	8207801651	download job
data.worldpop.org-inf-20240515-011446-esx2x-01168.warc.os.cdx.gz	342	download
difflam.com.au-inf-20240618-054611-b538a-00000.warc.gz	359137568	download job
difflam.com.au-inf-20240618-054611-b538a-00000.warc.os.cdx.gz	466829	download
difflam.com.au-inf-20240618-054611-b538a-meta.warc.gz	319357	download job
difflam.com.au-inf-20240618-054611-b538a-meta.warc.os.cdx.gz	47	download
difflam.com.au-inf-20240618-054611-b538a.json	245	download job
familienkunde-oldenburg.de-inf-20240618-071923-a3lgt-00000.warc.gz	33312806	download job
familienkunde-oldenburg.de-inf-20240618-071923-a3lgt-00000.warc.os.cdx.gz	14312	download
familienkunde-oldenburg.de-inf-20240618-071923-a3lgt-meta.warc.gz	11975	download job
familienkunde-oldenburg.de-inf-20240618-071923-a3lgt-meta.warc.os.cdx.gz	47	download
familienkunde-oldenburg.de-inf-20240618-071923-a3lgt.json	254	download job
fraenkischer-bund.de-inf-20240618-074106-bzq1u-00000.warc.gz	170586344	download job
fraenkischer-bund.de-inf-20240618-074106-bzq1u-00000.warc.os.cdx.gz	24679	download
fraenkischer-bund.de-inf-20240618-074106-bzq1u-meta.warc.gz	17171	download job
fraenkischer-bund.de-inf-20240618-074106-bzq1u-meta.warc.os.cdx.gz	47	download
fraenkischer-bund.de-inf-20240618-074106-bzq1u.json	248	download job
journalistenwatch.com-inf-20240616-081904-1wwa2-00043.warc.gz	6039151750	download job
journalistenwatch.com-inf-20240616-081904-1wwa2-00043.warc.os.cdx.gz	1073069	download
learn.microsoft.com-inf-20240606-084119-1y7vh-00095.warc.gz	5368821532	download job
learn.microsoft.com-inf-20240606-084119-1y7vh-00095.warc.os.cdx.gz	4896680	download
mail.sdgfacilities.nl-inf-20240618-073108-bagnn-00000.warc.gz	6437	download job
mail.sdgfacilities.nl-inf-20240618-073108-bagnn-00000.warc.os.cdx.gz	308	download
mail.sdgfacilities.nl-inf-20240618-073108-bagnn-meta.warc.gz	3549	download job
mail.sdgfacilities.nl-inf-20240618-073108-bagnn-meta.warc.os.cdx.gz	47	download
mail.sdgfacilities.nl-inf-20240618-073108-bagnn.json	249	download job
moviesanywhere.com-inf-20240618-004400-crt0q-00002.warc.gz	5368819163	download job
moviesanywhere.com-inf-20240618-004400-crt0q-00002.warc.os.cdx.gz	1723611	download
nsarchive.gwu.edu-inf-20240612-195949-330mb-00079.warc.gz	5374582715	download job
nsarchive.gwu.edu-inf-20240612-195949-330mb-00079.warc.os.cdx.gz	1699971	download
transfer.archivete.am-shallow-20240618-072930-2qfwb-00000.warc.gz	4017	download job
transfer.archivete.am-shallow-20240618-072930-2qfwb-00000.warc.os.cdx.gz	257	download
transfer.archivete.am-shallow-20240618-072930-2qfwb-meta.warc.gz	3493	download job
transfer.archivete.am-shallow-20240618-072930-2qfwb-meta.warc.os.cdx.gz	47	download
transfer.archivete.am-shallow-20240618-072930-2qfwb.json	294	download job
transfer.archivete.am-shallow-20240618-072935-8c3fg-00000.warc.gz	4154	download job
transfer.archivete.am-shallow-20240618-072935-8c3fg-00000.warc.os.cdx.gz	257	download
transfer.archivete.am-shallow-20240618-072935-8c3fg-meta.warc.gz	3500	download job
transfer.archivete.am-shallow-20240618-072935-8c3fg-meta.warc.os.cdx.gz	47	download
transfer.archivete.am-shallow-20240618-072935-8c3fg.json	293	download job
urls-transfer.archivete.am-bankruptcies-NL-2024-jun18-ref.txt-shallow-20240618-073031-8c3fg-00000.warc.gz	3901934	download job
urls-transfer.archivete.am-bankruptcies-NL-2024-jun18-ref.txt-shallow-20240618-073031-8c3fg-00000.warc.os.cdx.gz	9823	download
urls-transfer.archivete.am-bankruptcies-NL-2024-jun18-ref.txt-shallow-20240618-073031-8c3fg-meta.warc.gz	9218	download job
urls-transfer.archivete.am-bankruptcies-NL-2024-jun18-ref.txt-shallow-20240618-073031-8c3fg-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-bankruptcies-NL-2024-jun18-ref.txt-shallow-20240618-073031-8c3fg-urls.txt	268	download
urls-transfer.archivete.am-bankruptcies-NL-2024-jun18-ref.txt-shallow-20240618-073031-8c3fg.json	361	download job
urls-transfer.archivete.am-btc-gcdn.byjus.com_urls_urls_part_26.txt-shallow-20240618-031351-ee5wg-00003.warc.gz	5368764566	download job
urls-transfer.archivete.am-btc-gcdn.byjus.com_urls_urls_part_26.txt-shallow-20240618-031351-ee5wg-00003.warc.os.cdx.gz	5219219	download
urls-transfer.archivete.am-nam-geofund.archival-services.gov.ge_geofond_geofond_item_detailed_part_32.txt-shallow-20240618-024757-c5ur8-00003.warc.gz	5368927240	download job
urls-transfer.archivete.am-nam-geofund.archival-services.gov.ge_geofond_geofond_item_detailed_part_32.txt-shallow-20240618-024757-c5ur8-00003.warc.os.cdx.gz	381975	download
warwickhughes.com-inf-20240618-074503-a2wex-00000.warc.gz	51964	download job
warwickhughes.com-inf-20240618-074503-a2wex-00000.warc.os.cdx.gz	472	download
warwickhughes.com-inf-20240618-074503-a2wex-meta.warc.gz	3612	download job
warwickhughes.com-inf-20240618-074503-a2wex-meta.warc.os.cdx.gz	47	download
warwickhughes.com-inf-20240618-074503-a2wex.json	245	download job
www.atomseek.com-inf-20240203-212558-8gi8p-00464.warc.gz	5376330656	download job
www.atomseek.com-inf-20240203-212558-8gi8p-00464.warc.os.cdx.gz	953928	download
www.caritas.org.au-inf-20240618-045843-a2o87-00000.warc.gz	5370074513	download job
www.caritas.org.au-inf-20240618-045843-a2o87-00000.warc.os.cdx.gz	1226529	download
www.cfact.org-inf-20240616-202153-com4x-00031.warc.gz	5380485164	download job
www.cfact.org-inf-20240616-202153-com4x-00031.warc.os.cdx.gz	378450	download
www.cfact.org-inf-20240616-202153-com4x-00032.warc.gz	5369675962	download job
www.cfact.org-inf-20240616-202153-com4x-00032.warc.os.cdx.gz	854265	download
www.frontiersin.org-inf-20240117-203250-6tu94-00847.warc.gz	5369141988	download job
www.frontiersin.org-inf-20240117-203250-6tu94-00847.warc.os.cdx.gz	3713752	download
www.grabcraft.com-inf-20240618-013839-v2mgs-00000.warc.gz	5369946651	download job
www.grabcraft.com-inf-20240618-013839-v2mgs-00000.warc.os.cdx.gz	2885417	download
www.jfklibrary.org-inf-20240615-181647-enwum-00038.warc.gz	5368718653	download job
www.jfklibrary.org-inf-20240615-181647-enwum-00038.warc.os.cdx.gz	8072932	download
www.mixesdb.com-inf-20240603-014940-tfwdm-00104.warc.gz	5376584348	download job
www.mixesdb.com-inf-20240603-014940-tfwdm-00104.warc.os.cdx.gz	947962	download
www.nonbinary.ch-inf-20240618-010832-dishz-00007.warc.gz	5368724353	download job
www.nonbinary.ch-inf-20240618-010832-dishz-00007.warc.os.cdx.gz	2077860	download
www.rclutz.com-inf-20240618-072113-dm2zb-00000.warc.gz	27861460	download job
www.rclutz.com-inf-20240618-072113-dm2zb-00000.warc.os.cdx.gz	22570	download
www.rclutz.com-inf-20240618-072113-dm2zb-meta.warc.gz	18407	download job
www.rclutz.com-inf-20240618-072113-dm2zb-meta.warc.os.cdx.gz	47	download
www.rclutz.com-inf-20240618-072113-dm2zb-wpull.log.gz	15742	download
www.rclutz.com-inf-20240618-072113-dm2zb.json	242	download job
www.sdgfacilities.nl-inf-20240618-073056-6rmd1-00000.warc.gz	14761332	download job
www.sdgfacilities.nl-inf-20240618-073056-6rmd1-00000.warc.os.cdx.gz	7380	download
www.sdgfacilities.nl-inf-20240618-073056-6rmd1-meta.warc.gz	8133	download job
www.sdgfacilities.nl-inf-20240618-073056-6rmd1-meta.warc.os.cdx.gz	47	download
www.sdgfacilities.nl-inf-20240618-073056-6rmd1.json	248	download job
www.sheetmusicplus.com-inf-20240512-212156-pg1ia-00609.warc.gz	5368842934	download job
www.sheetmusicplus.com-inf-20240512-212156-pg1ia-00609.warc.os.cdx.gz	1050811	download
www.woofcreative.com.au-inf-20240618-060350-uom48-00000.warc.gz	757003474	download job
www.woofcreative.com.au-inf-20240618-060350-uom48-00000.warc.os.cdx.gz	991049	download
www.woofcreative.com.au-inf-20240618-060350-uom48-meta.warc.gz	1009201	download job
www.woofcreative.com.au-inf-20240618-060350-uom48-meta.warc.os.cdx.gz	47	download
www.woofcreative.com.au-inf-20240618-060350-uom48.json	254	download job