Item archiveteam_archivebot_go_20250309131931_af8bd014

Filename	Size
apnews.com-shallow-20250309-125514-4wy3t-00000.warc.gz	24714282	download job
apnews.com-shallow-20250309-125514-4wy3t-00000.warc.os.cdx.gz	39926	download
apnews.com-shallow-20250309-125514-4wy3t-meta.warc.gz	28737	download job
apnews.com-shallow-20250309-125514-4wy3t-meta.warc.os.cdx.gz	47	download
apnews.com-shallow-20250309-125514-4wy3t.json	330	download job
archiveteam_archivebot_go_20250309131931_af8bd014.cdx.gz	10838327	download
archiveteam_archivebot_go_20250309131931_af8bd014.cdx.idx	10728	download
archiveteam_archivebot_go_20250309131931_af8bd014_files.xml	0	download
archiveteam_archivebot_go_20250309131931_af8bd014_meta.sqlite	135168	download
archiveteam_archivebot_go_20250309131931_af8bd014_meta.xml	1047	download
capitaloneshopping.com-inf-20250304-003548-7m5km-00001.warc.gz	5368717232	download job
capitaloneshopping.com-inf-20250304-003548-7m5km-00001.warc.os.cdx.gz	5432230	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-02010.warc.gz	10553602945	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-02010.warc.os.cdx.gz	410	download
fivethirtyeight.com-inf-20250305-184545-9gfm9-00052.warc.gz	5369035097	download job
fivethirtyeight.com-inf-20250305-184545-9gfm9-00052.warc.os.cdx.gz	693183	download
fragdenstaat.de-inf-20250215-082121-boxqa-00272.warc.gz	5368712963	download job
fragdenstaat.de-inf-20250215-082121-boxqa-00272.warc.os.cdx.gz	1622198	download
ftp.ncbi.nlm.nih.gov-inf-20250201-210445-16xse-01552.warc.gz	8090784027	download job
ftp.ncbi.nlm.nih.gov-inf-20250201-210445-16xse-01552.warc.os.cdx.gz	487	download
ftp.txdot.gov-inf-20250308-042113-1y2x8-00049.warc.gz	5370150132	download job
ftp.txdot.gov-inf-20250308-042113-1y2x8-00049.warc.os.cdx.gz	113042	download
gaftp.epa.gov-inf-20250202-142657-6l7f5-00686.warc.gz	5631346454	download job
gaftp.epa.gov-inf-20250202-142657-6l7f5-00686.warc.os.cdx.gz	843	download
gaftp.epa.gov-inf-20250202-142657-6l7f5-00687.warc.gz	5507963616	download job
gaftp.epa.gov-inf-20250202-142657-6l7f5-00687.warc.os.cdx.gz	783	download
gendermenace.net-inf-20250308-230312-28382-00019.warc.gz	5450942104	download job
gendermenace.net-inf-20250308-230312-28382-00019.warc.os.cdx.gz	1885065	download
nrch.de-inf-20250309-131542-4ohlv-00000.warc.gz	27699014	download job
nrch.de-inf-20250309-131542-4ohlv-00000.warc.os.cdx.gz	18164	download
nrch.de-inf-20250309-131542-4ohlv-meta.warc.gz	13397	download job
nrch.de-inf-20250309-131542-4ohlv-meta.warc.os.cdx.gz	47	download
nrch.de-inf-20250309-131542-4ohlv.json	234	download job
queermoneypodcast.com-inf-20250309-054730-9jqm6-00002.warc.gz	5379809820	download job
queermoneypodcast.com-inf-20250309-054730-9jqm6-00002.warc.os.cdx.gz	47189	download
seb.omao.noaa.gov-inf-20250228-042858-3xzji-00269.warc.gz	5369212791	download job
seb.omao.noaa.gov-inf-20250228-042858-3xzji-00269.warc.os.cdx.gz	69251	download
tickets.netzwerkrecherche.org-inf-20250309-125006-esl2g-00000.warc.gz	836827230	download job
tickets.netzwerkrecherche.org-inf-20250309-125006-esl2g-00000.warc.os.cdx.gz	607486	download
tickets.netzwerkrecherche.org-inf-20250309-125006-esl2g-meta.warc.gz	362057	download job
tickets.netzwerkrecherche.org-inf-20250309-125006-esl2g-meta.warc.os.cdx.gz	47	download
tickets.netzwerkrecherche.org-inf-20250309-125006-esl2g.json	257	download job
urls-transfer.archivete.am-2025-03-09_misc-urls.txt-shallow-20250309-130156-85723-00000.warc.gz	144471541	download job
urls-transfer.archivete.am-2025-03-09_misc-urls.txt-shallow-20250309-130156-85723-00000.warc.os.cdx.gz	144551	download
urls-transfer.archivete.am-2025-03-09_misc-urls.txt-shallow-20250309-130156-85723-meta.warc.gz	91833	download job
urls-transfer.archivete.am-2025-03-09_misc-urls.txt-shallow-20250309-130156-85723-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-2025-03-09_misc-urls.txt-shallow-20250309-130156-85723-urls.txt	4705	download
urls-transfer.archivete.am-2025-03-09_misc-urls.txt-shallow-20250309-130156-85723.json	341	download job
urls-transfer.archivete.am-timothyplan.com_seed_urls.txt-inf-20250309-062419-coadp-meta.warc.gz	3185131	download job
urls-transfer.archivete.am-timothyplan.com_seed_urls.txt-inf-20250309-062419-coadp-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-timothyplan.com_seed_urls.txt-inf-20250309-062419-coadp-urls.txt	1130	download
urls-transfer.archivete.am-timothyplan.com_seed_urls.txt-inf-20250309-062419-coadp.json	350	download job
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-03568.warc.gz	5414214020	download job
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-03568.warc.os.cdx.gz	11795	download
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-03569.warc.gz	5530659471	download job
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-03569.warc.os.cdx.gz	6168	download
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-03570.warc.gz	7345168453	download job
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-03570.warc.os.cdx.gz	615	download
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-03571.warc.gz	6169053645	download job
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-03571.warc.os.cdx.gz	1479	download
urls-transfer.archivete.am-www.electronicsandbooks.com.txt-inf-20250103-223214-boqpe-01197.warc.gz	5690425139	download job
urls-transfer.archivete.am-www.electronicsandbooks.com.txt-inf-20250103-223214-boqpe-01197.warc.os.cdx.gz	215560	download
urls-transfer.archivete.am-www.radio4all.net-page=1-to-3069.txt-inf-20250223-071644-8yw55-01446.warc.gz	5410067704	download
urls-transfer.archivete.am-www.radio4all.net-page=1-to-3069.txt-inf-20250223-071644-8yw55-01446.warc.os.cdx.gz	23577	download
www.archives.gov-inf-20250210-154743-95vlc-00732.warc.gz	5373042894	download job
www.archives.gov-inf-20250210-154743-95vlc-00732.warc.os.cdx.gz	51130	download
www.landesverrat.org-inf-20250309-131737-6obo9-00000.warc.gz	30810	download job
www.landesverrat.org-inf-20250309-131737-6obo9-00000.warc.os.cdx.gz	448	download
www.landesverrat.org-inf-20250309-131737-6obo9-meta.warc.gz	3585	download job
www.landesverrat.org-inf-20250309-131737-6obo9-meta.warc.os.cdx.gz	47	download
www.landesverrat.org-inf-20250309-131737-6obo9.json	248	download job
www.neuemedienmacher.de-inf-20250309-131436-7mtfm-00000.warc.gz	438494	download job
www.neuemedienmacher.de-inf-20250309-131436-7mtfm-00000.warc.os.cdx.gz	2259	download
www.neuemedienmacher.de-inf-20250309-131436-7mtfm-meta.warc.gz	4950	download job
www.neuemedienmacher.de-inf-20250309-131436-7mtfm-meta.warc.os.cdx.gz	47	download
www.neuemedienmacher.de-inf-20250309-131436-7mtfm.json	251	download job
www.nordenham.de-inf-20250309-131455-4zqfv-00000.warc.gz	5250286	download job
www.nordenham.de-inf-20250309-131455-4zqfv-00000.warc.os.cdx.gz	12840	download
www.nordenham.de-inf-20250309-131455-4zqfv-meta.warc.gz	11365	download job
www.nordenham.de-inf-20250309-131455-4zqfv-meta.warc.os.cdx.gz	47	download
www.nordenham.de-inf-20250309-131455-4zqfv.json	279	download job
www.nrch.de-inf-20250309-131640-dvi1v-00000.warc.gz	27702023	download job
www.nrch.de-inf-20250309-131640-dvi1v-00000.warc.os.cdx.gz	18218	download
www.nrch.de-inf-20250309-131640-dvi1v-meta.warc.gz	13394	download job
www.nrch.de-inf-20250309-131640-dvi1v-meta.warc.os.cdx.gz	47	download
www.nrch.de-inf-20250309-131640-dvi1v.json	238	download job
www.spaceforce.mil-inf-20250126-104111-c3t8z-03406.warc.gz	5375013731	download job
www.spaceforce.mil-inf-20250126-104111-c3t8z-03406.warc.os.cdx.gz	25227	download
www.spaceforce.mil-inf-20250126-104111-c3t8z-03407.warc.gz	5510265162	download job
www.spaceforce.mil-inf-20250126-104111-c3t8z-03407.warc.os.cdx.gz	10101	download
xn--heckengu-6za.bund.net-inf-20250309-121918-8ij17-00000.warc.gz	744758242	download job
xn--heckengu-6za.bund.net-inf-20250309-121918-8ij17-00000.warc.os.cdx.gz	52646	download
xn--heckengu-6za.bund.net-inf-20250309-121918-8ij17-meta.warc.gz	33975	download job
xn--heckengu-6za.bund.net-inf-20250309-121918-8ij17-meta.warc.os.cdx.gz	47	download
xn--heckengu-6za.bund.net-inf-20250309-121918-8ij17.json	253	download job