Item archiveteam_archivebot_go_20251205150906_a3d00b2c

Filename	Size
archive.openwrt.org-inf-20250407-125139-cshzx-02130.warc.gz	5368714000	download job
archive.openwrt.org-inf-20250407-125139-cshzx-02130.warc.os.cdx.gz	3745095	download
archiveteam_archivebot_go_20251205150906_a3d00b2c.cdx.gz	49255028	download
archiveteam_archivebot_go_20251205150906_a3d00b2c.cdx.idx	58567	download
archiveteam_archivebot_go_20251205150906_a3d00b2c_files.xml	0	download
archiveteam_archivebot_go_20251205150906_a3d00b2c_meta.sqlite	73728	download
archiveteam_archivebot_go_20251205150906_a3d00b2c_meta.xml	1047	download
archivio.smartworld.it-inf-20251130-173928-3i776-00067.warc.gz	5407880809	download job
archivio.smartworld.it-inf-20251130-173928-3i776-00067.warc.os.cdx.gz	1460500	download
das.sdss.org-inf-20250226-051304-5s39o-05688.warc.gz	5373274960	download job
das.sdss.org-inf-20250226-051304-5s39o-05688.warc.os.cdx.gz	2423575	download
discourse.julialang.org-inf-20251130-122256-9k122-00014.warc.gz	5406668552	download job
discourse.julialang.org-inf-20251130-122256-9k122-00014.warc.os.cdx.gz	7511366	download
ftp.lip6.fr-inf-20251122-125607-7netw-00241.warc.gz	5445408380	download job
ftp.lip6.fr-inf-20251122-125607-7netw-00241.warc.os.cdx.gz	2839	download
ksiu.edu.eg-inf-20251205-100801-4xshm-00000.warc.gz	5368835540	download job
ksiu.edu.eg-inf-20251205-100801-4xshm-00000.warc.os.cdx.gz	2515904	download
lemmy.zip-inf-20250312-165238-aa83x-01425.warc.gz	5392576771	download job
lemmy.zip-inf-20250312-165238-aa83x-01425.warc.os.cdx.gz	1467830	download
podscripts.co-inf-20251113-073545-34lac-00447.warc.gz	5403507489	download job
podscripts.co-inf-20251113-073545-34lac-00447.warc.os.cdx.gz	40396	download
pr.ai-inf-20251128-055444-cfxv0-00067.warc.gz	5369081838	download job
pr.ai-inf-20251128-055444-cfxv0-00067.warc.os.cdx.gz	963012	download
staging.ustaflorida.com-inf-20251204-200500-5xr87-00004.warc.gz	5374802993	download job
staging.ustaflorida.com-inf-20251204-200500-5xr87-00004.warc.os.cdx.gz	216525	download
staging.ustaflorida.com-inf-20251204-200500-5xr87-00005.warc.gz	5461184007	download job
staging.ustaflorida.com-inf-20251204-200500-5xr87-00005.warc.os.cdx.gz	24050	download
urls-transfer.archivete.am-crucial.com_crucial.es_crucial.in_crucial.mx_crucial.fr_crucial.jp_crucial.kr_crucial.cn_crucial.tw_crucial.de_subdomains.txt-inf-20251203-192225-8n8tg-00007.warc.gz	5370821538	download job
urls-transfer.archivete.am-crucial.com_crucial.es_crucial.in_crucial.mx_crucial.fr_crucial.jp_crucial.kr_crucial.cn_crucial.tw_crucial.de_subdomains.txt-inf-20251203-192225-8n8tg-00007.warc.os.cdx.gz	5051439	download
urls-transfer.archivete.am-iranprimer.usip.org_iranprimer.com_seed_urls.txt-inf-20251204-194530-pxh2k-00019.warc.gz	5618756395	download job
urls-transfer.archivete.am-iranprimer.usip.org_iranprimer.com_seed_urls.txt-inf-20251204-194530-pxh2k-00019.warc.os.cdx.gz	399903	download
urls-transfer.archivete.am-jrfseychelles.com_seed_urls.txt-inf-20251009-052955-3pmmr-00003.warc.gz	4266704866	download job
urls-transfer.archivete.am-jrfseychelles.com_seed_urls.txt-inf-20251009-052955-3pmmr-00003.warc.os.cdx.gz	19214497	download
urls-transfer.archivete.am-jrfseychelles.com_seed_urls.txt-inf-20251009-052955-3pmmr-meta.warc.gz	57867090	download job
urls-transfer.archivete.am-jrfseychelles.com_seed_urls.txt-inf-20251009-052955-3pmmr-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-jrfseychelles.com_seed_urls.txt-inf-20251009-052955-3pmmr-urls.txt	121	download
urls-transfer.archivete.am-jrfseychelles.com_seed_urls.txt-inf-20251009-052955-3pmmr.json	354	download job
urls-transfer.archivete.am-www.canonrumors.com_429-or-ignored-flickr-urls.txt-shallow-20251204-005153-3b1j3-00015.warc.gz	5372037410	download job
urls-transfer.archivete.am-www.canonrumors.com_429-or-ignored-flickr-urls.txt-shallow-20251204-005153-3b1j3-00015.warc.os.cdx.gz	798482	download
urls-transfer.archivete.am-www.cgtn.com_ignored-media-file-urls.txt-shallow-20251203-222153-br724-00144.warc.gz	6283967839	download job
urls-transfer.archivete.am-www.cgtn.com_ignored-media-file-urls.txt-shallow-20251203-222153-br724-00144.warc.os.cdx.gz	820	download
us-government.tumblr.com-inf-20251015-044630-ezzcy-01366.warc.gz	5373258716	download job
us-government.tumblr.com-inf-20251015-044630-ezzcy-01366.warc.os.cdx.gz	1237174	download
www.friatider.se-inf-20251205-101107-f0stx-00001.warc.gz	5369029753	download job
www.friatider.se-inf-20251205-101107-f0stx-00001.warc.os.cdx.gz	825972	download
www.kramatorsk.info-inf-20251101-203053-eb1w1-00101.warc.gz	5369223666	download job
www.kramatorsk.info-inf-20251101-203053-eb1w1-00101.warc.os.cdx.gz	305612	download
www.ou.edu-inf-20251202-191333-f3u2q-00037.warc.gz	5529626513	download job
www.ou.edu-inf-20251202-191333-f3u2q-00037.warc.os.cdx.gz	1151862	download
www.sgs.com-inf-20251121-210808-an9tf-00298.warc.gz	5370011403	download job
www.sgs.com-inf-20251121-210808-an9tf-00298.warc.os.cdx.gz	538207	download
www.thearmorylife.com-inf-20251130-224452-5otj1-00063.warc.gz	5385557051	download job
www.thearmorylife.com-inf-20251130-224452-5otj1-00063.warc.os.cdx.gz	554015	download