Item archiveteam_archivebot_go_20251204004132_9ba1b758

Filename	Size
africa.com-inf-20251201-122258-1mczg-00013.warc.gz	5375628125	download job
africa.com-inf-20251201-122258-1mczg-00013.warc.os.cdx.gz	770038	download
archiveteam_archivebot_go_20251204004132_9ba1b758.cdx.gz	40913882	download
archiveteam_archivebot_go_20251204004132_9ba1b758.cdx.idx	50751	download
archiveteam_archivebot_go_20251204004132_9ba1b758_files.xml	0	download
archiveteam_archivebot_go_20251204004132_9ba1b758_meta.sqlite	28672	download
archiveteam_archivebot_go_20251204004132_9ba1b758_meta.xml	914	download
archivio.smartworld.it-inf-20251130-173928-3i776-00049.warc.gz	5369311089	download job
archivio.smartworld.it-inf-20251130-173928-3i776-00049.warc.os.cdx.gz	1645367	download
das.sdss.org-inf-20250226-051304-5s39o-05668.warc.gz	5370340177	download job
das.sdss.org-inf-20250226-051304-5s39o-05668.warc.os.cdx.gz	307133	download
discourse.julialang.org-inf-20251130-122256-9k122-00010.warc.gz	5368843755	download job
discourse.julialang.org-inf-20251130-122256-9k122-00010.warc.os.cdx.gz	3471776	download
forum.dcs.world-inf-20251203-160445-xy9ap-00002.warc.gz	5369339565	download job
forum.dcs.world-inf-20251203-160445-xy9ap-00002.warc.os.cdx.gz	2236113	download
ftp.lip6.fr-inf-20251122-125607-7netw-00199.warc.gz	5439071741	download job
ftp.lip6.fr-inf-20251122-125607-7netw-00199.warc.os.cdx.gz	15598	download
globalnews.ca-inf-20250821-223546-ejnq1-01837.warc.gz	5395626923	download job
globalnews.ca-inf-20250821-223546-ejnq1-01837.warc.os.cdx.gz	978715	download
media.taiwan.net.tw-inf-20251115-194915-452nk-00036.warc.gz	5374463714	download job
media.taiwan.net.tw-inf-20251115-194915-452nk-00036.warc.os.cdx.gz	929259	download
meetings.portseattle.org-inf-20251203-175450-e5a9p-00041.warc.gz	6041433539	download job
meetings.portseattle.org-inf-20251203-175450-e5a9p-00041.warc.os.cdx.gz	660	download
meetings.portseattle.org-inf-20251203-175450-e5a9p-00042.warc.gz	5729594497	download job
meetings.portseattle.org-inf-20251203-175450-e5a9p-00042.warc.os.cdx.gz	665	download
pr.ai-inf-20251128-055444-cfxv0-00045.warc.gz	5376125256	download job
pr.ai-inf-20251128-055444-cfxv0-00045.warc.os.cdx.gz	1196117	download
salisbury.md-inf-20251202-191558-4u5yy-00003.warc.gz	4453465206	download job
salisbury.md-inf-20251202-191558-4u5yy-00003.warc.os.cdx.gz	12851032	download
sourcegraph.com-inf-20251203-073217-ao2zq-00002.warc.gz	5380735318	download job
sourcegraph.com-inf-20251203-073217-ao2zq-00002.warc.os.cdx.gz	2562937	download
urls-transfer.archivete.am-github.com_Jigsy1.txt-shallow-20251204-002813-ejjlq-00000.warc.gz	33223663	download job
urls-transfer.archivete.am-github.com_Jigsy1.txt-shallow-20251204-002813-ejjlq-00000.warc.os.cdx.gz	26633	download
urls-transfer.archivete.am-github.com_Jigsy1.txt-shallow-20251204-002813-ejjlq-meta.warc.gz	22990	download job
urls-transfer.archivete.am-github.com_Jigsy1.txt-shallow-20251204-002813-ejjlq-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-github.com_Jigsy1.txt-shallow-20251204-002813-ejjlq-urls.txt	614	download
urls-transfer.archivete.am-github.com_Jigsy1.txt-shallow-20251204-002813-ejjlq.json	332	download job
urls-transfer.archivete.am-mezha.net_seed_urls.txt-inf-20250910-204010-9l50l-00436.warc.gz	7498580668	download job
urls-transfer.archivete.am-mezha.net_seed_urls.txt-inf-20250910-204010-9l50l-00436.warc.os.cdx.gz	735558	download
urls-transfer.archivete.am-www.cgtn.com_ignored-media-file-urls.txt-shallow-20251203-222153-br724-00006.warc.gz	6314194859	download job
urls-transfer.archivete.am-www.cgtn.com_ignored-media-file-urls.txt-shallow-20251203-222153-br724-00006.warc.os.cdx.gz	829	download
urls-transfer.archivete.am-www.cgtn.com_ignored-media-file-urls.txt-shallow-20251203-222153-br724-00007.warc.gz	5938821230	download job
urls-transfer.archivete.am-www.cgtn.com_ignored-media-file-urls.txt-shallow-20251203-222153-br724-00007.warc.os.cdx.gz	933	download
urls-transfer.archivete.am-www.webtoons.com_m.webtoons.com_seed_urls.txt-inf-20251101-194235-eqo6o-00299.warc.gz	5368928499	download job
urls-transfer.archivete.am-www.webtoons.com_m.webtoons.com_seed_urls.txt-inf-20251101-194235-eqo6o-00299.warc.os.cdx.gz	2243850	download
us-government.tumblr.com-inf-20251015-044630-ezzcy-01322.warc.gz	5377592696	download job
us-government.tumblr.com-inf-20251015-044630-ezzcy-01322.warc.os.cdx.gz	1049792	download
www.dvd3000.ca-inf-20251203-215215-cb1sm-00008.warc.gz	5802101451	download job
www.dvd3000.ca-inf-20251203-215215-cb1sm-00008.warc.os.cdx.gz	336234	download
www.sgs.com-inf-20251121-210808-an9tf-00259.warc.gz	5373316346	download job
www.sgs.com-inf-20251121-210808-an9tf-00259.warc.os.cdx.gz	519504	download
www.spacesafetymagazine.com-inf-20251203-172442-cym36-00002.warc.gz	5507522285	download job
www.spacesafetymagazine.com-inf-20251203-172442-cym36-00002.warc.os.cdx.gz	574184	download
www2.adult-fanfiction.org-inf-20251130-040007-bsj1a-00005.warc.gz	2467309934	download job
www2.adult-fanfiction.org-inf-20251130-040007-bsj1a-00005.warc.os.cdx.gz	9739605	download
www2.adult-fanfiction.org-inf-20251130-040007-bsj1a-meta.warc.gz	50907011	download job
www2.adult-fanfiction.org-inf-20251130-040007-bsj1a-meta.warc.os.cdx.gz	47	download
www2.adult-fanfiction.org-inf-20251130-040007-bsj1a.json	255	download job