Item archiveteam_archivebot_go_20240505205102_7f9c6a21

Filename	Size
advancedbiofuelsusa.info-inf-20240428-014218-7ed8p-00048.warc.gz	5376830536	download job
advancedbiofuelsusa.info-inf-20240428-014218-7ed8p-00048.warc.os.cdx.gz	1153210	download
anti-spiegel.ru-inf-20240505-140211-a1zlh-00000.warc.gz	6205927348	download job
anti-spiegel.ru-inf-20240505-140211-a1zlh-00000.warc.os.cdx.gz	1655106	download
archiveteam_archivebot_go_20240505205102_7f9c6a21.cdx.gz	41473402	download
archiveteam_archivebot_go_20240505205102_7f9c6a21.cdx.idx	40926	download
archiveteam_archivebot_go_20240505205102_7f9c6a21_files.xml	0	download
archiveteam_archivebot_go_20240505205102_7f9c6a21_meta.sqlite	36864	download
archiveteam_archivebot_go_20240505205102_7f9c6a21_meta.xml	881	download
artofwar.ru-inf-20240503-193219-ddbzr-00011.warc.gz	5855996061	download job
artofwar.ru-inf-20240503-193219-ddbzr-00011.warc.os.cdx.gz	5250497	download
balloon-juice.com-inf-20240410-205032-ee5cy-00174.warc.gz	5433207380	download job
balloon-juice.com-inf-20240410-205032-ee5cy-00174.warc.os.cdx.gz	1041552	download
cdn.discordapp.com-shallow-20240505-203613-9l0r3-00000.warc.gz	291457	download job
cdn.discordapp.com-shallow-20240505-203613-9l0r3-00000.warc.os.cdx.gz	357	download
cdn.discordapp.com-shallow-20240505-203613-9l0r3-meta.warc.gz	3648	download job
cdn.discordapp.com-shallow-20240505-203613-9l0r3-meta.warc.os.cdx.gz	47	download
cdn.discordapp.com-shallow-20240505-203613-9l0r3.json	421	download job
conservativehome.com-inf-20240505-105105-2ge09-00002.warc.gz	5368910946	download job
conservativehome.com-inf-20240505-105105-2ge09-00002.warc.os.cdx.gz	11628409	download
developers.google.com-inf-20240505-195013-5l4fi-00000.warc.gz	826888294	download job
developers.google.com-inf-20240505-195013-5l4fi-00000.warc.os.cdx.gz	749985	download
developers.google.com-inf-20240505-195013-5l4fi-meta.warc.gz	437445	download job
developers.google.com-inf-20240505-195013-5l4fi-meta.warc.os.cdx.gz	47	download
developers.google.com-inf-20240505-195013-5l4fi.json	255	download job
gather2030.substack.com-inf-20240504-170450-3z6v6-00039.warc.gz	5991576027	download job
gather2030.substack.com-inf-20240504-170450-3z6v6-00039.warc.os.cdx.gz	823	download
greengruff.medmen.com-inf-20240505-200653-28bhd-00000.warc.gz	488070538	download job
greengruff.medmen.com-inf-20240505-200653-28bhd-00000.warc.os.cdx.gz	297372	download
greengruff.medmen.com-inf-20240505-200653-28bhd-meta.warc.gz	175055	download job
greengruff.medmen.com-inf-20240505-200653-28bhd-meta.warc.os.cdx.gz	47	download
greengruff.medmen.com-inf-20240505-200653-28bhd.json	251	download job
imslp.org-inf-20240102-181142-1to7k-00224.warc.gz	5370148865	download job
imslp.org-inf-20240102-181142-1to7k-00224.warc.os.cdx.gz	2766539	download
knightscholar.geneseo.edu-inf-20240505-150340-8m6tj-00025.warc.gz	7785901090	download job
knightscholar.geneseo.edu-inf-20240505-150340-8m6tj-00025.warc.os.cdx.gz	512	download
knightscholar.geneseo.edu-inf-20240505-150340-8m6tj-00026.warc.gz	6909003045	download job
knightscholar.geneseo.edu-inf-20240505-150340-8m6tj-00026.warc.os.cdx.gz	4064	download
knightscholar.geneseo.edu-inf-20240505-150340-8m6tj-00027.warc.gz	5604513208	download job
knightscholar.geneseo.edu-inf-20240505-150340-8m6tj-00027.warc.os.cdx.gz	1461	download
medmen.com-inf-20240505-200405-3yoy9-00000.warc.gz	137474167	download job
medmen.com-inf-20240505-200405-3yoy9-00000.warc.os.cdx.gz	242233	download
medmen.com-inf-20240505-200405-3yoy9-meta.warc.gz	153508	download job
medmen.com-inf-20240505-200405-3yoy9-meta.warc.os.cdx.gz	47	download
medmen.com-inf-20240505-200405-3yoy9.json	240	download job
oneislandtwonations.blogspot.com-inf-20240426-041817-81qs5-00118.warc.gz	5394987103	download job
oneislandtwonations.blogspot.com-inf-20240426-041817-81qs5-00118.warc.os.cdx.gz	7621194	download
share.aktheknight.co.uk-shallow-20240505-204816-1epoi-00000.warc.gz	27908	download job
share.aktheknight.co.uk-shallow-20240505-204816-1epoi-00000.warc.os.cdx.gz	255	download
share.aktheknight.co.uk-shallow-20240505-204816-1epoi-meta.warc.gz	3502	download job
share.aktheknight.co.uk-shallow-20240505-204816-1epoi-meta.warc.os.cdx.gz	47	download
share.aktheknight.co.uk-shallow-20240505-204816-1epoi.json	276	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-06954.warc.gz	5667839853	download job
storage.googleapis.com-inf-20240301-202801-5jgg7-06954.warc.os.cdx.gz	886	download
streetartcities.com-inf-20240505-093130-173qo-00036.warc.gz	5371928484	download job
streetartcities.com-inf-20240505-093130-173qo-00036.warc.os.cdx.gz	460060	download
streetartcities.com-inf-20240505-093130-173qo-00037.warc.gz	5371026063	download job
streetartcities.com-inf-20240505-093130-173qo-00037.warc.os.cdx.gz	373652	download
urls-transfer.archivete.am-naturalpoint.s3.amazonaws.com_urls_other_than_logs.txt-shallow-20240505-195827-8b6gw-00002.warc.gz	5881575784	download job
urls-transfer.archivete.am-naturalpoint.s3.amazonaws.com_urls_other_than_logs.txt-shallow-20240505-195827-8b6gw-00002.warc.os.cdx.gz	774	download
www.atari-forum.com-inf-20240504-080518-d3esn-00011.warc.gz	5438233243	download job
www.atari-forum.com-inf-20240504-080518-d3esn-00011.warc.os.cdx.gz	1896505	download
www.emsmail.com-inf-20240505-204251-30kp3-00000.warc.gz	48386239	download job
www.emsmail.com-inf-20240505-204251-30kp3-00000.warc.os.cdx.gz	82887	download
www.emsmail.com-inf-20240505-204251-30kp3-meta.warc.gz	47981	download job
www.emsmail.com-inf-20240505-204251-30kp3-meta.warc.os.cdx.gz	47	download
www.emsmail.com-inf-20240505-204251-30kp3.json	244	download job
www.heinze.de-inf-20240430-185318-2m80a-00058.warc.gz	5370844389	download job
www.heinze.de-inf-20240430-185318-2m80a-00058.warc.os.cdx.gz	1980334	download
www.ingv.it-inf-20240505-125103-c4zt4-00001.warc.gz	5690801824	download job
www.ingv.it-inf-20240505-125103-c4zt4-00001.warc.os.cdx.gz	4558987	download
www.nakedcapitalism.com-inf-20240327-011540-4qq9p-00520.warc.gz	5395555581	download job
www.nakedcapitalism.com-inf-20240327-011540-4qq9p-00520.warc.os.cdx.gz	584026	download
x0.at-shallow-20240505-203555-864t6-00000.warc.gz	259767	download job
x0.at-shallow-20240505-203555-864t6-00000.warc.os.cdx.gz	212	download
x0.at-shallow-20240505-203555-864t6-meta.warc.gz	3421	download job
x0.at-shallow-20240505-203555-864t6-meta.warc.os.cdx.gz	47	download
x0.at-shallow-20240505-203555-864t6.json	242	download job
x0.at-shallow-20240505-203618-5x27q-00000.warc.gz	305356	download job
x0.at-shallow-20240505-203618-5x27q-00000.warc.os.cdx.gz	215	download
x0.at-shallow-20240505-203618-5x27q-meta.warc.gz	3431	download job
x0.at-shallow-20240505-203618-5x27q-meta.warc.os.cdx.gz	47	download
x0.at-shallow-20240505-203618-5x27q.json	242	download job
x0.at-shallow-20240505-203626-efftx-00000.warc.gz	66249	download job
x0.at-shallow-20240505-203626-efftx-00000.warc.os.cdx.gz	213	download
x0.at-shallow-20240505-203626-efftx-meta.warc.gz	3411	download job
x0.at-shallow-20240505-203626-efftx-meta.warc.os.cdx.gz	47	download
x0.at-shallow-20240505-203626-efftx.json	242	download job