Item archiveteam_archivebot_go_20250201141458_73b72e32

Filename	Size
ait-xia-dialog.de-inf-20250130-171936-472r7-00022.warc.gz	5369063548	download job
ait-xia-dialog.de-inf-20250130-171936-472r7-00022.warc.os.cdx.gz	1607270	download
archiveteam_archivebot_go_20250201141458_73b72e32.cdx.gz	18989568	download
archiveteam_archivebot_go_20250201141458_73b72e32.cdx.idx	22096	download
archiveteam_archivebot_go_20250201141458_73b72e32_files.xml	0	download
archiveteam_archivebot_go_20250201141458_73b72e32_meta.sqlite	106496	download
archiveteam_archivebot_go_20250201141458_73b72e32_meta.xml	1047	download
exam1.urfu.ru-inf-20250201-140421-14lsd-00000.warc.gz	34539471	download job
exam1.urfu.ru-inf-20250201-140421-14lsd-00000.warc.os.cdx.gz	170672	download
exam1.urfu.ru-inf-20250201-140421-14lsd-meta.warc.gz	98447	download job
exam1.urfu.ru-inf-20250201-140421-14lsd-meta.warc.os.cdx.gz	47	download
exam1.urfu.ru-inf-20250201-140421-14lsd.json	241	download job
exam2.urfu.ru-inf-20250201-135449-e6yep-00000.warc.gz	41786585	download job
exam2.urfu.ru-inf-20250201-135449-e6yep-00000.warc.os.cdx.gz	175336	download
exam2.urfu.ru-inf-20250201-135449-e6yep-meta.warc.gz	108753	download job
exam2.urfu.ru-inf-20250201-135449-e6yep-meta.warc.os.cdx.gz	47	download
exam2.urfu.ru-inf-20250201-135449-e6yep.json	241	download job
klaus-peter-willsch.de-inf-20250201-140649-3ft65-00000.warc.gz	193328524	download job
klaus-peter-willsch.de-inf-20250201-140649-3ft65-00000.warc.os.cdx.gz	4489	download
klaus-peter-willsch.de-inf-20250201-140649-3ft65-meta.warc.gz	6209	download job
klaus-peter-willsch.de-inf-20250201-140649-3ft65-meta.warc.os.cdx.gz	47	download
klaus-peter-willsch.de-inf-20250201-140649-3ft65.json	250	download job
specialevents.gatech.edu-inf-20250201-130727-253s3-00001.warc.gz	838296136	download job
specialevents.gatech.edu-inf-20250201-130727-253s3-00001.warc.os.cdx.gz	470333	download
specialevents.gatech.edu-inf-20250201-130727-253s3-meta.warc.gz	1095357	download job
specialevents.gatech.edu-inf-20250201-130727-253s3-meta.warc.os.cdx.gz	47	download
specialevents.gatech.edu-inf-20250201-130727-253s3.json	252	download job
tardis.tiny-vps.com-inf-20240918-195055-4y01y-02145.warc.gz	5388236775	download job
tardis.tiny-vps.com-inf-20240918-195055-4y01y-02145.warc.os.cdx.gz	20351	download
urls-transfer.archivete.am-2025-01-26_dl.google.com-developers.google.com_android_ota.txt-shallow-20250126-210620-77jdd-00259.warc.gz	6462225195	download job
urls-transfer.archivete.am-2025-01-26_dl.google.com-developers.google.com_android_ota.txt-shallow-20250126-210620-77jdd-00259.warc.os.cdx.gz	502	download
urls-transfer.archivete.am-biodiversitylinks.org_seed_urls.txt-inf-20250201-064019-9apfg-00000.warc.gz	5369034795	download job
urls-transfer.archivete.am-biodiversitylinks.org_seed_urls.txt-inf-20250201-064019-9apfg-00000.warc.os.cdx.gz	2983053	download
urls-transfer.archivete.am-catalog.data.gov_mixed_urls_shuffled_part_01.txt-shallow-20250130-234448-4hb15-00027.warc.gz	5400552961	download job
urls-transfer.archivete.am-catalog.data.gov_mixed_urls_shuffled_part_01.txt-shallow-20250130-234448-4hb15-00027.warc.os.cdx.gz	124056	download
urls-transfer.archivete.am-catalog.data.gov_mixed_urls_shuffled_part_02.txt-shallow-20250130-234535-4qlh2-00046.warc.gz	5780597834	download job
urls-transfer.archivete.am-catalog.data.gov_mixed_urls_shuffled_part_02.txt-shallow-20250130-234535-4qlh2-00046.warc.os.cdx.gz	57920	download
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01342.warc.gz	5369906233	download job
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01342.warc.os.cdx.gz	8454	download
urls-transfer.archivete.am-www.europe-solidaire.org.txt-inf-20250108-125529-416ez-00195.warc.gz	5405975541	download job
urls-transfer.archivete.am-www.europe-solidaire.org.txt-inf-20250108-125529-416ez-00195.warc.os.cdx.gz	6345471	download
urls-transfer.archivete.am-www.qrstat.uz_seed-urls.txt-inf-20250201-102644-6rvln-00001.warc.gz	5369347409	download job
urls-transfer.archivete.am-www.qrstat.uz_seed-urls.txt-inf-20250201-102644-6rvln-00001.warc.os.cdx.gz	382127	download
wordpress.com-inf-20240927-093133-2tyvx-00537.warc.gz	5395046104	download job
wordpress.com-inf-20240927-093133-2tyvx-00537.warc.os.cdx.gz	3731995	download
www.adl.org-inf-20250121-031826-1x92g-00030.warc.gz	5627120661	download job
www.adl.org-inf-20250121-031826-1x92g-00030.warc.os.cdx.gz	213518	download
www.bls.gov-inf-20250131-232433-dcczh-00007.warc.gz	5372282450	download job
www.bls.gov-inf-20250131-232433-dcczh-00007.warc.os.cdx.gz	571890	download
www.bushcenter.org-inf-20250131-051113-efiji-00032.warc.gz	5441920233	download job
www.bushcenter.org-inf-20250131-051113-efiji-00032.warc.os.cdx.gz	19618	download
www.bushcenter.org-inf-20250131-051113-efiji-00033.warc.gz	7004495172	download job
www.bushcenter.org-inf-20250131-051113-efiji-00033.warc.os.cdx.gz	39789	download
www.camera.it-inf-20250126-154720-zun4l-00096.warc.gz	5485757935	download job
www.camera.it-inf-20250126-154720-zun4l-00096.warc.os.cdx.gz	6341	download
www.cms.gov-inf-20250131-211707-633kf-00034.warc.gz	5377419995	download job
www.cms.gov-inf-20250131-211707-633kf-00034.warc.os.cdx.gz	191737	download
www.epa.gov-inf-20250131-224729-e7ylr-00026.warc.gz	5370885403	download job
www.epa.gov-inf-20250131-224729-e7ylr-00026.warc.os.cdx.gz	459663	download
www.faa.gov-inf-20250201-123855-1c1hh-aborted-wpull.log.gz	3068	download
www.faa.gov-inf-20250201-123855-1c1hh-aborted.json	238	download job
www.nps.gov-inf-20250127-183221-ctiur-00306.warc.gz	5368710702	download job
www.nps.gov-inf-20250127-183221-ctiur-00306.warc.os.cdx.gz	541139	download
www.thoorn.nl-inf-20250201-134001-e9u8l-00000.warc.gz	3910566697	download job
www.thoorn.nl-inf-20250201-134001-e9u8l-00000.warc.os.cdx.gz	240528	download
www.thoorn.nl-inf-20250201-134001-e9u8l-meta.warc.gz	140032	download job
www.thoorn.nl-inf-20250201-134001-e9u8l-meta.warc.os.cdx.gz	47	download
www.thoorn.nl-inf-20250201-134001-e9u8l.json	241	download job
www.widmann-mauz.de-inf-20250201-124019-554r1-00000.warc.gz	2506384102	download job
www.widmann-mauz.de-inf-20250201-124019-554r1-00000.warc.os.cdx.gz	1072515	download
www.widmann-mauz.de-inf-20250201-124019-554r1-meta.warc.gz	705621	download job
www.widmann-mauz.de-inf-20250201-124019-554r1-meta.warc.os.cdx.gz	47	download
www.widmann-mauz.de-inf-20250201-124019-554r1.json	247	download job
xn--j1adgu3d.xn--p1ai-inf-20250201-140049-2vcdz-aborted-00000.warc.gz	2855749	download job
xn--j1adgu3d.xn--p1ai-inf-20250201-140049-2vcdz-aborted-00000.warc.os.cdx.gz	10003	download
xn--j1adgu3d.xn--p1ai-inf-20250201-140049-2vcdz-aborted-wpull.log.gz	6761	download
xn--j1adgu3d.xn--p1ai-inf-20250201-140049-2vcdz-aborted.json	248	download job