Item archiveteam_archivebot_go_20250813115452_4bd3c35b

Filename	Size
airflow.apache.org-inf-20250812-172926-9a14x-00002.warc.gz	1527659471	download job
airflow.apache.org-inf-20250812-172926-9a14x-00002.warc.os.cdx.gz	1726467	download
airflow.apache.org-inf-20250812-172926-9a14x-meta.warc.gz	7898712	download job
airflow.apache.org-inf-20250812-172926-9a14x-meta.warc.os.cdx.gz	47	download
airflow.apache.org-inf-20250812-172926-9a14x.json	243	download job
archiveteam_archivebot_go_20250813115452_4bd3c35b.cdx.gz	38764331	download
archiveteam_archivebot_go_20250813115452_4bd3c35b.cdx.idx	55216	download
archiveteam_archivebot_go_20250813115452_4bd3c35b_files.xml	0	download
archiveteam_archivebot_go_20250813115452_4bd3c35b_meta.sqlite	106496	download
archiveteam_archivebot_go_20250813115452_4bd3c35b_meta.xml	1047	download
ejbron.wordpress.com-inf-20250810-154325-dhyu2-00141.warc.gz	6410506355	download job
ejbron.wordpress.com-inf-20250810-154325-dhyu2-00141.warc.os.cdx.gz	1139789	download
flibusta.is-inf-20240924-060021-7gpwv-01522.warc.gz	5370634075	download job
flibusta.is-inf-20240924-060021-7gpwv-01522.warc.os.cdx.gz	570418	download
saintpetersblog.com-inf-20250812-155734-1y20v-00011.warc.gz	5378370022	download job
saintpetersblog.com-inf-20250812-155734-1y20v-00011.warc.os.cdx.gz	2331947	download
scarborough-yorkshire.co.uk-inf-20250813-072311-4t6cw-00000.warc.gz	4162450145	download job
scarborough-yorkshire.co.uk-inf-20250813-072311-4t6cw-00000.warc.os.cdx.gz	3640532	download
scarborough-yorkshire.co.uk-inf-20250813-072311-4t6cw-meta.warc.gz	2276043	download job
scarborough-yorkshire.co.uk-inf-20250813-072311-4t6cw-meta.warc.os.cdx.gz	47	download
scarborough-yorkshire.co.uk-inf-20250813-072311-4t6cw.json	258	download job
test.mercatometropolitano.com-inf-20250813-001133-71til-00000.warc.gz	1430842488	download job
test.mercatometropolitano.com-inf-20250813-001133-71til-00000.warc.os.cdx.gz	3002696	download
test.mercatometropolitano.com-inf-20250813-001133-71til-meta.warc.gz	1519295	download job
test.mercatometropolitano.com-inf-20250813-001133-71til-meta.warc.os.cdx.gz	47	download
test.mercatometropolitano.com-inf-20250813-001133-71til.json	260	download job
urls-transfer.archivete.am-cap.gov_gocivilairpatrol.com_cap.news_subdomains.txt-inf-20250426-065415-yy94g-01492.warc.gz	5368717759	download job
urls-transfer.archivete.am-cap.gov_gocivilairpatrol.com_cap.news_subdomains.txt-inf-20250426-065415-yy94g-01492.warc.os.cdx.gz	947982	download
urls-transfer.archivete.am-otakuworld.com_subdomains.txt-inf-20250813-050801-e3edv-00001.warc.gz	4006073324	download job
urls-transfer.archivete.am-otakuworld.com_subdomains.txt-inf-20250813-050801-e3edv-00001.warc.os.cdx.gz	4996043	download
urls-transfer.archivete.am-otakuworld.com_subdomains.txt-inf-20250813-050801-e3edv-meta.warc.gz	3718138	download job
urls-transfer.archivete.am-otakuworld.com_subdomains.txt-inf-20250813-050801-e3edv-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-otakuworld.com_subdomains.txt-inf-20250813-050801-e3edv-urls.txt	424	download
urls-transfer.archivete.am-otakuworld.com_subdomains.txt-inf-20250813-050801-e3edv.json	350	download job
urls-transfer.archivete.am-policerecords.laist.com_seed_urls.txt-inf-20250813-041543-5c0dm-00019.warc.gz	5465384749	download job
urls-transfer.archivete.am-policerecords.laist.com_seed_urls.txt-inf-20250813-041543-5c0dm-00019.warc.os.cdx.gz	96457	download
urls-transfer.archivete.am-www.newsonair.gov.in.txt-inf-20250516-134251-e4url-00062.warc.gz	5374754610	download job
urls-transfer.archivete.am-www.newsonair.gov.in.txt-inf-20250516-134251-e4url-00062.warc.os.cdx.gz	80350	download
urls-transfer.archivete.am-www.parque-net.com.txt-inf-20250813-064108-84lgb-00000.warc.gz	4935346257	download job
urls-transfer.archivete.am-www.parque-net.com.txt-inf-20250813-064108-84lgb-00000.warc.os.cdx.gz	2448864	download
urls-transfer.archivete.am-www.parque-net.com.txt-inf-20250813-064108-84lgb-meta.warc.gz	1388333	download job
urls-transfer.archivete.am-www.parque-net.com.txt-inf-20250813-064108-84lgb-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-www.parque-net.com.txt-inf-20250813-064108-84lgb-urls.txt	52	download
urls-transfer.archivete.am-www.parque-net.com.txt-inf-20250813-064108-84lgb.json	336	download job
urls-transfer.archivete.am-www.tvmarineret.org.txt-inf-20250808-234413-atk6a-00034.warc.gz	5672289639	download job
urls-transfer.archivete.am-www.tvmarineret.org.txt-inf-20250808-234413-atk6a-00034.warc.os.cdx.gz	1753	download
usatoday.tumblr.com-inf-20250628-071652-9p1l8-00836.warc.gz	5368909225	download job
usatoday.tumblr.com-inf-20250628-071652-9p1l8-00836.warc.os.cdx.gz	1174579	download
www.chip.de-inf-20250803-165817-6rf6z-00221.warc.gz	5368765071	download job
www.chip.de-inf-20250803-165817-6rf6z-00221.warc.os.cdx.gz	2928419	download
www.flamingoland.co.uk-inf-20250813-065301-5cdcd-00000.warc.gz	3458849420	download job
www.flamingoland.co.uk-inf-20250813-065301-5cdcd-00000.warc.os.cdx.gz	3448071	download
www.flamingoland.co.uk-inf-20250813-065301-5cdcd-meta.warc.gz	2105023	download job
www.flamingoland.co.uk-inf-20250813-065301-5cdcd-meta.warc.os.cdx.gz	47	download
www.flamingoland.co.uk-inf-20250813-065301-5cdcd.json	253	download job
www.giantbomb.com-inf-20250503-021712-f1ram-00902.warc.gz	5368795937	download job
www.giantbomb.com-inf-20250503-021712-f1ram-00902.warc.os.cdx.gz	211515	download
www.pbs.org-inf-20250330-092508-bykmh-11334.warc.gz	6046907643	download job
www.pbs.org-inf-20250330-092508-bykmh-11334.warc.os.cdx.gz	14920	download
www.pbs.org-inf-20250330-092508-bykmh-11335.warc.gz	5397762825	download job
www.pbs.org-inf-20250330-092508-bykmh-11335.warc.os.cdx.gz	14126	download
www.pbs.org-inf-20250330-092508-bykmh-11336.warc.gz	5743844699	download job
www.pbs.org-inf-20250330-092508-bykmh-11336.warc.os.cdx.gz	21170	download
www.pbs.org-inf-20250330-092508-bykmh-11337.warc.gz	5881568411	download job
www.pbs.org-inf-20250330-092508-bykmh-11337.warc.os.cdx.gz	21700	download
www.petition2congress.com-inf-20250812-162617-1h6hs-00002.warc.gz	2792375126	download job
www.petition2congress.com-inf-20250812-162617-1h6hs-00002.warc.os.cdx.gz	3729168	download
www.petition2congress.com-inf-20250812-162617-1h6hs-meta.warc.gz	8232232	download job
www.petition2congress.com-inf-20250812-162617-1h6hs-meta.warc.os.cdx.gz	47	download
www.petition2congress.com-inf-20250812-162617-1h6hs.json	255	download job
www.tasnimnews.com-inf-20250615-195050-79wa4-00641.warc.gz	5381960617	download job
www.tasnimnews.com-inf-20250615-195050-79wa4-00641.warc.os.cdx.gz	1255245	download
www.undiscoveredscotland.co.uk-inf-20250812-201922-aec3a-00003.warc.gz	5369473241	download job
www.undiscoveredscotland.co.uk-inf-20250812-201922-aec3a-00003.warc.os.cdx.gz	2766637	download
www.visitatlanticcity.com-inf-20250813-014643-cgvku-00004.warc.gz	5369756322	download job
www.visitatlanticcity.com-inf-20250813-014643-cgvku-00004.warc.os.cdx.gz	1673499	download
www.wired.com-inf-20250222-101923-dg2iq-01219.warc.gz	5369427795	download job
www.wired.com-inf-20250222-101923-dg2iq-01219.warc.os.cdx.gz	2042844	download