Item archiveteam_archivebot_go_20240223090612_a8f1e3c2

Filename	Size
archiveteam_archivebot_go_20240223090612_a8f1e3c2.cdx.gz	18889172	download
archiveteam_archivebot_go_20240223090612_a8f1e3c2.cdx.idx	17521	download
archiveteam_archivebot_go_20240223090612_a8f1e3c2_files.xml	0	download
archiveteam_archivebot_go_20240223090612_a8f1e3c2_meta.sqlite	12288	download
archiveteam_archivebot_go_20240223090612_a8f1e3c2_meta.xml	830	download
cdn.gea.esac.esa.int-inf-20240216-175935-5jhse-01130.warc.gz	6450553485	download job
cdn.gea.esac.esa.int-inf-20240216-175935-5jhse-01130.warc.os.cdx.gz	575	download
cdn.gea.esac.esa.int-inf-20240216-175935-5jhse-01131.warc.gz	6226759219	download job
cdn.gea.esac.esa.int-inf-20240216-175935-5jhse-01131.warc.os.cdx.gz	633	download
cdn.gea.esac.esa.int-inf-20240216-175935-5jhse-01132.warc.gz	5850261714	download job
cdn.gea.esac.esa.int-inf-20240216-175935-5jhse-01132.warc.os.cdx.gz	627	download
cdn.gea.esac.esa.int-inf-20240216-175935-5jhse-01133.warc.gz	5683494883	download job
cdn.gea.esac.esa.int-inf-20240216-175935-5jhse-01133.warc.os.cdx.gz	575	download
connections-qj.org-inf-20240220-214335-6461s-00008.warc.gz	5438110317	download job
connections-qj.org-inf-20240220-214335-6461s-00008.warc.os.cdx.gz	3987925	download
debianaddict.com-inf-20240223-082839-47ggm-00000.warc.gz	118318400	download job
debianaddict.com-inf-20240223-082839-47ggm-00000.warc.os.cdx.gz	246926	download
debianaddict.com-inf-20240223-082839-47ggm-meta.warc.gz	148323	download job
debianaddict.com-inf-20240223-082839-47ggm-meta.warc.os.cdx.gz	47	download
debianaddict.com-inf-20240223-082839-47ggm.json	242	download job
europepmc.org-inf-20240212-215511-8x1ov-00309.warc.gz	5736599503	download job
europepmc.org-inf-20240212-215511-8x1ov-00309.warc.os.cdx.gz	126736	download
expose-news.com-inf-20240219-152056-20pbg-00100.warc.gz	14148550504	download job
expose-news.com-inf-20240219-152056-20pbg-00100.warc.os.cdx.gz	724840	download
fassadenkratzer.wordpress.com-inf-20240222-193300-69vwa-00008.warc.gz	5601624270	download job
fassadenkratzer.wordpress.com-inf-20240222-193300-69vwa-00008.warc.os.cdx.gz	1619503	download
ooh.directory-inf-20240223-041814-4u7x0-00005.warc.gz	5370215447	download job
ooh.directory-inf-20240223-041814-4u7x0-00005.warc.os.cdx.gz	2088487	download
scholarcommons.sc.edu-inf-20240222-010122-5xbdi-00028.warc.gz	5399617127	download job
scholarcommons.sc.edu-inf-20240222-010122-5xbdi-00028.warc.os.cdx.gz	560702	download
source.ni.com-shallow-20240223-084709-azzs8-00000.warc.gz	81159	download job
source.ni.com-shallow-20240223-084709-azzs8-00000.warc.os.cdx.gz	750	download
source.ni.com-shallow-20240223-084709-azzs8-meta.warc.gz	3870	download job
source.ni.com-shallow-20240223-084709-azzs8-meta.warc.os.cdx.gz	47	download
source.ni.com-shallow-20240223-084709-azzs8.json	245	download job
urls-transfer.archivete.am-github.com-kagisearch-smallweb-raw-main-smallweb-rss-feeds-removed.txt-shallow-20240223-041432-d01pv-00002.warc.gz	5400955991	download job
urls-transfer.archivete.am-github.com-kagisearch-smallweb-raw-main-smallweb-rss-feeds-removed.txt-shallow-20240223-041432-d01pv-00002.warc.os.cdx.gz	2136217	download
urls-transfer.archivete.am-images.pexels.com_photos_jpeg_4M_to_5M.txt-shallow-20240222-155000-24bur-00033.warc.gz	5368958172	download job
urls-transfer.archivete.am-images.pexels.com_photos_jpeg_4M_to_5M.txt-shallow-20240222-155000-24bur-00033.warc.os.cdx.gz	224177	download
urls-transfer.archivete.am-www.curseforge.com_mod_download_404s_resume.txt-shallow-20240219-030715-cpamk-00276.warc.gz	5400380366	download job
urls-transfer.archivete.am-www.curseforge.com_mod_download_404s_resume.txt-shallow-20240219-030715-cpamk-00276.warc.os.cdx.gz	73214	download
www.husseinnasser.com-inf-20240223-080854-10kqb-00000.warc.gz	5381667284	download job
www.husseinnasser.com-inf-20240223-080854-10kqb-00000.warc.os.cdx.gz	559569	download
www.husseinnasser.com-inf-20240223-080854-10kqb-00001.warc.gz	5424673161	download job
www.husseinnasser.com-inf-20240223-080854-10kqb-00001.warc.os.cdx.gz	752147	download
www.lpsg.com-inf-20240124-045020-97ypj-00055.warc.gz	5368982244	download job
www.lpsg.com-inf-20240124-045020-97ypj-00055.warc.os.cdx.gz	1926778	download
www.vice.com-inf-20240222-180412-3m7tt-00021.warc.gz	5373159495	download job
www.vice.com-inf-20240222-180412-3m7tt-00021.warc.os.cdx.gz	698893	download
www.westconference.org-inf-20240222-064206-6dqfk-00001.warc.gz	5368888917	download job
www.westconference.org-inf-20240222-064206-6dqfk-00001.warc.os.cdx.gz	3613515	download