Item archiveteam_archivebot_go_20250209092309_1935d476

Filename	Size
agdatacommons.nal.usda.gov-inf-20250208-080552-485ky-00027.warc.gz	5600203667	download job
agdatacommons.nal.usda.gov-inf-20250208-080552-485ky-00027.warc.os.cdx.gz	209395	download
archiveteam_archivebot_go_20250209092309_1935d476.cdx.gz	34025454	download
archiveteam_archivebot_go_20250209092309_1935d476.cdx.idx	44632	download
archiveteam_archivebot_go_20250209092309_1935d476_files.xml	0	download
archiveteam_archivebot_go_20250209092309_1935d476_meta.sqlite	86016	download
archiveteam_archivebot_go_20250209092309_1935d476_meta.xml	1047	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-00190.warc.gz	10559104717	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-00190.warc.os.cdx.gz	545	download
hwpi.harvard.edu-inf-20250205-141022-19egy-00118.warc.gz	5400920459	download job
hwpi.harvard.edu-inf-20250205-141022-19egy-00118.warc.os.cdx.gz	1371045	download
nfdc.faa.gov-inf-20250209-085020-8k5z7-00000.warc.gz	742120	download job
nfdc.faa.gov-inf-20250209-085020-8k5z7-00000.warc.os.cdx.gz	1717	download
nfdc.faa.gov-inf-20250209-085020-8k5z7-meta.warc.gz	4638	download job
nfdc.faa.gov-inf-20250209-085020-8k5z7-meta.warc.os.cdx.gz	47	download
nfdc.faa.gov-inf-20250209-085020-8k5z7.json	281	download job
origami.kosmulski.org-inf-20250209-042210-ewziv-00001.warc.gz	5368711219	download job
origami.kosmulski.org-inf-20250209-042210-ewziv-00001.warc.os.cdx.gz	1938573	download
science.nasa.gov-inf-20250203-062320-2xdfq-00186.warc.gz	7664390337	download job
science.nasa.gov-inf-20250203-062320-2xdfq-00186.warc.os.cdx.gz	219480	download
urls-transfer.archivete.am-belsat.eu_bel-ru-en-pol.txt-inf-20250130-132226-8wyy2-00014.warc.gz	5368731432	download job
urls-transfer.archivete.am-belsat.eu_bel-ru-en-pol.txt-inf-20250130-132226-8wyy2-00014.warc.os.cdx.gz	3926614	download
urls-transfer.archivete.am-digitalmedia.fws.gov_downloads.txt-shallow-20250208-032956-aykny-00017.warc.gz	5371081020	download job
urls-transfer.archivete.am-digitalmedia.fws.gov_downloads.txt-shallow-20250208-032956-aykny-00017.warc.os.cdx.gz	39405	download
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01378.warc.gz	5389224912	download job
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01378.warc.os.cdx.gz	7996	download
urls-transfer.archivete.am-ncua.gov_espanol.ncua.gov_seed_urls.txt.txt-inf-20250209-030218-9a2lv-00000.warc.gz	5372911865	download job
urls-transfer.archivete.am-ncua.gov_espanol.ncua.gov_seed_urls.txt.txt-inf-20250209-030218-9a2lv-00000.warc.os.cdx.gz	1165366	download
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-00189.warc.gz	5368928496	download job
urls-transfer.archivete.am-usace.army.mil_location_subdomains.txt-inf-20250202-015927-2s9io-00189.warc.os.cdx.gz	730598	download
urls-transfer.archivete.am-www.fws.gov_seed_urls.txt-inf-20250202-220734-5priw-00146.warc.gz	5368760896	download job
urls-transfer.archivete.am-www.fws.gov_seed_urls.txt-inf-20250202-220734-5priw-00146.warc.os.cdx.gz	507636	download
www.arts.gov-inf-20250209-030417-6l8gj-00005.warc.gz	5368734802	download job
www.arts.gov-inf-20250209-030417-6l8gj-00005.warc.os.cdx.gz	928172	download
www.emmywatch.com-inf-20250120-190750-44b35-00037.warc.gz	5368741876	download job
www.emmywatch.com-inf-20250120-190750-44b35-00037.warc.os.cdx.gz	6522025	download
www.facebook.com-inf-20250209-085603-3s1xv-00000.warc.gz	44784763	download job
www.facebook.com-inf-20250209-085603-3s1xv-00000.warc.os.cdx.gz	128219	download
www.facebook.com-inf-20250209-085603-3s1xv-meta.warc.gz	84152	download job
www.facebook.com-inf-20250209-085603-3s1xv-meta.warc.os.cdx.gz	47	download
www.facebook.com-inf-20250209-085603-3s1xv.json	257	download job
www.gbig.org-inf-20250101-071305-2lbs3-00034.warc.gz	5368844901	download job
www.gbig.org-inf-20250101-071305-2lbs3-00034.warc.os.cdx.gz	12204243	download
www.music.af.mil-inf-20250208-212728-cx43q-00004.warc.gz	5372836780	download job
www.music.af.mil-inf-20250208-212728-cx43q-00004.warc.os.cdx.gz	340755	download
www.nal.usda.gov-inf-20250208-063746-5iovl-00004.warc.gz	5374038395	download job
www.nal.usda.gov-inf-20250208-063746-5iovl-00004.warc.os.cdx.gz	4570958	download
www.planning.org-shallow-20250209-085841-6z0k3-00000.warc.gz	4230807	download job
www.planning.org-shallow-20250209-085841-6z0k3-00000.warc.os.cdx.gz	14948	download
www.planning.org-shallow-20250209-085841-6z0k3-meta.warc.gz	15109	download job
www.planning.org-shallow-20250209-085841-6z0k3-meta.warc.os.cdx.gz	47	download
www.planning.org-shallow-20250209-085841-6z0k3.json	260	download job
www.senato.it-inf-20250126-154744-vf2j4-00008.warc.gz	5369109003	download job
www.senato.it-inf-20250126-154744-vf2j4-00008.warc.os.cdx.gz	56141	download
www.shoupdogg.com-inf-20250209-081735-14z33-00001.warc.gz	5404040623	download job
www.shoupdogg.com-inf-20250209-081735-14z33-00001.warc.os.cdx.gz	18521	download
www.spaceforce.mil-inf-20250126-104111-c3t8z-00930.warc.gz	7614777007	download job
www.spaceforce.mil-inf-20250126-104111-c3t8z-00930.warc.os.cdx.gz	1114	download
www.spaceforce.mil-inf-20250126-104111-c3t8z-00931.warc.gz	7487613404	download job
www.spaceforce.mil-inf-20250126-104111-c3t8z-00931.warc.os.cdx.gz	1165	download
www.uscourts.gov-inf-20250205-073636-6y0yu-00007.warc.gz	881902299	download job
www.uscourts.gov-inf-20250205-073636-6y0yu-00007.warc.os.cdx.gz	78730	download
www.uscourts.gov-inf-20250205-073636-6y0yu-meta.warc.gz	12493559	download job
www.uscourts.gov-inf-20250205-073636-6y0yu-meta.warc.os.cdx.gz	47	download
www.uscourts.gov-inf-20250205-073636-6y0yu.json	258	download job