Item archiveteam_archivebot_go_20250209101707_bb498c38

Filename	Size
agdatacommons.nal.usda.gov-inf-20250208-080552-485ky-00028.warc.gz	5760814728	download job
agdatacommons.nal.usda.gov-inf-20250208-080552-485ky-00028.warc.os.cdx.gz	888824	download
archiveteam_archivebot_go_20250209101707_bb498c38.cdx.gz	21847233	download
archiveteam_archivebot_go_20250209101707_bb498c38.cdx.idx	23621	download
archiveteam_archivebot_go_20250209101707_bb498c38_files.xml	0	download
archiveteam_archivebot_go_20250209101707_bb498c38_meta.sqlite	94208	download
archiveteam_archivebot_go_20250209101707_bb498c38_meta.xml	1047	download
cfcorigami.com-inf-20250209-050944-bgxmf-00001.warc.gz	5370226440	download job
cfcorigami.com-inf-20250209-050944-bgxmf-00001.warc.os.cdx.gz	2212007	download
cirrus.ucsd.edu-inf-20250204-222623-178n0-00192.warc.gz	9145916879	download job
cirrus.ucsd.edu-inf-20250204-222623-178n0-00192.warc.os.cdx.gz	396	download
hwpi.harvard.edu-inf-20250205-141022-19egy-00119.warc.gz	6632249649	download job
hwpi.harvard.edu-inf-20250205-141022-19egy-00119.warc.os.cdx.gz	1125528	download
hwpi.harvard.edu-inf-20250205-141022-19egy-00120.warc.gz	6296008190	download job
hwpi.harvard.edu-inf-20250205-141022-19egy-00120.warc.os.cdx.gz	53383	download
hwpi.harvard.edu-inf-20250205-141022-19egy-00121.warc.gz	6975042364	download job
hwpi.harvard.edu-inf-20250205-141022-19egy-00121.warc.os.cdx.gz	42042	download
hwpi.harvard.edu-inf-20250205-141022-19egy-00122.warc.gz	5462479072	download job
hwpi.harvard.edu-inf-20250205-141022-19egy-00122.warc.os.cdx.gz	73776	download
pds.nasa.gov-inf-20241126-024008-agj3u-00234.warc.gz	5368976238	download job
pds.nasa.gov-inf-20241126-024008-agj3u-00234.warc.os.cdx.gz	2410478	download
registry.faa.gov-inf-20250209-095808-6f3ul-aborted-00000.warc.gz	2953	download job
registry.faa.gov-inf-20250209-095808-6f3ul-aborted-00000.warc.os.cdx.gz	47	download
registry.faa.gov-inf-20250209-095808-6f3ul-aborted-wpull.log.gz	744	download
registry.faa.gov-inf-20250209-095808-6f3ul-aborted.json	259	download job
shoup.bol.ucla.edu-inf-20250209-083740-1u45k-00003.warc.gz	5101679270	download job
shoup.bol.ucla.edu-inf-20250209-083740-1u45k-00003.warc.os.cdx.gz	525106	download
shoup.bol.ucla.edu-inf-20250209-083740-1u45k-meta.warc.gz	943856	download job
shoup.bol.ucla.edu-inf-20250209-083740-1u45k-meta.warc.os.cdx.gz	47	download
shoup.bol.ucla.edu-inf-20250209-083740-1u45k.json	243	download job
tfr.faa.gov-inf-20250209-092402-7rkl1-00000.warc.gz	18191369	download job
tfr.faa.gov-inf-20250209-092402-7rkl1-00000.warc.os.cdx.gz	65932	download
tfr.faa.gov-inf-20250209-092402-7rkl1-meta.warc.gz	43409	download job
tfr.faa.gov-inf-20250209-092402-7rkl1-meta.warc.os.cdx.gz	47	download
tfr.faa.gov-inf-20250209-092402-7rkl1.json	252	download job
thebullshitmachines.com-inf-20250209-091116-c5l31-00000.warc.gz	1393195595	download job
thebullshitmachines.com-inf-20250209-091116-c5l31-00000.warc.os.cdx.gz	1983105	download
thebullshitmachines.com-inf-20250209-091116-c5l31-meta.warc.gz	1848801	download job
thebullshitmachines.com-inf-20250209-091116-c5l31-meta.warc.os.cdx.gz	47	download
thebullshitmachines.com-inf-20250209-091116-c5l31.json	249	download job
trac.wildfiregames.com-inf-20241103-133816-3izjb-00018.warc.gz	5391135079	download job
trac.wildfiregames.com-inf-20241103-133816-3izjb-00018.warc.os.cdx.gz	22064	download
urls-transfer.archivete.am-2025-02-07_www.faa.gov_archived-notices-data.txt-shallow-20250209-091242-9jd2k-00000.warc.gz	14492642	download job
urls-transfer.archivete.am-2025-02-07_www.faa.gov_archived-notices-data.txt-shallow-20250209-091242-9jd2k-00000.warc.os.cdx.gz	1115	download
urls-transfer.archivete.am-2025-02-07_www.faa.gov_archived-notices-data.txt-shallow-20250209-091242-9jd2k-meta.warc.gz	4195	download job
urls-transfer.archivete.am-2025-02-07_www.faa.gov_archived-notices-data.txt-shallow-20250209-091242-9jd2k-meta.warc.os.cdx.gz	47	download
urls-transfer.archivete.am-2025-02-07_www.faa.gov_archived-notices-data.txt-shallow-20250209-091242-9jd2k-urls.txt	974	download
urls-transfer.archivete.am-2025-02-07_www.faa.gov_archived-notices-data.txt-shallow-20250209-091242-9jd2k.json	389	download job
urls-transfer.archivete.am-blogs.archives.gov_subdomains.txt-inf-20250207-190846-2x3ta-00019.warc.gz	5391386286	download job
urls-transfer.archivete.am-blogs.archives.gov_subdomains.txt-inf-20250207-190846-2x3ta-00019.warc.os.cdx.gz	2511882	download
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01381.warc.gz	5402345179	download job
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01381.warc.os.cdx.gz	8383	download
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01382.warc.gz	5370717499	download job
urls-transfer.archivete.am-download.opencontent.netflix.com.s3.amazonaws.com_under_1GB.txt-shallow-20250116-052616-l2cdn-01382.warc.os.cdx.gz	8218	download
urls-transfer.archivete.am-www.europe-solidaire.org.txt-inf-20250108-125529-416ez-00221.warc.gz	5422463775	download job
urls-transfer.archivete.am-www.europe-solidaire.org.txt-inf-20250108-125529-416ez-00221.warc.os.cdx.gz	4209210	download
urls-transfer.archivete.am-www.fws.gov_seed_urls.txt-inf-20250202-220734-5priw-00147.warc.gz	5370266401	download job
urls-transfer.archivete.am-www.fws.gov_seed_urls.txt-inf-20250202-220734-5priw-00147.warc.os.cdx.gz	673730	download
www.afcurgentcare.com-inf-20250208-000018-28h1v-00005.warc.gz	5377563190	download job
www.afcurgentcare.com-inf-20250208-000018-28h1v-00005.warc.os.cdx.gz	1248932	download
www.everycrsreport.com-inf-20250206-002825-cf5ja-00011.warc.gz	5370742521	download job
www.everycrsreport.com-inf-20250206-002825-cf5ja-00011.warc.os.cdx.gz	1743192	download
www.psypokes.com-inf-20250207-063000-66gzm-00005.warc.gz	5368715950	download job
www.psypokes.com-inf-20250207-063000-66gzm-00005.warc.os.cdx.gz	2550611	download
www.spaceforce.mil-inf-20250126-104111-c3t8z-00933.warc.gz	7963065128	download job
www.spaceforce.mil-inf-20250126-104111-c3t8z-00933.warc.os.cdx.gz	636	download
www.spaceforce.mil-inf-20250126-104111-c3t8z-00934.warc.gz	7501451160	download job
www.spaceforce.mil-inf-20250126-104111-c3t8z-00934.warc.os.cdx.gz	1258	download