對象存儲OSS(Object Storage Service)具有海量、可靠、安全、高性能、低成本的特點。OSS提供标準、低頻、歸檔類型,覆寫多種資料從熱到冷的存儲需求,可以存儲的檔案數量和空間無限制,成為企業資料上雲的首選。
OSS支援多種計算引擎無縫對接,且是中國唯一被Hadoop社群官方預設支援的存儲。使用者可基于OSS建構企業級資料湖,建構企業資料的采集、存儲、處理、消費的完成解決方案。

近期,OSS新釋出了OSS Select,進一步協助客戶更好地發掘資料的價值。
OSS Select-使用SQL選取OSS檔案中的内容
OSS Select,讓使用者可以直接使用SQL語句,從OSS檔案中選取所需要的内容,而不必讀取整個檔案的内容。OSS Select目前已商業化(深圳區域已上線,其他區域陸續上線中)。
企業級使用者使用OSS Select,可将查詢條件下推到OSS,為計算應用加速,更好地發揮資料的價值。
OSS Select應用案例
比如,生命科技行業客戶,基于OSS Select+函數計算,對測序統計檔案進行分析,提升業務效率。
OSS Select主要特點:
- 多種使用方式:支援通過OSS RESTFul API、SDK、控制台使用OSS Select,也可與Spark、DataLakeAnalytics等計算應用結合。
- 為應用程式加速:計算應用通過和Select結合,将查詢條件下推到OSS,可以為資料分析提速60%~10倍。
- 支援的檔案格式:OSS Select支援CSV/TSV檔案(檔案編碼為UTF-8,符合RFC 4180标準的CSV檔案),或Zip壓縮後的CSV、TSV檔案,且行列分隔符以及Quote字元都可自定義。目前支援标準型、低頻型存儲。
OSS Select系列文章
以下是OSS Select系列文章,使用者可以參考多種場景下如何使用Select對資料進行分析處理。
- 打開OSS Select的正确姿勢: OSS Select使用場景和技巧
- Spark+OSS Select快速上手: Spark讀寫OSS,并使用OSS Select來加速查詢
- OSS Select介紹和SDK中使用Select示例
- 即時查詢和分析OSS上更多資料,可以使用Data Lake Analytics +OSS,參考: Data Lake Analytics + OSS資料檔案格式處理大全