天天看點

CDH4.5.0 新特性Apache FlumeApache HiveHueApache MapReduce v1 (MRv1)Apache MapReduce v2 (YARN)Apache OozieApache Sentry (孵化中)

flume自動檢測cloudera search依賴。

memory channel calculates byte capacity usage on transaction commits instead of puts to improve performance

增加了對saml驗證後端和其他安全修補程式支援.

[search] 預設的模闆應顯示的所有字段.

[core] 讓搜尋綁定認證可選的ldap

hdfs通路追蹤:當<code>mapreduce.job.token.tracking.ids</code>設定為true時,mrv1任務根據持有的hdfs通路憑證來通路hdfs上的資料。而且,當mrv1其通路資料資料時hdfs日志會記錄其通路資訊。

堆棧跟蹤的任務逾時: 為了便于調試,當mr任務逾時時會累記其堆棧資訊.

<code>keyonlytextinputwriter</code> 和<code>keyonlytextoutputreader</code>使工作流不使用分隔符即可寫入/讀取文本.

使用者在使用mrv1壓縮包的<code>bin-mapreduce1</code>目錄下的腳本時,不再需要根據情況的不同而設定不同的環境變量了.

hdfs通路追蹤:當<code>mapreduce.job.token.tracking.ids</code>設定為true時,mrv1任務根據持有的hdfs通路憑證來通路hdfs上的資料。而且,當mrv1其通路資料資料時hdfs日志會記錄其通路信.

公平排程器現在可以不用受節點心跳檢測的判斷影響,進而可以更快的排程

pig和hive現在無需手動操作或配置即可通路 parquet 檔案.

hive metastore服務的通路可以不受<code>iptables</code>的限定。在hiveserver2和impalad運作的使用者必須要首先在<code>core-site.xml</code>中配置,然後才可以通路hive metastore服務。 例如,hivemetastore 是hive metastore服務的使用者。<code>hive</code>和<code>impala</code>分别是運作hiveserver2 和 impalad不同使用者。按如下的配置,這些使用者将被允許通路hive metastore服務.