天天看點

數學之美讀後感

統計語言模型:

馬爾可夫鍊,模型訓練,零機率平滑

隐馬爾可夫鍊:

機率訓練,鮑姆-韋爾奇算法

資訊度量和作用:

資訊熵,互資訊,聯合機率分布、相對熵

簡單之美-布爾袋鼠和搜尋引擎的索引:

文獻搜尋

圖論和網絡爬蟲:

最短路徑,網絡爬蟲,哈希表,工程要點(DFS,BFS,頁面分析和URL提取,URL表)

PageRank-Google的民主表決式網頁排名技術:

布林

如何确定網頁和查詢的相關性:

下載下傳-索引-品質-相關性,關鍵詞權重TF—IDF

地圖和本地搜尋的最基本技術-有限狀态機和動态規劃:

位址分析,全球導航

餘弦定理和新聞分類:

新聞的特征向量,向量距離的度量,計算餘弦向量的技巧

矩陣運算和文本分類進行中的兩個問題:

奇異值分解

資訊指紋及其應用:

梅森旋轉算法,判定集合相同或基本相同

由電視劇《暗算》所想到的-談談密碼學的數學原理:

資訊論

閃光的不一定是金子-談談搜尋引引擎反作弊問題:

解卷積,圖論

不要把雞蛋放到一個籃子裡-談談最大熵問題:

将不同資訊整合到統一的模型中

拼音輸入法的數學原理:

編碼,敲擊鍵數,通信問題

布隆過濾器:

判斷一個元素是否在集合中,速度快,但是有一定的誤識别率

馬爾可夫鍊的擴充:貝葉斯網絡

分類

條件随機場與句法分析:

計算聯合分布機率

維比特和他的維比特算法:

籬笆網絡有向圖最短路徑,動态規劃算法,(數字通信,語音識别,機器翻譯,拼音轉漢字,分詞),CDMA技術

再談文本自動分類問題-期望最大算法:

上帝算法,文本自分類算法

邏輯回歸和搜尋廣告:

将影響機率的不同因素結合在一起的指數模型

各個擊破算法和Google雲計算的基礎:

分治理算法到MapReduce