統計語言模型:
馬爾可夫鍊,模型訓練,零機率平滑
隐馬爾可夫鍊:
機率訓練,鮑姆-韋爾奇算法
資訊度量和作用:
資訊熵,互資訊,聯合機率分布、相對熵
簡單之美-布爾袋鼠和搜尋引擎的索引:
文獻搜尋
圖論和網絡爬蟲:
最短路徑,網絡爬蟲,哈希表,工程要點(DFS,BFS,頁面分析和URL提取,URL表)
PageRank-Google的民主表決式網頁排名技術:
布林
如何确定網頁和查詢的相關性:
下載下傳-索引-品質-相關性,關鍵詞權重TF—IDF
地圖和本地搜尋的最基本技術-有限狀态機和動态規劃:
位址分析,全球導航
餘弦定理和新聞分類:
新聞的特征向量,向量距離的度量,計算餘弦向量的技巧
矩陣運算和文本分類進行中的兩個問題:
奇異值分解
資訊指紋及其應用:
梅森旋轉算法,判定集合相同或基本相同
由電視劇《暗算》所想到的-談談密碼學的數學原理:
資訊論
閃光的不一定是金子-談談搜尋引引擎反作弊問題:
解卷積,圖論
不要把雞蛋放到一個籃子裡-談談最大熵問題:
将不同資訊整合到統一的模型中
拼音輸入法的數學原理:
編碼,敲擊鍵數,通信問題
布隆過濾器:
判斷一個元素是否在集合中,速度快,但是有一定的誤識别率
馬爾可夫鍊的擴充:貝葉斯網絡
分類
條件随機場與句法分析:
計算聯合分布機率
維比特和他的維比特算法:
籬笆網絡有向圖最短路徑,動态規劃算法,(數字通信,語音識别,機器翻譯,拼音轉漢字,分詞),CDMA技術
再談文本自動分類問題-期望最大算法:
上帝算法,文本自分類算法
邏輯回歸和搜尋廣告:
将影響機率的不同因素結合在一起的指數模型
各個擊破算法和Google雲計算的基礎:
分治理算法到MapReduce