天天看點

關于機器學習,你需要知道的三件事!

機器學習是一種資料分析技術,讓計算機執行人和動物與生俱來的活動:從經驗中學習。機器學習算法使用計算方法直接從資料中“學習”資訊,而不依賴于預定方程模型。當可用于學習的樣本數量增加時,這些算法可自适應提高性能。

<b>一.機器學習為什麼那麼重要?</b>

·        

<b>3.</b><b>計算生物學</b>,用于惡性良性腫瘤檢測、藥物發現和 DNA 序列分析。

<b>6.</b><b>自然語言處理</b>,用于語音識别應用。

關于機器學習,你需要知道的三件事!

機器學習算法能夠在産生洞察力的資料中發現自然模式,幫助你更好地制定決策和做出預測。醫療診斷、股票交易、能量負荷預測及更多行業每天都在使用這些算法制定關鍵決策。例如,媒體網站依靠機器學習算法從數百萬種選項中篩選出為你推薦的歌曲或影片。零售商利用這些算法深入了解客戶的購買行為。

<b>何時應該使用機器學習?</b>

當你遇到涉及大量資料和許多變量的複雜任務或問題,但沒有現成的處理公式或方程式時,可以考慮使用機器學習。例如,如果你需要處理以下情況,使用機器學習是一個很好的選擇:

關于機器學習,你需要知道的三件事!

<b>二.機器學習的工作原理:</b>

機器學習采用兩種技術:<b>監督式學習</b>和<b>無監督學習</b>。監督式學習根據已知的輸入和輸出訓練模型,讓模型能夠預測未來輸出;無監督學習從輸入資料中找出隐藏模式或内在結構。

關于機器學習,你需要知道的三件事!

<b>監督式學習:</b>

監督式學習采用分類和回歸技術開發預測模型。

<b>分類技術</b>可預測離散的響應 — 例如,電子郵件是不是垃圾郵件,惡性良性腫瘤是惡性還是良性的。分類模型可将輸入資料劃分成不同類别。典型的應用包括醫學成像、語音識别和信用評估。

<b>回歸技術</b>可預測連續的響應 — 例如,溫度的變化或電力需求中的波動。典型的應用包括電力系統負荷預測和算法交易。

如果你在處理一個資料範圍,或你的響應性質是一個實數(比如溫度,或一件裝置發生故障前的運作時間),則使用回歸方法。

小例子:使用監督式學習預測心髒病發作

假設臨床醫生希望預測某位患者在一年内是否會心髒病發作。他們有以前就醫的患者的相關資料,包括年齡、體重、身高和血壓。他們知道以前的患者在一年内是否出現過心髒病發作。是以,問題在于如何将現有資料合并到模型中,讓該模型能夠預測新患者在一年内是否會出現心髒病發作。

<b>無監督學習:</b>

例如,如果行動電話公司想優化他們手機信号塔的建立位置,則可以使用機器學習來估算依賴這些信号塔的人群數量。一部電話一次隻能與一個信号塔通信,是以,該團隊使用聚類算法設計蜂窩塔的最佳布局,優化他們的客戶群組或叢集的信号接收。

關于機器學習,你需要知道的三件事!

<b>如何确定使用哪種機器學習算法?</b>

選擇正确的算法看似難以駕馭——需要從幾十種監督式和無監督機器學習算法中選擇,每種算法又包含不同的學習方法。

沒有最佳方法或萬全之策。找到正确的算法隻是試錯過程的一部分——即使是經驗豐富的資料科學家,也無法說出某種算法是否無需試錯即可使用。但算法的選擇還取決于你要處理的資料的大小和類型、你要從資料中獲得的洞察力以及如何運用這些洞察力。

關于機器學習,你需要知道的三件事!

下面是選擇監督式或者無監督機器學習的一些準則:

1.在以下情況下選擇<b>監督式學習</b>:你需要訓練模型進行預測(例如溫度和股價等連續變量的值)或者分類(例如根據網絡攝像頭的錄像片段确定汽車的技術細節)。

2.在以下情況下選擇<b>無監督學習</b>:你需要深入了解資料并希望訓練模型找到好的内部表示形式,例如将資料拆分到叢集中。

<b>三.</b><b>MATLAB</b><b>機器學習:</b>

你如何借助機器學習的力量,使用資料做出更好的決策?MATLAB 讓機器學習簡單易行。借助用于處理大資料的工具和函數,以及讓機器學習發揮作用的應用程式,MATLAB 是将機器學習應用于你的資料分析的理想環境。

使用

MATLAB 可以做到:

2.使用模型精化和縮減技術建立能夠最好地捕捉預測能力的精确模型。

3.将機器學習模型內建到企業系統、叢集和雲中,并且将模型定位于實時嵌入式硬體。

4.為嵌入式傳感器分析工具執行自動代碼生成。

5.支援從資料分析到部署的內建工作流程。

文章原标題《what is

machine learning?》

譯者:虎說八道,審校:。

繼續閱讀