本文全面介紹了人工智能（AI）的工作原理，包括其定義、組成部分以及如何逐漸建構和運用AI系統。文章從資料收集、預處理、模型選擇、訓練、測試評估、優化、部署到持續學習等各個環節，詳細闡述了AI的工作流程，旨在幫助讀者更好地了解AI技術及其應用，希望對你有所幫助。

人工智能 (AI) 是一項不斷發展的技術，旨在模仿人類智能。它幫助計算機學習如何像人腦一樣推理、學習和解決問題。

從醫療保健到金融等行業正在實施人工智能技術，對我們的生活産生有意義的積極影響。人工智能在自動駕駛汽車和個人助理等領域具有進步的潛力，可能會推動科學突破，增強醫療掃描能力，并實作準确的面部識别。

随着人工智能研究的加速以及人工智能的應用在商業和個人生活中發揮越來越大的作用，了解人工智能的工作原理以及如何使用它比以往任何時候都更加重要。

本文全面概述了人工智能，包括其元件以及其工作原理的逐漸介紹！

什麼是人工智能？

人工智能是計算機科學的一個領域，試圖模拟人類的思維方式。您将資料源中的資訊提供給人工智能系統，讓人工智能處理它，并建立使用輸入資料作為參考的經過訓練的模型。

擁有的資料越多，人工智能系統就能學得越好。

然而，并非所有人工智能系統都需要大資料源。您可以使用不同的技術訓練一些具有較小資料集的模型，例如強化學習（一種機器學習技術，我們接下來讨論）。

完成後，您可以向 AI 提出問題，讓它根據學到的知識進行估計并采取行動。但人工智能響應的程度和準确性主要取決于訓練資料的品質和算法。

您可以通過多種方式使用 AI 解決方案，包括：

聊天機器人。人工智能機器人利用業務資料進行訓練，以便與人類聊天并使用人類語言實時回答問題。
虛拟助理。Amazon Alexa、Apple Siri 和 Google Assistant 等人工智能工具在日常生活中為消費者提供幫助。
生成式人工智能。編寫人工智能工具（例如OpenAI 的ChatGPT）、圖像工具（例如Midjourney）以及語音工具（例如ElevenLabs）可以根據輸入生成不同形式的媒體。
語音識别。語音識别工具根據音頻輸入确定說話者是誰以及他們所說的内容。
搜尋引擎。搜尋工具通過創造更好的使用者體驗并實時生成結果來改進資訊收集過程。

機器學習：人工智能的基礎

機器學習(ML) 是人工智能系統學習的基礎。您提供給機器學習工具的資料可幫助人工智能建立資料集，以學習如何做出決策和預測，而無需進行程式設計來執行特定任務。

然而，雖然機器學習允許人工智能系統從資料中學習，但它們仍然需要程式設計和算法來處理資料并生成有意義的見解。

機器學習的工作原理是為工具提供大量資料。然後，您可以處理該資料以建立可用于處理人工智能任務的數學模型。從本質上講，它允許人工智能應用程式像人類一樣執行任務。

圖像分類就是一個很好的例子。假設您想訓練人工智能識别貓。

您可以向機器學習系統提供貓圖像并将它們标記為貓。然後，系統會從您提供的内容中學習，并在訓練完成後識别您提供的任何貓圖檔。

神經網絡：人工智能的構模組化塊

神經網絡是一種機器學習算法，它提供了處理基于人工智能模型建立的資訊的工具。它們由互相連接配接的節點（或人工神經元）組成。

這些節點根據進入神經網絡的資訊進行調整。這使得神經網絡能夠發現資料中的關系和模式。

節點分為幾層，每層都有自己的功能：

深度學習是一種具有多個隐藏層的神經網絡，是以它可以學習資料中更複雜的關系。然後，資料科學家可以使用不同的格式（文本、音頻、視訊和圖像）優化這些層，以提高準确性，但他們還需要更多的教育訓練才能工作。資料：人工智能的燃料

資料是人工智能系統的“燃料”。如果沒有大量資料集來訓練人工智能模型，人工智能就不會具有任何功能。

好的人工智能訓練資料具有幾個特征，包括：

資料齊全，無遺漏
與AI系統功能一緻
準确，無錯誤資料
最新，沒有過時的資訊

您使用多種類型的資料來訓練人工智能系統，分為三類：結構化、非結構化和半結構化。

結構化資料具有預定義的格式。想想日期、位址、信用卡号碼、數字系列和其他标準輸入方法。輸入人工智能系統的每條資料都會有一個标準格式。

非結構化資料缺乏任何特定資訊。輸入非結構化文本、圖像、視訊和圖像，讓 AI 找到資料中的模式。人工智能可以使用自然語言處理（NLP）、計算機視覺和其他方法來處理資訊。

如果沒有預定義的模型，您可以使用半結構化資料。此資料使用 JSON、XML 和 CSV 等檔案格式。走這條路将為您帶來非結構化資料源的好處以及輕松存儲訓練資料的能力。‍

算法：人工智能的問題解決者

算法是人工智能的支柱。它們是告訴人工智能如何學習、改進決策和解決問題的數學程式。算法将原始資料轉化為您每天可以使用的見解。

人工智能程式中使用的流行算法包括：

線性回歸。根據輸入和輸出的數學關系進行預測。
決策樹。基于資料屬性的模型決策。
K-均值聚類。建立資料叢集并找到每個叢集的中心以根據輸入識别模式。

這些算法的工作原理是擷取您輸入的資料并将其輸入到算法中。您提供的高品質資料越多，算法就越容易找到模式并将其轉化為可行的見解！

人工智能如何逐漸運作

既然您了解了人工智能是什麼，您可能想知道如何在實踐中使用它。本節将引導您逐漸完成建構人工智能系統的過程。

‍人工智能流程：
資料采集
資料預處理
選型
訓練模型
測試與評估
模型優化
部署
持續學習

1. 資料收集

資料收集是開發人工智能系統最關鍵的部分之一。這是收集大量資料來訓練人工智能系統的過程。

您的訓練資料可以是任何格式：文本、數字、圖像、視訊或音頻。資料的格式取決于您使用的是結構化資料集還是非結構化資料集。

讓我們以檢視社交媒體文章對品牌的情緒為例。從社交媒體收集大量資料集并對這些文章的情緒進行分類。它們是積極的、消極的還是中性的？

将這些結果放入 CSV 檔案中以進行訓練。完成後，您可以确定您的品牌在網上的情感。

2. 資料預處理

您不應該隻輸入找到的資料。人工智能系統需要準确、最新且相關的資訊才能獲得最佳結果。如果不預處理資料，就無法保證這種情況會發生，尤其是當您擁有大量資料時。

噪聲去除（也稱為資料平滑）是一項重要過程。這意味着查找并删除任何損害學習過程的資料并修複任何結構化資料的格式。

以正在接受财務分析訓練的人工智能模型為例。檢視您的訓練資料（例如股票價格和利率），以查找任何格式不正确的值。包含或删除美元符号，確定小數位于正确的位置，并删除任何其他異常情況。

3、模型選擇

模型選擇是人工智能開發過程中的一個步驟，您可以在其中選擇最适合目前問題的人工智能模型。許多人工智能模型都可用，包括機器學習算法、深度神經網絡或使用各種技術的混合模型。

除了不同類型的人工智能算法之外，還可以使用多種類型的機器學習：

監督學習。依靠人工标記的資料來學習和擷取知識。

無監督學習。依靠未标記的資料和學習模式來擷取知識。

強化學習。依靠人工智能與環境的互動來從錯誤中學習并擷取知識。

深度學習模型可以通過多層轉換資料。它适合更複雜的任務。

您選擇的模型将取決于幾個因素，包括：

您擁有的資料量
等待訓練的時間
您的總資源
您擁有的資料類型
您的總預算

4. 訓練模型

當您預處理資料并選擇模型時，就進入了訓練階段。

在此階段中，您将把資料分為兩組：訓練集和驗證集。訓練集是您用來訓練模型的資料集，驗證（測試）集可幫助您了解模型的訓練情況。

您選擇的模型将開始讀取您的資料集，使用數學和計算模型來檢視資料模式并建立輸出模型以幫助其做出未來預測。

這所需的時間取決于您擁有的訓練資料量以及您計劃訓練的模型有多大。層數越多，花費的時間就越長，使用的資源也就越多。

5. 測試與評估

您不應該僅僅指望 AI 模型在完成訓練後就處于生産狀态。根據資料集的品質以及您在預處理方面的工作表現，最終模型可能不會給出很好的結果。

這就是您建立的單獨驗證資料集可以發揮作用的地方。您的驗證資料集包含輸入和放入 AI 應用程式後的預期輸出。

驗證 AI 模型時，您需要進行多次測量。準确度（正确預測的百分比）、精确度（實際為正的預測的百分比）和召回率（正确識别的案例的百分比）是最常見的。

以下幾種情況可能會出現問題：

資料不佳。不準确的資料意味着您的模型無法産生良好的結果。

欠拟合。AI模型過于簡單，無法捕捉資料模式。

偏見。這些資料傾向于一個方向，并且趨勢與人類的偏見相同。

6. 模型優化

模型優化是提高 AI 模型性能的過程。這可能意味着微調或修改模型參數并使用正則化技術。

微調意味着優化模型的參數。您可以更改神經網絡的權重或用于調整模型的 AI 算法。

調整模型的架構意味着在神經網絡中添加和删除層，以改變層之間的連接配接并更好地捕獲資料的複雜性。

正則化技術有助于防止過度拟合，當模型在經過訓練的資料（而不是未見的資料）上表現良好時，這非常有用。正則化使人工智能更容易泛化并提供更準确的結果。

7. 部署

部署是完成 AI 模型訓練和優化後模型開發生命周期的最後階段。這是将模型內建到現有系統或建構新計算機程式來使用模型的過程。

例如，假設您有一個新的人工智能模型想要用于财務預測。您擁有一家産品業務，并希望了解未來的銷售額。

您将把模型與目前的計算機系統聯系起來，以擷取銷售資料、财務和其他相關資訊。作為回報，該模型會生成報告，估算您未來可以預期的銷售額和收入。

8. 持續學習

人工智能模型不是一次性訓練的東西。您必須定期根據新資訊訓練模型，以繼續看到準确的輸出。

您可以通過幾種方式來做到這一點。首先是微調您的基礎模型。您可以根據初始訓練資料生成基礎模型，并根據新資料微調該模型。這為您的人工智能模型提供了更新的資料，以做出更準确的預測。

更新人工智能模型的另一種方法是通過強化學習人類回報（RLHF）。通過此過程，您将監控人工智能系統的回報并對其進行評分。然後，系統會了解自己做錯了什麼，并利用該回報在未來提供更好的結果。概括

如您所見，訓練人工智能系統需要幾個步驟。

資料采集。收集供您使用的相關資料，并将其傳遞給教育訓練程式以告知人工智能。
資料預處理。檢查資料集以删除錯誤資料、修複格式并確定資訊保持更新。
模型選擇。選擇最适合您需求的 AI 模型。
模型訓練。将您的訓練資料提供給 AI 模型進行訓練。
模型測試。使用測試資料集確定您的模型産生準确的結果。
模型優化。對模型進行更改以改進結果和性能。
部署。将新的人工智能模型與目前系統內建。

持續學習。不斷根據新資訊更新您的人工智能模型，以保持其相關性并産生良好的結果。

然而，這隻是一個示例過程。并非所有人工智能系統都是相同的，是以您可能需要更改此流程以滿足您的獨特需求。

本文由人人都是産品經理作者【成于念】，微信公衆号：【老司機聊資料】，原創/授權釋出于人人都是産品經理，未經許可，禁止轉載。

題圖來自Unsplash，基于 CC0 協定。

人工智能的原理是什麼？

什麼是人工智能？

機器學習：人工智能的基礎

神經網絡：人工智能的構模組化塊

算法：人工智能的問題解決者

人工智能如何逐漸運作

1. 資料收集

2. 資料預處理

3、模型選擇

4. 訓練模型

5. 測試與評估

6. 模型優化

7. 部署

8. 持續學習

繼續閱讀

人工智能助手感悟親情：孫衛東博士的孤獨流浪與家庭紐帶之重要性

人工智能與外星文明，人類未來的兩個威脅，哪個會先到來？

以色列上校将中國做為假想敵，提醒防範中國的人工智能網絡攻擊

《我是領袖》AI人工智能探索未來

抓住人工智能這個“牛鼻子”，加快培育發展新質生産力

觀點｜人工智能時代博物館如何緻力于教育和研究

人工智能發展如何影響勞動力就業

2024 年十大人工智能晶片制造公司

馬斯克：給我特斯拉25%股份，否則剝離人工智能和機器人技術

中科彙聯2024第五屆科創彙聯人工智能發展高峰論壇在京圓滿落幕

科技巨頭積極布局AI領域！微軟将召開年度開發者大會，或透露人工智能PC計劃

醫學人工智能向“新”而行

李開複：預測到2027年人工智能将取代50%的工作

美國家标準與技術研究所啟動“人工智能風險和影響評估”計劃

中美十字路口下，人工智能的“加速追趕”與“何時暫停”｜BEYOND Expo 2024