天天看點

為什麼計算機能聽懂人的指令,為什麼計算機有聽懂指令的能力?

當你坐在計算機前,機械地敲擊鍵盤,逐個地輸入字元, 你可能會有一種與“啞巴”在對話的感覺。如今,一種全新的聲音控制計算機的方式進入了人們的生活。例如,當一個總經理上班,到了辦公室門口,他對着門喊一聲“開門”,辦公室門自動打開。進了門說一聲“請各部門經理立即到會議室開會”,五分鐘之内,各部門的經理都來到了會議室。

這是怎麼一回事呢?原來,安裝在總經理辦公室的一 台計算機能聽懂總經理的話,是它指揮門和電話語音系統作出了反應。為了能更加友善、自由地和計算機“對話”,計算機工作者早就着手研究如何使人能夠通過語言與計算機進行直接的對話。人與機器進行對話,首先就是要讓機器能夠聽懂人的語言,并且按照人的指令處理一系列的事務,最後将執行的結果以語言的形式通知有關的人。

使計算機能夠聽懂人類的語言,必須要有一套複雜的軟、硬體裝置來支援,它必需包括語音分析器、存儲器以及有關的控制電路等基本部件。話筒獲得語音資訊後,把語音送入語音分析器,語音分析器提取必要的語音資訊參數,并與存儲器中的标準語音進行比對,如能比對成功,則計算機了解(識别)了該語音資訊,并 作出相應的響應。

一般的語音識别系統都有學習的功能,使用者可以訓練它。比如,電話局可為行動電話使用者提供一種語音撥号系統。使用者可先訓練一下自己的電話機,把經常要撥的電話号碼及 對方姓名對着電話機念上三遍。以後再用時,隻要按一個鍵開啟系統,然後報出對方姓名和号碼,即可自動接通。

這種移動 電話語音識别系統的設計原理是:計算機系統中的語音庫将使用者首次讀入的姓名和電話号碼制成标準語音樣本,以後每次使用時,都将用聲音輸入的姓名和号碼與庫中的語音樣本 進行比較,如一緻,則接通相應的電話。語音識别的對象分為三個層次。首先是對單音節的識别,然後是對單詞的識别,進而是對符合某種規則的語句的了解。

在現實世界中,任何兩個人的發音不可能完全相同,甚至 同一個人說一個字也不總是以同一種語言、語調來說。另外,同一個單詞又可能有不同的含義。這就使計算機難以令人滿 意地了解自然語言。目前大多數語言了解系統十分簡單,往往帶有很大的限制,離真正的了解還有很大的差距,有待進一步研究。

全部