語音識別距人類只差0.4%?
日前,美國一家公司宣稱專業速記員在記錄對話時,轉錄詞錯率為5.1%,而該公司最新研發的語音識別系統詞錯率已達到5.5%,超越之前的歷史最佳水平,樹立了新的里程碑。語音識別,是人工智能領域的核心問題之一,0.4%的差距似乎意味著機器即將比肩人類。
已過“甲子”之年
其實,對于人工智能子項目之一的語音識別來說,它的歷史甚至比60年還要久。
語音識別的研究源頭可追溯至1950年,計算機科學之父阿蘭·圖靈在《思想》(Mind)雜志上發表了題為“計算的機器和智能”的論文,首次提出了機器智能的概念,論文還提出了一種驗證機器是否有智能的方法:讓人和機器進行交流,如果人無法判斷自己交流的對象是人還是機器,就說明這個機器有智能了,這就是后來鼎鼎有名的人工智能圖靈測試。
圖靈測試的概念極大影響了人工智能對于功能的定義,以此為途徑,卡內基梅隆大學的兩位科學家希爾伯特·西蒙和曼紐爾·布盧姆做了大量的前期工作,非常精妙地證明了羅素《數學原理》52道中的38道。西蒙甚至宣稱在10年之內,機器就可以達到和人類智能一樣的高度。
從“模擬”人腦到開創統計方法
當20世紀50年代明確了人工智能要模擬人類智慧這一大膽目標后,這一領域經歷了近20年的輝煌。研究人員開展了一系列項目,表明計算機能夠完成一系列原本只屬于人類能力范疇之內的任務,例如證明定理、求解微積分、通過規劃來響應命令、履行物理動作,甚至是模擬心理學家心理實驗、作曲家譜曲這樣的活動。
但是,過分簡單的算法以及計算能力的限制,嚴重阻礙了人們使用人工智能來解決更加困難和多樣化的問題。
這一階段在人工智能的細分領域語音識別上,科學家們也走上了同樣的彎路。他們認為,計算機要完成語音識別這類只有人才能做的事情,必須先讓計算機理解自然語言,導致研究局限在人類學習語言的方式上了,即電腦模擬人腦,語言學者參與了大量的研究工作,但最后的成果卻近乎為零。伴隨著對未來繼續努力的失望,人工智能包括語音識別都于20世紀70年代中期逐漸淡出公眾視野。
轉機出現在統計語言學的創立上。這不得不提一個關鍵性人物——德里克·賈里尼克和他領導的IBM華生實驗室,他們創新的使用統計方法,將當時的語音識別率從70%迅速提升到90%,同時語音識別的規模從幾百個單詞上升到幾萬個單詞,使得語音識別就有了從實驗室走向實際應用的可能。
在賈里尼克之前,科學家們都把語音識別問題的核心歸結為語言學中的規則問題,而賈里尼克將它當作通信問題后,用兩個隱含馬爾可夫模型(聲學模型和語言模型)把語音識別重新概括清楚了。
這個框架結構至今仍對語音識別影響深遠,它不僅從根本上使得語音識別有使用的可能,而且奠定了今天自然語言處理的基礎。賈里尼克后來也因此當選美國工程院院士,并被某雜志評為20世紀100名發明家之一。
大進步的催化劑
在互聯網大爆發的20世紀90年代,人工智能的相關研究又一次停滯了。直到21世紀前10年,出現了一系列復興人工智能研究進程的要素,尤其是下面這些重要的因素和核心技術:
大數據。得益于互聯網、社交媒體、移動設備和廉價的傳感器,這個世界產生的數據量急劇增加。大數據是人工智能發展的助推劑,這是因為有些人工智能技術使用統計模型來進行數據的概率推算,如語音識別,通過數據的海洋中豐富的語料,使得技術不斷優化。
新算法。算法是解決一個設計程序或完成任務的路徑方法。在一個完整的工業界語音識別系統里,最關鍵的是深度學習算法,還有很多工作是專業領域相關的算法,以及海量數據收集和工程系統架構的搭建。這些算法本身很重要,同時也是其他技術的推動者,比如機器學習算法Google的TensorFlow目前就被開源使用。
可以說,任何技術都有蓄能階段和爆發階段,人工智能包括語音識別技術的爆發都得益于以上條件。這也不難理解,從語音識別來看,它是需要經驗、數據和用戶反饋共同作用來提升表現的。需要利用用戶的反饋總結出一些特點。
谷歌是最早在全球范圍內大規模使用深度學習算法的公司,也最早開創了用互聯網思維做語音識別。在這方面,科大訊飛受到谷歌的啟發,迅速跟進成為國內第一個在商用系統里使用深度學習的公司。
現有成績和待解難題一樣多
語音識別技術已經發展了幾十年,因為大數據和深度學習的應用,這一領域的傳統強者成了谷歌、亞馬遜、蘋果和微軟這些美國科技巨頭,據統計,美國至少有26家公司在開發語音識別技術,而中國則有近50家公司研究這一領域。
盡管谷歌這些巨頭在語音識別技術上的技術積累和先發優勢讓后來者似乎難以望其項背,但因為一些政策和市場方面的原因,當然也有部分原因是中文的復雜程度高于英語,所以國際巨頭的語音識別主要偏向于英語,中文領域的語音智能機會則留給了科大訊飛、百度、搜狗等中國公司。在國內,這些本土化產品更為用戶所熟知。
中文領域的識別難度在哪里?舉個簡單的例子,魯迅《孔乙己》中的孔乙己之問:茴香豆的“茴”有幾種寫法?或者一個更有時代感的案例,如何形容物流很快?據說,在漢語里回答這個問題竟然至少有3600種說法,比如第二天就到了、物流很給力、給快遞點贊等不盡其詳。盡管語音識別在近些年來取得了巨大的進步,但其實仍然還有很多的工作要做。
此外,還有確保語音識別能在更為真實生活的環境中良好地工作。這些環境包括具有很多背景噪聲的地方,比如聚會場所或在高速路上駕駛的時候;還有在多人交談環境中將不同的說話人區分開。
還有一個更深層次的難題是,如果需要實現人機對話、人機寫作,不只是需要用機器轉錄來自人類嘴巴的聲音信號,更要理解人們所說的話。
從語音識別來看,下一個前沿是從識別走向理解,真正的人工智能仍然還在遙遠的地平線上,在機器能理解其所聽到或看到的事物的真正含義之前,還需要很長時間的工作,有很長的路要走。
或許也可以說,我們正在從一個人類必須理解計算機的世界,邁向一個計算機必須理解我們的世界。亞里士多德曾說過,如果機器能干很多活,豈不能讓人類解放出來,或許這一解放的起點就是“理解”。(姜姝姝)
- 為你揭開ICU的神秘面紗
- 糖炒栗子為什么要用黑砂?
- 研究稱母海獅可憑視覺辨別其幼崽
- 想打噴嚏別忍著 傷了鼓膜劃不來
- 經典的魅力:大數學家的混沌史話
- 故宮里如何做研究
- 虛虛實實說魯班
- 為什么說 “一鴿勝九雞”
- 特斯拉發布最快電動跑車 未來也許會飛
- 多肽涂層技術突破細胞培養“瓶頸”
- 血液干細胞逆轉Ⅰ型糖尿病新療法
- 中醫治療血管性抑郁癥
- 防治流腦切莫“重少輕老”
- 羊奶為何被稱為“奶中之王”
- “和合二仙”
- “美人魚”——儒艮
- 飛天航路越千年
- 那只會敬禮的猴子
- 為什么要以地球標準去尋找地外生命
- 掰響手指容易 掰清原因很難
- 源遠流長的機器人
- 當科學與藝術相遇
- 克隆猴“姐妹”為多種疾病診療帶來希望
- 遼闊海疆守安寧 艦艏行處是長城
- 人類制造的最后一臺機器?
- 準確預報天氣還是件挺難的事
- 北豆腐南豆腐和內酯豆腐哪種營養價值更高
- 呵護你的小心肝兒 別讓脂肪霸占
- 山桃一枝報春來
- “春捂”得法 可有效減少發病幾率
- 腿上的“小蚯蚓”
- 點數鈔票或是心靈慰藉強心針
- 太陽要變“冷美人”
- 這10種病都犯在一個“飽”字上!
- 心臟為何很少得癌
- 用micro:bit打造區塊鏈
網友關注
- 有種自戀叫過度自責
- “和合二仙”
- 許傳森:把“泡沫”做成“面包”
- 楊軍: “開墾”太陽系外宜居星球
- 遼闊海疆守安寧 艦艏行處是長城
- 人體生物電與預防物理污染
- 山桃一枝報春來
- 防治流腦切莫“重少輕老”
- 千里之行 始于足下
- 助眠產品真能讓你睡個好覺?
- 水,這東西……
- 靠輸液預防腦卒中靠譜嗎?
- 基因真的能決定性格嗎?
- 博觀約取 厚積薄發
- 為什么要以地球標準去尋找地外生命
- 當科學與藝術相遇
- 南仁東:“一口氣”領中國邁向星辰大海
- 廉價藥去哪兒了 大數據或可出力
- 為你揭開ICU的神秘面紗
- 漫長歲月,鳥類怎么搞丟了牙
- 呵護你的小心肝兒 別讓脂肪霸占
- 他走了,留給未來四千萬顆種子
- 兩害相權取其輕
- 一顆鄰近恒星有4顆類似地球大小的行星
- 中醫治療血管性抑郁癥
- 源遠流長的機器人
- 電梯驚魂為何源源不斷?安全乘坐你需要知道這些
- 吃花膠補膠原蛋白嗎?真相是:還不如吃雞蛋!
- 心臟為何很少得癌
- 將“快樂教育” 融入車模教學之中
- 植物學家鐘揚:他給未來留下科學的種子
- 關燈玩手機可能誘使青光眼發作
- 世界一流的民辦大學會是什么樣
- 南北半球冰火兩重天 地球到底怎么了?
- 血壓高,準備10個問題去看病
- 動物衛士劉秀梵:“擒”病于未然
- 點數鈔票或是心靈慰藉強心針
- 首個實體商業數字化開放平臺誕生
- 去非洲旅行要警惕哪些“怪病”
- “美人魚”——儒艮
- 模擬聯合國活動學習資料
- 牙膏牙刷品種多 怎么買有講究
- 黃士松:慧眼識風云
- 不緊跟前車可減少“幽靈堵車”
- 為什么混血兒的相貌更好看?
- 血液干細胞逆轉Ⅰ型糖尿病新療法
- 這10種病都犯在一個“飽”字上!
- 掰響手指容易 掰清原因很難
- 防治流行性感冒從日常做起
- 許映龍: 破譯臺風密碼
- 克隆猴“姐妹”為多種疾病診療帶來希望
- 四瓶礦泉水重量背起就走 “空調背心”投放市場
- 陳慶:“土專家”的猿情
- 打破物理規律的怪石頭
- 那只會敬禮的猴子
- 北豆腐南豆腐和內酯豆腐哪種營養價值更高
- 能不能吃“苦” 基因說了算
- 腿上的“小蚯蚓”
- 想打噴嚏別忍著 傷了鼓膜劃不來
- 獵豹為什么跑得快
- 海量支付 網聯平臺兜得住嗎
- 你經常被負面情緒困擾嗎?
- 故宮“掌門人”談遺產如何重塑生活
- 人類制造的最后一臺機器?
- 準確預報天氣還是件挺難的事
- 多肽涂層技術突破細胞培養“瓶頸”
- 太陽要變“冷美人”
- “春捂”得法 可有效減少發病幾率
- 研究稱母海獅可憑視覺辨別其幼崽
- 羊奶為何被稱為“奶中之王”
- 特斯拉發布最快電動跑車 未來也許會飛
- 為啥總覺得餓? 都是激素惹的禍
- 為什么說 “一鴿勝九雞”
- 糖炒栗子為什么要用黑砂?
- 用micro:bit打造區塊鏈
- 飛天航路越千年
- 經典的魅力:大數學家的混沌史話
- 虛虛實實說魯班
- 新血液檢測法能診斷多種早期癌癥
- 故宮里如何做研究
- 細菌基因擴散將會帶來什么后果
精品推薦
- 臨夏州05月30日天氣:小雨轉中雨,風向:東北風,風力:<3級,氣溫:26/15℃
- 澳門05月30日天氣:多云,風向:無持續風向,風力:<3級,氣溫:33/28℃
- 木壘縣05月30日天氣:陰轉多云,風向:西北風,風力:3-4級,氣溫:17/9℃
- 鹽城市05月30日天氣:陰,風向:東北風,風力:<3級,氣溫:23/19℃
- 大豐市05月30日天氣:陰,風向:東北風,風力:<3級,氣溫:23/19℃
- 溫泉縣05月30日天氣:晴,風向:無持續風向,風力:<3級,氣溫:22/6℃
- 策勒縣05月30日天氣:陰,風向:無持續風向,風力:<3級,氣溫:26/13℃
- 城中區05月30日天氣:小雨轉中雨,風向:東風,風力:3-4級,氣溫:24/10℃
- 高雄市05月30日天氣:陰,風向:無持續風向,風力:<3級,氣溫:34/26℃
- 臺中市05月30日天氣:多云轉陰,風向:北風,風力:3-4級轉<3級,氣溫:33/24℃