智能手機語音應(yīng)用Dragon(騰訊科技配圖)
騰訊科技訊(清雨)北京時間3月21日消息,據(jù)國外媒體報道,國外媒體日前發(fā)表分析文章稱,語音識別軟件開發(fā)商Nuance通信公司除開發(fā)了蘋果語音助手Siri外,還推出了一款智能手機語音應(yīng)用Dragon,這項應(yīng)用支持多種語言,但在漢語普通話的應(yīng)用上,聲調(diào)成了這項應(yīng)用面臨的最大挑戰(zhàn)。
以下是文章全文:
在期待著蘋果今年推出中文版Siri的同時,我決定試用一下Nuance開發(fā)的另一款智能手機語音應(yīng)用Dragon,這項語音應(yīng)用支持多種語音,包括漢語普通話。
盡管與其他多數(shù)語音識別軟件一樣,中文版Dragon無法達(dá)到百分之百的準(zhǔn)確,但是總的來說表現(xiàn)還是相當(dāng)驚人的。首先,漢語的聲調(diào)對語音識別來說極具挑戰(zhàn)性,漢語普通話僅有400個單章節(jié)發(fā)音,是按照聲調(diào)來區(qū)分不同單詞的。這會意味著什么呢?
以媽媽的“媽”為例,“媽”字讀一聲“mā”,讀四聲就是“罵”(mà),讀三聲則為“馬”(mǎ),而所有這些字的發(fā)音都像“ma”,只是聲調(diào)不同,所表示的意思也是大相徑庭。開發(fā)一款能夠識別“媽媽罵馬”(māmā mà mǎ)的句子的軟件是件非常困難的事。
盡管漢語普通話是中國的國語,但是漢語有七大方言和無數(shù)的地方口音。Nuance負(fù)責(zé)Dragon應(yīng)用開發(fā)的副總裁吉姆•吳(Jim Wu)表示:“在中國大陸,每個人都有不同的口音,我們所面臨的挑戰(zhàn)之一就是確保該語音識別系統(tǒng)能夠識別那些說普通話且口音較輕的用戶的語音。”
Nuance總部位于美國馬薩諸塞州伯靈頓,公司2011財年實現(xiàn)營收14億美元。Nuance在推出英文版Dragon 應(yīng)用后不久,便于2011年3月推出了兩款免費的漢語普通話版Dragon應(yīng)用,6月份又推出了廣東話和臺灣話版的Dragon應(yīng)用。Dragon Dictation應(yīng)用可以轉(zhuǎn)錄文本、電子郵件、Facebook和Twitter信息。Dragon Search應(yīng)用則可以用于互聯(lián)網(wǎng)搜索。與Siri不同,Dragon無法與用戶實現(xiàn)互動。
使用Dragon應(yīng)用時,用戶需要點擊一個虛擬“按鈕”來開始和停止錄音。Nuance首席營銷官彼得•馬奧尼(Peter Mahoney)表示,所有處理都是在服務(wù)器上進行的,用戶的語音信息是在被傳輸?shù)椒?wù)器上后,由服務(wù)器來收聽、錄制,然后將文本信息傳回到設(shè)備上的。
對于像“最近的星巴克咖啡廳在哪里”和“我要去市場”這樣的一些基本語句,Dragon識別起來沒有什么問題。但對于許多用戶來說,真正的樂趣是測試設(shè)備的識別極限,看看這項技術(shù)能夠在多大程度上匹配人類的語言和思想。因此,我用漢語繞口令來挑戰(zhàn)Dragon應(yīng)用的極限:媽媽騎馬,馬慢,媽媽罵馬。這句話的發(fā)音就是“Māmā qí mǎ, mǎ màn, māmā mà mǎ”。Dragon能夠捕捉到大部分正確的發(fā)音,但是并不能給出正確的單詞。Dragon給出的結(jié)果是:媽媽起碼,媽媽媽媽嗎?嗎?,這里面的一個問題就是這些單詞的發(fā)音都是“ma”。
馬奧尼表示,盡管Dragon還不能完全準(zhǔn)確地識別語音,但是這項應(yīng)用具備自主學(xué)習(xí)和改進的功能。由于所有語音處理都是在服務(wù)器上進行的,因此Dragon收集用戶語音數(shù)據(jù)來學(xué)習(xí)語言的結(jié)構(gòu)和詞語的組合。Dragon還習(xí)慣每個用戶的地方口音,因此使用越多,Dragon識別語音就越準(zhǔn)確。馬奧尼還表示:“這些錄音將保存下來,我們可以使用自動化工具對結(jié)果進行分析。有時候,你需要用錄音讓人們進行對比,看看怎樣才能做得更好。”
4月14日,在青島萬達(dá)艾瑪酒店,沉寂了一年時間的劉耀平重新回歸...
家電中國網(wǎng):老板電器作為中國廚電行業(yè)的第一品牌,售后服務(wù)是如...
Copyright © 2013 Power By Eforces All Rights Reserved 遼ICP備2025046929號 網(wǎng)站建設(shè):易勢科技
家電中國網(wǎng) 版權(quán)所有