系統(tǒng)之家 - 系統(tǒng)光盤下載網(wǎng)站!

當(dāng)前位置:系統(tǒng)之家 > IT快訊 > 詳細(xì)頁面

連微軟都想避而不談的功能:Win10語音識(shí)別

編輯:zhanghong 2016-10-09 16:20:07 來源于:互聯(lián)網(wǎng)

  Win10系統(tǒng)已經(jīng)推出一年多了,在這期間,微軟不斷的為Win10系統(tǒng)添加了諸多實(shí)用的功能,在這種環(huán)境下,你覺得Win10系統(tǒng)中會(huì)有“雞肋”的功能嗎?答案是有的,在Win10系統(tǒng)中存在一個(gè)連微軟都想避而不談的功能,那就是Win10語音識(shí)別功能。

連微軟都想避而不談的功能:Win10語音識(shí)別

  據(jù)PCWorld 網(wǎng)站報(bào)道,Windows有一項(xiàng)微軟不愿意提及的功能。雖然Windows可以讓用戶使用觸控筆“寫寫畫畫”,借助Windows Hello利用臉部登錄系統(tǒng)(或保護(hù)Web安全),甚至命令小娜設(shè)置提醒事項(xiàng),但它明顯不想讓用戶使用的一項(xiàng)功能是,利用其語音識(shí)別引擎對(duì)系統(tǒng)發(fā)號(hào)施令或讓用戶利用語音輸入編輯文檔。

  微軟不大力宣揚(yáng)Windows語音識(shí)別功能的原因可以追溯到10年前,當(dāng)時(shí)微軟產(chǎn)品經(jīng)理謝恩·博切(Shanen Boettcher)在演示W(wǎng)indows Vista的語音輸入功能時(shí)搞砸了。之后Windows的語音輸入技術(shù)一直相當(dāng)“低調(diào)”,目前幾乎沒有用戶知道Windows有語音輸入功能。

  如果說Windows有機(jī)會(huì)再戰(zhàn)語音輸入領(lǐng)域,目前似乎是個(gè)時(shí)機(jī)——計(jì)算機(jī)和人工智能的進(jìn)展為語音輸入提供了好得多的基礎(chǔ)。

  在被問及語音輸入技術(shù)在Office中的未來時(shí),微軟負(fù)責(zé)語音識(shí)別研究以及小娜和必應(yīng)的執(zhí)行副總裁哈里·舒姆(Harry Shum)表示,“這是一個(gè)重大問題。語音輸入沒有扮演更重要的角色是不可理解的。”

  語音識(shí)別不完美的原因

連微軟都想避而不談的功能:Win10語音識(shí)別

  部分用戶仍然認(rèn)為語音輸入還是《杜恩斯比利》(Doonesbury)系列漫畫中蘋果牛頓 PDA的水平,把用戶說的“I am writing a test sentence”,聽為“Siam fighting atomic sentry”。用戶有這種想法是可以原諒的:Windows語音識(shí)別功能仍然采用微軟Speech Recognizer 8.0技術(shù),自Vista以來,這一技術(shù)就基本上沒有什么變化。舒姆稱之為“祖父”級(jí)技術(shù)。

  PCWorld表示,但硬件已經(jīng)發(fā)生了很大變化:聽和解釋語音要求的處理能力遠(yuǎn)低于10年前。surface Book等PC產(chǎn)品中的集成式麥克風(fēng)陣列的質(zhì)量,意味著無需使用專用麥克風(fēng)語音識(shí)別就可以達(dá)到很高的準(zhǔn)確率。只是,語音輸入技術(shù)的發(fā)展已經(jīng)適合大眾使用了嗎?

  在使用語音輸入軟件輸入長(zhǎng)度為1028個(gè)單詞的文章時(shí),95%的準(zhǔn)確率意味著用戶必須修正逾15個(gè)錯(cuò)誤。在測(cè)試中,Windows語音輸入準(zhǔn)確率為93.6%,從理論上說這一數(shù)值并不高,低于測(cè)試的其他專用語音輸入軟件。Windows有個(gè)奇怪的習(xí)慣,在輸入逗號(hào)時(shí),它會(huì)在文檔中插入“comma”(逗號(hào))這個(gè)詞匯。語音輸入社區(qū)似乎對(duì)這類相對(duì)較小的失誤是否有重要影響有不同看法。

  當(dāng)然,這還不是全部。使用過語音輸入軟件的人都知道,準(zhǔn)確率的關(guān)鍵是訓(xùn)練。隨著時(shí)間推移,語音輸入軟件會(huì)了解用戶口音,“apricot”中“a”的發(fā)音與“bad”還是“ape”中的“a”相同,和如何過濾無意識(shí)的痙攣性語言障礙。微軟員工曾聲稱,經(jīng)過適當(dāng)訓(xùn)練,Windows語音識(shí)別技術(shù)的準(zhǔn)確率可以達(dá)到99%。1000個(gè)單詞出現(xiàn)10個(gè)錯(cuò)誤還不算太壞。

  很少有用戶愿意花時(shí)間訓(xùn)練使用語音識(shí)別軟件。Windows語音識(shí)別軟件,要求用戶用10分鐘時(shí)間訓(xùn)練數(shù)個(gè)句子,會(huì)讓用戶有度日如年的感覺。小娜和Siri不要求用戶進(jìn)行訓(xùn)練,那是因?yàn)樗鼈円呀?jīng)被訓(xùn)練了數(shù)以百萬計(jì)的語音樣本。

  小娜(可以在PC和手機(jī)上使用)在語音識(shí)別方面表現(xiàn)遠(yuǎn)優(yōu)于Windows語音輸入系統(tǒng)的原因是,它利用了微軟云服務(wù)的計(jì)算能力。微軟會(huì)對(duì)用戶的語音進(jìn)行分析,使用戶語音與其其他數(shù)據(jù)相關(guān)聯(lián),生成作為小娜靈魂的智能。

  微軟重視語音識(shí)別

連微軟都想避而不談的功能:Win10語音識(shí)別

  鑒于小娜的出色表現(xiàn),用戶會(huì)認(rèn)為語音應(yīng)當(dāng)成為上周微軟Ignite會(huì)議的中心。但I(xiàn)gnite期間沒有任何與語音輸入有關(guān)的會(huì)議,只有一次會(huì)議與語音識(shí)別有關(guān)。微軟首席執(zhí)行官薩蒂亞·納德拉(Satya Nadella)在主旨演講中把語音識(shí)別稱作是微軟未來的關(guān)鍵元素。

  以Skype Translator為例。據(jù)納德拉稱,Skype Translator依賴三個(gè)方面的研究:語音識(shí)別、語音合成和機(jī)器翻譯。在演講中,納德拉稱微軟語音識(shí)別算法的誤字率為6.9%,這是一個(gè)糟糕的成績(jī):準(zhǔn)確率僅為93.1%。PCWorld稱,如果微軟真正看好辦公軟件,語音識(shí)別在PC中的未來不僅僅是利用Skype在孟加拉國(guó)訂賓館,而是撰寫體驗(yàn),不過是通過語音而非手指。

  對(duì)于這個(gè)微軟不愿提及的功能,能夠“存活”到現(xiàn)在已經(jīng)很不容易了,不過微軟沒有將這個(gè)功能移除掉,說明微軟還覺得這個(gè)功能還能繼續(xù)完善,不過什么時(shí)候去完善這個(gè)就得看微軟的計(jì)劃了。

標(biāo)簽 Windows10

發(fā)表評(píng)論

0

沒有更多評(píng)論了

評(píng)論就這些咯,讓大家也知道你的獨(dú)特見解

立即評(píng)論

以上留言僅代表用戶個(gè)人觀點(diǎn),不代表系統(tǒng)之家立場(chǎng)

官方交流群 軟件收錄