技術(shù)員聯(lián)盟提供win764位系統(tǒng)下載,win10,win7,xp,裝機(jī)純凈版,64位旗艦版,綠色軟件,免費(fèi)軟件下載基地!

當(dāng)前位置:主頁 > 教程 > win10教程 >

Win10語音輸入怎么樣

來源:技術(shù)員聯(lián)盟┆發(fā)布時(shí)間:2018-05-23 06:14┆點(diǎn)擊:

  Win10語音輸入怎么樣

據(jù)PCWorld網(wǎng)站報(bào)道,Windows有一項(xiàng)微軟不愿意提及的功能。雖然Windows10可以讓用戶使用觸控筆“寫寫畫畫”,借助Windows Hello利用臉部登錄系統(tǒng)(或保護(hù)Web安全),甚至命令小娜設(shè)置提醒事項(xiàng),但它明顯不想讓用戶使用的一項(xiàng)功能是,利用其語音識別引擎對系統(tǒng)發(fā)號施令或讓用戶利用語音輸入編輯文檔。

Win10語音輸入怎么樣   三聯(lián)

  微軟不大力宣揚(yáng)Windows語音識別功能的原因可以追溯到10年前,當(dāng)時(shí)微軟產(chǎn)品經(jīng)理謝恩·博切(Shanen Boettcher)在演示W(wǎng)indows Vista的語音輸入功能時(shí)搞砸了。之后Windows的語音輸入技術(shù)一直相當(dāng)“低調(diào)”,目前幾乎沒有用戶知道Windows有語音輸入功能。

  如果說Windows有機(jī)會(huì)再戰(zhàn)語音輸入領(lǐng)域,目前似乎是個(gè)時(shí)機(jī)——計(jì)算機(jī)和人工智能的進(jìn)展為語音輸入提供了好得多的基礎(chǔ)。

  在被問及語音輸入技術(shù)在Office中的未來時(shí),微軟負(fù)責(zé)語音識別研究以及小娜和必應(yīng)的執(zhí)行副總裁哈里·舒姆(Harry Shum)表示,“這是一個(gè)重大問題。語音輸入沒有扮演更重要的角色是不可理解的。”

  1、語音識別不完美的原因:

語音識別不完美的原因

  部分用戶仍然認(rèn)為語音輸入還是《杜恩斯比利》(Doonesbury)系列漫畫中蘋果牛頓PDA的水平,把用戶說的“I am writing a test sentence”,聽為“Siam fighting atomic sentry”。用戶有這種想法是可以原諒的:Windows語音識別功能仍然采用微軟Speech Recognizer 8.0技術(shù),自Vista以來,這一技術(shù)就基本上沒有什么變化。舒姆稱之為“祖父”級技術(shù)。

  PCWorld表示,但硬件已經(jīng)發(fā)生了很大變化:聽和解釋語音要求的處理能力遠(yuǎn)低于10年前。Surface Book等PC產(chǎn)品中的集成式麥克風(fēng)陣列的質(zhì)量,意味著無需使用專用麥克風(fēng)語音識別就可以達(dá)到很高的準(zhǔn)確率。只是,語音輸入技術(shù)的發(fā)展已經(jīng)適合大眾使用了嗎?

  在使用語音輸入軟件輸入長度為1028個(gè)單詞的文章時(shí),95%的準(zhǔn)確率意味著用戶必須修正逾15個(gè)錯(cuò)誤。在測試中,Windows語音輸入準(zhǔn)確率為93.6%,從理論上說這一數(shù)值并不高,低于測試的其他專用語音輸入軟件。Windows有個(gè)奇怪的習(xí)慣,在輸入逗號時(shí),它會(huì)在文檔中插入“comma”(逗號)這個(gè)詞匯。語音輸入社區(qū)似乎對這類相對較小的失誤是否有重要影響有不同看法。

  當(dāng)然,這還不是全部。使用過語音輸入軟件的人都知道,準(zhǔn)確率的關(guān)鍵是訓(xùn)練。隨著時(shí)間推移,語音輸入軟件會(huì)了解用戶口音,“apricot”中“a”的發(fā)音與“bad”還是“ape”中的“a”相同,和如何過濾無意識的痙攣性語言障礙。微軟員工曾聲稱,經(jīng)過適當(dāng)訓(xùn)練,Windows語音識別技術(shù)的準(zhǔn)確率可以達(dá)到99%。1000個(gè)單詞出現(xiàn)10個(gè)錯(cuò)誤還不算太壞。

  很少有用戶愿意花時(shí)間訓(xùn)練使用語音識別軟件。Windows語音識別軟件,要求用戶用10分鐘時(shí)間訓(xùn)練數(shù)個(gè)句子,會(huì)讓用戶有度日如年的感覺。小娜和Siri不要求用戶進(jìn)行訓(xùn)練,那是因?yàn)樗鼈円呀?jīng)被訓(xùn)練了數(shù)以百萬計(jì)的語音樣本。

  小娜(可以在PC和手機(jī)上使用)在語音識別方面表現(xiàn)遠(yuǎn)優(yōu)于Windows語音輸入系統(tǒng)的原因是,它利用了微軟云服務(wù)的計(jì)算能力。微軟會(huì)對用戶的語音進(jìn)行分析,使用戶語音與其其他數(shù)據(jù)相關(guān)聯(lián),生成作為小娜靈魂的智能。

  2、微軟重視語音識別:

微軟重視語音識別

  鑒于小娜的出色表現(xiàn),用戶會(huì)認(rèn)為語音應(yīng)當(dāng)成為上周微軟Ignite會(huì)議的中心。但I(xiàn)gnite期間沒有任何與語音輸入有關(guān)的會(huì)議,只有一次會(huì)議與語音識別有關(guān)。微軟首席執(zhí)行官薩蒂亞·納德拉(Satya Nadella)在主旨演講中把語音識別稱作是微軟未來的關(guān)鍵元素。

  以Skype Translator為例。據(jù)納德拉稱,Skype Translator依賴三個(gè)方面的研究:語音識別、語音合成和機(jī)器翻譯。在演講中,納德拉稱微軟語音識別算法的誤字率為6.9%,這是一個(gè)糟糕的成績:準(zhǔn)確率僅為93.1%。PCWorld稱,如果微軟真正看好辦公軟件,語音識別在PC中的未來不僅僅是利用Skype在孟加拉國訂賓館,而是撰寫體驗(yàn),不過是通過語音而非手指。