如今,人機(jī)交互技術(shù)應(yīng)用潛力開(kāi)始凸顯,比如智能手機(jī)配備空間跟蹤技術(shù),應(yīng)用于虛擬現(xiàn)實(shí)、遙控機(jī)器人及遠(yuǎn)程醫(yī)療等的觸覺(jué)交互技術(shù),對(duì)于有語(yǔ)言障礙的人士的無(wú)聲語(yǔ)音識(shí)別,還有各種創(chuàng)新技術(shù),如指紋識(shí)別、TDDI、壓力觸控技術(shù)等,現(xiàn)在都比較熱門(mén)。
在車(chē)聯(lián)網(wǎng)領(lǐng)域的人機(jī)交互,特別是語(yǔ)音交互技術(shù)應(yīng)用越來(lái)越明顯,智能后視鏡、HUD、車(chē)機(jī)、車(chē)載音箱以及中控系統(tǒng),都紛紛加入了語(yǔ)音交互系統(tǒng)。在車(chē)聯(lián)網(wǎng)以及車(chē)上的人機(jī)交互,其實(shí)是一個(gè)非常重要的業(yè)務(wù)方向,在這個(gè)方向上,思必馳一直專(zhuān)注在車(chē)聯(lián)網(wǎng)的一些人機(jī)交互以及第三方內(nèi)容的服務(wù)平臺(tái)整合。那么在車(chē)載環(huán)境下語(yǔ)音技術(shù)的應(yīng)用,到底應(yīng)該關(guān)注些什么?對(duì)此,電子發(fā)燒友針對(duì)車(chē)聯(lián)網(wǎng)中的人機(jī)交互與后端服務(wù)采訪(fǎng)了思必馳副總裁雷雄國(guó)。
針對(duì)語(yǔ)音標(biāo)配問(wèn)題,思必馳副總裁雷雄國(guó)談到,手機(jī)的標(biāo)配是觸控,智能手機(jī)的標(biāo)配是觸控,從交互模式上來(lái)看,語(yǔ)音交互是從觸控到語(yǔ)言的交互,這個(gè)是一個(gè)方面;另一方面,未來(lái)很多的交互會(huì)依托與它的硬件形態(tài),也就是現(xiàn)在很多人說(shuō)手機(jī)未來(lái)會(huì)多少年會(huì)消失,但是從真正科技發(fā)展的角度來(lái)看,包括現(xiàn)在物聯(lián)網(wǎng)整個(gè)的興起,很多新奇的硬件都會(huì)智能化,這時(shí)候各種各樣的手背其實(shí)并沒(méi)有屏幕的,而交互的核心目的是希望在這些硬件上面獲取一些信息、功能,通過(guò)硬件顯然是不能滿(mǎn)足,在這樣一個(gè)發(fā)展情勢(shì)下,語(yǔ)音一定會(huì)成為標(biāo)配。
從交互的角度來(lái)看,在接下來(lái)的車(chē)載智能化的過(guò)程中,語(yǔ)音僅僅是占人機(jī)交互其中的一個(gè)環(huán)節(jié)。雷雄國(guó)指出,希望能看到更多的交互跟語(yǔ)音結(jié)合在一起,包括體感、手勢(shì)、圖象等等一系列的人工智能的技術(shù)能夠迅速進(jìn)入到車(chē)內(nèi),并有多個(gè)在實(shí)際車(chē)載里面應(yīng)用的多模態(tài)技術(shù)。
語(yǔ)音交互中難點(diǎn)該如何攻克
在談?wù)撥?chē)載語(yǔ)音怎么去用,交互怎么去做的時(shí)候,作為一家語(yǔ)音技術(shù)的廠(chǎng)商思必馳,更多關(guān)注的是語(yǔ)音到底能解決什么問(wèn)題,以及在目前的應(yīng)用過(guò)程中,語(yǔ)音技術(shù)還有那些難點(diǎn)需要去攻克?對(duì)此,雷雄國(guó)分享了三點(diǎn)。
第一,噪聲環(huán)境。噪音環(huán)境非常重要,需要得到非常好的解決,能夠在車(chē)載的環(huán)境下,把噪聲問(wèn)題解決掉是人機(jī)交互第一步的基礎(chǔ)。在解決這個(gè)問(wèn)題的時(shí)候,有一大類(lèi)的方向是包括在出現(xiàn)錯(cuò)誤的時(shí)候,允許糾正打斷;包括對(duì)一些車(chē)載噪聲以及環(huán)境噪聲的抑制自適應(yīng);包括在實(shí)際車(chē)的設(shè)備在播放一些音樂(lè)或者聲音的時(shí)候,能夠隨時(shí)的打斷它等等這些;
第二,智能交互。在交互的過(guò)程中,其實(shí)很多的交互只是提到了語(yǔ)音識(shí)別,這方面事實(shí)上用戶(hù)體驗(yàn)非常不好,它其實(shí)更多的包括人工智能的核心技術(shù)引進(jìn),包括跟車(chē)內(nèi)業(yè)務(wù)的整合,使得車(chē)內(nèi)的人機(jī)語(yǔ)音交互能達(dá)到更高的用戶(hù)體驗(yàn),這里面就包括一些對(duì)于語(yǔ)音理解,以及人機(jī)多人的交互對(duì)話(huà),基于任務(wù)式的深度的交互理解;
第三,更貼合用戶(hù)需求的產(chǎn)品設(shè)計(jì)。經(jīng)過(guò)多年跟一線(xiàn)客戶(hù)的交流得出非常重要的一點(diǎn),其實(shí)很多時(shí)候技術(shù)上可能達(dá)到了一定的階段,事實(shí)上需要上下游合作伙伴一塊來(lái)針對(duì)車(chē)聯(lián)網(wǎng)的產(chǎn)品進(jìn)行多方位、多層次的結(jié)合跟設(shè)計(jì),這里面需要產(chǎn)品方、技術(shù)方,甚至需要廠(chǎng)商一塊來(lái)配合。
交互核心在車(chē)?yán)锩娼换ケ容^重要的一塊,就是回音消除。雷雄國(guó)表示,產(chǎn)品設(shè)計(jì)是全方位的,可以從三個(gè)角度來(lái)看。
其一,對(duì)于在車(chē)內(nèi)環(huán)境下面,其實(shí)很多車(chē)主在開(kāi)車(chē)的過(guò)程中都會(huì)開(kāi)啟背景音樂(lè),在背景音樂(lè)開(kāi)啟的情況下在做其它的操作,這時(shí)候其實(shí)是需要有這種背景音樂(lè)的情況下去打斷他,這時(shí)候事實(shí)上麥克風(fēng)跟喇叭的一些結(jié)構(gòu)的設(shè)計(jì),產(chǎn)品在這一塊需要做些配合,這是其中一個(gè);
其二,對(duì)于語(yǔ)音技術(shù)怎么樣跟業(yè)務(wù)結(jié)合,怎么樣跟導(dǎo)航結(jié)合,怎么樣把第三方的音樂(lè)資源對(duì)接得更加地緊密、無(wú)縫,這里面也需要投入大量的產(chǎn)品設(shè)計(jì)以及開(kāi)發(fā)去做,把它的用戶(hù)體驗(yàn)做到極致;
其三,就是在目前的車(chē)的環(huán)境我們能夠提供的相對(duì)更加聚焦,所以把導(dǎo)航、電臺(tái)、第三方路礦等等跟車(chē)主相關(guān)的第三方服務(wù)整合在一塊,這是非常重要的點(diǎn)。
圍繞著這些,思必馳在對(duì)語(yǔ)音識(shí)別的交互技術(shù)上做了一些上下游合作伙伴的整合,這個(gè)是在技術(shù)導(dǎo)航這一塊,跟百度、高德、海立德一系列的市面上主流的廠(chǎng)商都做了深度的整合。在實(shí)際很多的車(chē)載使用場(chǎng)景,其實(shí)都能交互,能夠讓用戶(hù)真正的實(shí)現(xiàn)全程語(yǔ)音交互,也就是他不需要在開(kāi)車(chē)的過(guò)程中中間再去結(jié)合手觸屏的交互結(jié)束任務(wù),這是非常重要的方面。
為車(chē)聯(lián)網(wǎng)打造了AIOS系統(tǒng)
談到操作系統(tǒng)上,雷雄國(guó)表示,思必馳在車(chē)聯(lián)網(wǎng)領(lǐng)域打造了一個(gè)AIOS,它是一個(gè)后操作系統(tǒng),實(shí)際上也不是一個(gè)操作系統(tǒng),只是把語(yǔ)音交互,包括內(nèi)容服務(wù)等等這些整合在一塊,能夠迅速地讓第三方能夠把車(chē)聯(lián)網(wǎng)的整個(gè)語(yǔ)音交互給做起來(lái)的這么一個(gè)后操作系統(tǒng)。AIOS主要有四大特色。
1、內(nèi)置智能語(yǔ)音交互:最先進(jìn)的智能對(duì)話(huà)交互技術(shù),彌補(bǔ)傳統(tǒng)操作系統(tǒng)在自然語(yǔ)音和語(yǔ)音交互上的缺失;
2、支持主流操作系統(tǒng):可定制型智能交互中間系統(tǒng),運(yùn)行于主流操作系統(tǒng)上的侯操作系統(tǒng),支持Android、QNX、Linux等;
3、快速集成支持定制:支持快速集成和自定義開(kāi)發(fā),只需要簡(jiǎn)單的業(yè)務(wù)層接口集成即可封裝出貨;
4、集成豐富內(nèi)容服務(wù):除了強(qiáng)大的語(yǔ)音交互功能外,還能提供廣泛的第三方內(nèi)容集成服務(wù)。
雷雄國(guó)補(bǔ)充道,思必馳目前除了AIOS之外,還有針對(duì)機(jī)器人以及智能家居的整套解決方案,AIOS里面有一系列的核心技術(shù),AI這一塊,對(duì)于合作伙伴和用戶(hù)來(lái)說(shuō)它并不是特別關(guān)注,對(duì)于語(yǔ)音技術(shù)絲毫不了解的開(kāi)發(fā)者來(lái)說(shuō),并不影響他去使用整個(gè)語(yǔ)音交互的功能,OS這一塊,把這些功能做一系列模塊化的組建,在每一個(gè)客戶(hù)有一些定制需求的時(shí)候,能夠做到自己去做定制開(kāi)發(fā),所以這給用戶(hù)和開(kāi)發(fā)者留下非常差異化的實(shí)現(xiàn)方式。
另外,第三方服務(wù)包括地圖類(lèi)的、影印類(lèi)以及第三方的基于O2O的服務(wù),目前思必馳都已經(jīng)把這些服務(wù)接進(jìn)來(lái)。雷雄國(guó)表示,目前希望在這些平臺(tái)上接入更多合作伙伴關(guān)于車(chē)的服務(wù),除了智能車(chē)載,還有智能家居和機(jī)器人,在這兩個(gè)領(lǐng)域還有一些核心技術(shù),其實(shí)包括原廠(chǎng)的識(shí)別,包括回音消除以及聲源定位等等相關(guān)技術(shù),這些技術(shù)在整個(gè)的交互過(guò)程中會(huì)扮演著非常重要的角色。
從目前第三方合作內(nèi)容的上面來(lái)看,思必馳也是一個(gè)非常開(kāi)放的心態(tài)。雷雄國(guó)強(qiáng)調(diào),思必馳希望能夠與跟更多的第三方內(nèi)容服務(wù)方合作,把語(yǔ)音交互做得可以提供每一個(gè)內(nèi)容服務(wù),也可以從語(yǔ)音交互都能夠關(guān)注到內(nèi)容服務(wù),達(dá)到?jīng)]有雙手交互的情況下也能傳遞給車(chē)主用戶(hù)。
更多資訊,請(qǐng)關(guān)注人機(jī)界面頻道。