汽車要實(shí)現(xiàn)真正的無人駕駛,它必須能夠感知和識(shí)別周圍的物體,并且要知道自己的確切位置。這兩方面都是無人駕駛技術(shù)的核心。英國(guó)劍橋大學(xué)的一個(gè)團(tuán)隊(duì)利用圖像識(shí)別和深度學(xué)習(xí)技術(shù)在這兩個(gè)方面取得了一定的突破。
他們針對(duì)這兩個(gè)方面分別研發(fā)了SegNet系統(tǒng)和PoseNet系統(tǒng)。盡管它們目前還不能控制無人駕駛汽車,但是它們能讓機(jī)器“看見”,精確定位和識(shí)別所看之物,這種能力是開發(fā)自動(dòng)駕駛汽車和機(jī)器人的關(guān)鍵因素。在無人駕駛汽車對(duì)周邊物體的感知方面,傳統(tǒng)的思路是使用雷達(dá)傳感器,或雷達(dá)與LIDAR(一種遙感技術(shù))相結(jié)合的設(shè)備,但是這些設(shè)備價(jià)格非常高,所有設(shè)備加起來甚至比整輛車還貴。這對(duì)于無人駕駛技術(shù)的快速發(fā)展非常不利。
劍橋大學(xué)研發(fā)團(tuán)隊(duì)的SegNet系統(tǒng)避開了這些昂貴的設(shè)備,利用傳統(tǒng)的相機(jī)來實(shí)現(xiàn)對(duì)周圍物體的識(shí)別。它能拍下街景照片,實(shí)時(shí)將照片中的物體分成12個(gè)類別,例如路面、路標(biāo)、行人、建筑物和騎自行車的人等。它能應(yīng)對(duì)不同的光照和陰影條件,以及夜間環(huán)境,標(biāo)記像素的準(zhǔn)確度達(dá)到90%以上。
研究人員運(yùn)用了深度學(xué)習(xí)的技術(shù)來訓(xùn)練SegNet系統(tǒng),希望它能在更復(fù)雜的環(huán)境及氣候條件下能識(shí)別出物體。劍橋大學(xué)的一組本科生手工標(biāo)記了5000張圖片中的所有像素,研究人員利用這5000張圖片訓(xùn)練了SegNet,再進(jìn)行測(cè)試,效果很不錯(cuò)。
SegNet訓(xùn)練的數(shù)據(jù)大多是高速公路或城市環(huán)境,而對(duì)鄉(xiāng)村、雪天和沙漠還缺乏足夠的訓(xùn)練——不過它在測(cè)試中對(duì)這些環(huán)境的成績(jī)也不錯(cuò)。
這個(gè)系統(tǒng)目前還不能直接用于無人駕駛汽車或卡車,但是它可以用于警示系統(tǒng),與目前一些轎車上所使用的防撞技術(shù)相類似。
對(duì)于機(jī)器學(xué)習(xí)來說,數(shù)據(jù)庫(kù)是比較關(guān)鍵的,利用越多的數(shù)據(jù)對(duì)其進(jìn)行訓(xùn)練,其精確度就會(huì)更高。
PoseNet系統(tǒng)和SegNet系統(tǒng)相似,都需要對(duì)圖像進(jìn)行識(shí)別。PoseNet系統(tǒng)是一個(gè)可以根據(jù)拍攝的照片進(jìn)行精確定位的系統(tǒng),該系統(tǒng)通過一張224x224RGB的圖像識(shí)別出用戶的位置和方向。
這個(gè)系統(tǒng)定位的精確度可以達(dá)到:室外環(huán)境下,精確度為2m和3°;室內(nèi)環(huán)境下,精確度為0.5m和5°。相較于GPS定位,這個(gè)精確度要高出許多,并且PoseNet系統(tǒng)克服了GPS的弱點(diǎn):在沒有信號(hào)的地方,例如室內(nèi)、隧道或GPS信號(hào)不好的城市,GPS無法定位。這些對(duì)于PoseNet都不是問題。與SegNet系統(tǒng)一樣,PoseNet系統(tǒng)也需要深度訓(xùn)練,以及強(qiáng)大的數(shù)據(jù)庫(kù)支持。PoseNet團(tuán)隊(duì)成員Kendall說:“近年來,人工智能和機(jī)器人的發(fā)展非常迅速。而我們團(tuán)隊(duì)最酷的地方就在于開發(fā)了一個(gè)使用深度學(xué)習(xí)的技術(shù)來識(shí)別你的位置和周圍的物品——這是深度學(xué)習(xí)第一次被用來做這樣的事。”
更多資訊請(qǐng)關(guān)注汽車制造頻道