楊帆先生:視覺 AI 技術(shù)落地實(shí)踐

時(shí)間:2017-12-25

來(lái)源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語(yǔ):楊帆在計(jì)算機(jī)視覺技術(shù)領(lǐng)域沉浸多年,在微軟任職期間,他主要從事計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)等領(lǐng)域的新技術(shù)孵化工作,包括人臉識(shí)別、圖像物體識(shí)別、人像三維重建等

楊帆,商湯科技聯(lián)合創(chuàng)始人、副總裁,EGO北京分會(huì)會(huì)員。作為商湯科技工程產(chǎn)品中心總負(fù)責(zé)人,在泛安防智能視頻、移動(dòng)互聯(lián)網(wǎng)、金融等行業(yè)開發(fā)和提供人工智能解決方案。憑借在計(jì)算機(jī)視覺算法產(chǎn)品化、項(xiàng)目管理、研發(fā)管理和團(tuán)隊(duì)管理方面十余年的積累和經(jīng)驗(yàn),楊帆推動(dòng)商湯科技在技術(shù)應(yīng)用商業(yè)化落地方面取得重大進(jìn)展,僅2016年就獲取了數(shù)億元的產(chǎn)品訂單。因參與創(chuàng)建商湯科技,并在短短三年內(nèi)將其打造成為人工智能領(lǐng)軍企業(yè)的突出表現(xiàn),于2016年當(dāng)選“北京市優(yōu)秀青年人才”。

以下內(nèi)容由InfoQ對(duì)楊帆先生的部分采訪整理。

“AI更大的價(jià)值在于跟不同的行業(yè)結(jié)合”

楊帆在計(jì)算機(jī)視覺技術(shù)領(lǐng)域沉浸多年,在微軟任職期間,他主要從事計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)等領(lǐng)域的新技術(shù)孵化工作,包括人臉識(shí)別、圖像物體識(shí)別、人像三維重建等;目前商湯的核心技術(shù)也是以人臉識(shí)別、智能監(jiān)控、圖像識(shí)別等為主。作為主導(dǎo)技術(shù)落地的負(fù)責(zé)人,楊帆笑稱自己是給公司的研究員們打下手的。楊帆帶領(lǐng)逾200人的工程開發(fā)團(tuán)隊(duì),在泛安防智能視頻、移動(dòng)互聯(lián)網(wǎng)、金融等行業(yè)開發(fā)和提供人工智能解決方案,推動(dòng)商湯科技在技術(shù)應(yīng)用落地方面取得重大進(jìn)展。

楊帆認(rèn)為,AI技術(shù)并非新事物,但卻在過去的兩三年集中爆發(fā),其關(guān)鍵原因就在于今天對(duì)語(yǔ)音、圖像、視頻,有了更加信息化的處理技術(shù),在各個(gè)環(huán)節(jié)上具備了更強(qiáng)的技術(shù)儲(chǔ)備。從技術(shù)到落地,AI技術(shù)所實(shí)現(xiàn)的這一切,都離不開場(chǎng)景的支持。

AI技術(shù)繼承了多種基礎(chǔ)技術(shù),在面向工業(yè)、金融、醫(yī)療、家居、自動(dòng)駕駛、安防、物流、農(nóng)業(yè)等不同應(yīng)用場(chǎng)景的解決方案,比如AI和醫(yī)療的融合應(yīng)該會(huì)體現(xiàn)在智能設(shè)備和識(shí)別診斷主要兩個(gè)方面;AI和金融的整合使金融交易和管理更加安全,實(shí)現(xiàn)精準(zhǔn)營(yíng)銷、大數(shù)據(jù)征信和普惠金融;AI和安防的融合實(shí)現(xiàn)智能監(jiān)控、安保機(jī)器人等應(yīng)用場(chǎng)景;AI、大數(shù)據(jù)等這些東西純談概念是沒有任何意義的,最終都要回歸場(chǎng)景,可復(fù)用的基礎(chǔ)技術(shù)和平臺(tái)工具固然重要,但只有落在應(yīng)用場(chǎng)景里,我們才知道其明確的價(jià)值在哪里。

業(yè)界曾出現(xiàn)一種批評(píng)的聲音,稱現(xiàn)在很多公司和開發(fā)者其實(shí)對(duì)于深度學(xué)習(xí)的運(yùn)作原理并不清楚,只知道應(yīng)用,卻不知其所以然。

楊帆表示:“學(xué)術(shù)界有兩套觀念,一套觀念說知其然不知其所以然是離經(jīng)叛道、是不對(duì)的。對(duì)于這個(gè)觀念,楊帆表示認(rèn)可,其實(shí)現(xiàn)在已經(jīng)有很多團(tuán)隊(duì),包括商湯也投入力量在進(jìn)行更加前沿、更加基礎(chǔ)性的科研,“這樣的基礎(chǔ)科研能夠指導(dǎo)我們將來(lái)在正確的方向上走得更遠(yuǎn)?!钡珬罘J(rèn)為,基礎(chǔ)研究與應(yīng)用科研,二者不可偏廢,完整的科學(xué)體系和持續(xù)的方向性指引非常重要,但是實(shí)證科學(xué)也非常重要,企業(yè)最終還是要以技術(shù)落地的結(jié)果說話?!?/p>

人臉識(shí)別大行其道,不免讓人對(duì)這項(xiàng)技術(shù)及其背后的公司產(chǎn)生了許多好奇。商湯的人臉識(shí)別技術(shù)到底有何門道?

對(duì)于這兩年非?;鸬摹八⒛槨?,開始有各種基于人臉驗(yàn)證能力的實(shí)用化場(chǎng)景。在互聯(lián)網(wǎng)信息安全方面,對(duì)于賬戶的盜用能夠更好的分析和調(diào)查,包括線上的手機(jī)端、桌面端、H5,包括定制的攝像頭。操作邏輯非常簡(jiǎn)單,最開始做刷臉的注冊(cè),現(xiàn)在刷臉的支付,手機(jī)逐漸去進(jìn)行刷臉的解鎖。在對(duì)于個(gè)人的認(rèn)證上,也有非常多的價(jià)值。人臉識(shí)別的技術(shù),可以判斷操作手機(jī)的是不是真實(shí)的人。有一個(gè)活體檢測(cè)的技術(shù)服務(wù),也包括在線下一體機(jī)的形態(tài)。對(duì)身份證的關(guān)鍵信息進(jìn)行掃描,包括對(duì)身份證內(nèi)部照片的讀取和當(dāng)前采集人之間進(jìn)行判斷?;谌讼竦纳矸菡J(rèn)證也是一個(gè)非常有價(jià)值的工作,它是一個(gè)特殊的跨行業(yè)的解決方案。這個(gè)解決方案現(xiàn)在已經(jīng)從線上到線下開始極大范圍地蔓延。對(duì)中國(guó)來(lái)說,個(gè)人公民身份信息的實(shí)名制是一個(gè)非常重要的訴求,這個(gè)訴求能夠有效地幫我們?cè)谝欢ǔ潭壬辖鉀Q互聯(lián)網(wǎng)的安全問題、解決線下的公共安全問題。所有線上的互聯(lián)網(wǎng)行業(yè)應(yīng)用,到各種線下行業(yè),包括機(jī)場(chǎng)、超市、酒店,都會(huì)有越來(lái)越多的對(duì)于個(gè)人身份信息核驗(yàn)的強(qiáng)烈需求,商湯在這方面也提供了非常完整的解決方案。

大家都關(guān)注識(shí)別正確率,在實(shí)際場(chǎng)景中正確率是否為最關(guān)鍵因素?

近幾年,很多公司在人臉識(shí)別技術(shù)上投入了大量的研發(fā)并取得了亮眼的成績(jī),其中識(shí)別率一直是各家宣傳的重點(diǎn),今年我們能在各類報(bào)道中頻繁看到各種99%、99.4%、99.8%等。雖然企業(yè)這么宣稱,但實(shí)際背后蘊(yùn)含的差異是非常大的,它會(huì)有非常多影響因素,所以準(zhǔn)確率跟行業(yè)背景以及前置假設(shè)會(huì)是一個(gè)強(qiáng)相關(guān)的關(guān)系。而不同的場(chǎng)景下取得的識(shí)別準(zhǔn)確率很難做類比。

當(dāng)識(shí)別率達(dá)到99%以后,人臉識(shí)別技術(shù)面臨的難點(diǎn)主要在于,如何在不同行業(yè)場(chǎng)景中深化這項(xiàng)技術(shù)。雖然看上去99%的識(shí)別率已經(jīng)很高了,但不同行業(yè)場(chǎng)景對(duì)于識(shí)別率的要求不同,99%可能只是該技術(shù)得以使用的入門條件;而安防場(chǎng)景下,照片模糊、有遮擋、角度不佳都給人臉識(shí)別帶來(lái)了更現(xiàn)實(shí)的挑戰(zhàn)。

“看似同質(zhì)化很強(qiáng)、很簡(jiǎn)單的人臉識(shí)別,細(xì)分的技術(shù)場(chǎng)景其實(shí)非常復(fù)雜,所以脫離場(chǎng)景去談技術(shù)是沒有太大意義的,今天能看得到的,包括以安防、手機(jī)這樣的一些重點(diǎn)行業(yè)為代表,對(duì)于真正的人臉識(shí)別技術(shù)的全面深化存在著非常多的挑戰(zhàn),值得我們?nèi)スタ??!?/p>

那么,怎樣判斷一個(gè)行業(yè)是否具有做AI場(chǎng)景的價(jià)值?如果從商湯自身說起,在做AI平臺(tái)化的進(jìn)程中,遇到過哪些挑戰(zhàn)和問題?

1、看需求

首先,需求得是真實(shí)的。楊帆舉了個(gè)具體的例子:有一個(gè)家電廠商想通過人臉識(shí)別功能,實(shí)現(xiàn)“我進(jìn)去之后這個(gè)房間自動(dòng)調(diào)節(jié)成16度,我母親進(jìn)這個(gè)房間自動(dòng)調(diào)節(jié)成26度”。我問他:“如果你和你母親一塊進(jìn)去怎么辦,如果你背著身進(jìn)去怎么辦?”他說這個(gè)需求,其實(shí)最好的解決辦法就是搖控器。

其次,需求得是剛性的。需要考慮用戶愿不愿意買單,愿意花多少錢買單?往后更深層次的邏輯鏈,需要對(duì)場(chǎng)景的更深的了解。

2、規(guī)?;?/strong>

今天完成一套解決方案成本很高。人臉識(shí)別這樣的技術(shù),在不同的場(chǎng)景中技術(shù)差異很大。我今天做金融,1:1的認(rèn)證,錯(cuò)誤率做到百萬(wàn)分之一,千萬(wàn)分之一,準(zhǔn)確性非常高,在金融場(chǎng)景中非常好用。如果放在安防的場(chǎng)景下,安防要求百萬(wàn)人的黑名單庫(kù)。而且黑名單庫(kù)還要有誤報(bào),每一次誤報(bào)有一個(gè)出警。同樣是人臉識(shí)別,不同場(chǎng)景下關(guān)注的技術(shù)指標(biāo)和任務(wù)是完全不同的。所以同樣一個(gè)技術(shù)概念,在不同場(chǎng)景下的差異性非常明顯。再者技術(shù)什么時(shí)候成熟需要在特定的需求場(chǎng)景下,離成熟多遠(yuǎn)要有一個(gè)預(yù)判力。

3、數(shù)據(jù)閉環(huán)

做AI技術(shù),數(shù)據(jù)閉環(huán)是非常重要的環(huán)節(jié)。為什么?我們做視頻的會(huì)發(fā)現(xiàn),當(dāng)你技術(shù)不成熟的時(shí)候你的業(yè)務(wù)不能用,業(yè)務(wù)沒有落地的時(shí)候就沒有數(shù)據(jù)。做不好,就形成死循環(huán)。這樣的死循環(huán)如何去打破?原動(dòng)力的突破來(lái)自于技術(shù),當(dāng)你的技術(shù)有小的突破,把其他場(chǎng)景遷移過來(lái)。技術(shù)的突破可以帶來(lái)業(yè)務(wù)的落地,業(yè)務(wù)的落地帶來(lái)數(shù)據(jù)的累積,數(shù)據(jù)的累計(jì)可以帶來(lái)技術(shù)的進(jìn)步。這樣的數(shù)據(jù)閉環(huán),幫助整體業(yè)務(wù)拓展并能帶來(lái)非常大的價(jià)值。今天,數(shù)據(jù)面臨隱私性和安全性的質(zhì)問和考驗(yàn)。包括區(qū)塊鏈在內(nèi)的很多技術(shù),還有一些非技術(shù)的方式方法,可以帶來(lái)更深層次的探索。

4、商業(yè)化

光做出好產(chǎn)品是不夠的,還要在市場(chǎng)上真的有價(jià)值,并且能持續(xù)保有競(jìng)爭(zhēng)力。任何新技術(shù)都會(huì)隨著時(shí)間的推移而擴(kuò)散,一般所擁有的時(shí)間窗口最多也就是一年多的時(shí)間。

在這一段時(shí)間內(nèi),如何看待當(dāng)前所面臨的場(chǎng)景?在這個(gè)場(chǎng)景中技術(shù)到底占據(jù)多大的地位?是非關(guān)鍵性的應(yīng)用還是關(guān)鍵性的應(yīng)用?技術(shù)上的突破和分配,是否產(chǎn)生根本性的問題?在技術(shù)的壁壘期,我們能否利用這一段時(shí)間構(gòu)建起技術(shù)以外的壁壘?

只有壁壘構(gòu)建出來(lái),利用時(shí)間窗口期把技術(shù)優(yōu)勢(shì)轉(zhuǎn)化成其他的競(jìng)爭(zhēng)性壁壘,這樣的行業(yè)才值得去做。

5、技術(shù)創(chuàng)新驅(qū)動(dòng)

早在一兩年前,我們就搜集到大量用假照片和視頻去攻擊刷臉識(shí)別的行為,各種各樣的案例。當(dāng)我們擁有大量來(lái)自真實(shí)業(yè)務(wù)的攻擊數(shù)據(jù)時(shí),就能夠針對(duì)圖像視頻各種各樣的攻擊方式進(jìn)行非常好的防范,這來(lái)自于大量線上攻擊的業(yè)務(wù)數(shù)據(jù)的累積,以及對(duì)這些數(shù)據(jù)的二次挖掘和利用。

這個(gè)給我們什么樣的啟示?做刷臉一開始是做人臉識(shí)別,但后來(lái)我們發(fā)現(xiàn)人臉識(shí)別不是最重要的,最重要的活體識(shí)別,分清到底是一個(gè)真人還是仿冒攻擊。只有深入場(chǎng)景,才能發(fā)現(xiàn)你所面臨的技術(shù)挑戰(zhàn)跟你之前想象的不同。當(dāng)行業(yè)落地的時(shí)候所面臨的技術(shù)挑戰(zhàn),實(shí)際上需要重新定義、分解和解決。

從這五個(gè)閉環(huán)能夠幫助我們?nèi)ヅ袛啵岩粋€(gè)AI技術(shù)應(yīng)用在某一個(gè)場(chǎng)景是否真的有價(jià)值,是否真的有意義,是否帶來(lái)更大的用戶價(jià)值。從這幾個(gè)角度大家去進(jìn)行分析判斷,會(huì)有一個(gè)相對(duì)比較好的結(jié)論。

想把落地場(chǎng)景做好,復(fù)合型技術(shù)人才尤為重要

如楊帆所說,真正去看行業(yè)落地的時(shí)候,往往都是不同的技術(shù)疊加和組合的應(yīng)用,這里面人臉識(shí)別和動(dòng)作識(shí)別是最關(guān)鍵的技術(shù),但實(shí)際上想把落地場(chǎng)景做好,一定需要多種技術(shù)組合。

楊帆表示,將創(chuàng)新技術(shù)轉(zhuǎn)變?yōu)閷?shí)際產(chǎn)品是一條滿是荊棘的道路,行之不易,而其中最大的難點(diǎn),一是如何選對(duì)方向和時(shí)機(jī),二是如何找到合適的人才。

行業(yè)落地需要各種綜合性的關(guān)鍵技術(shù)的整合。行業(yè)的需求往往是一些相對(duì)模糊的,而且從技術(shù)上來(lái)看是非常不明確的東西,這時(shí)候就需要有人有足夠的能力去一一拆解。在楊帆看來(lái),找到或培養(yǎng)一些既有技術(shù)背景、又對(duì)行業(yè)有足夠深的理解的人才,是企業(yè)實(shí)現(xiàn)AI技術(shù)落地最關(guān)鍵的一點(diǎn)。他說到,“人才問題、團(tuán)隊(duì)組織問題、發(fā)展問題,特別是做2B行業(yè),標(biāo)準(zhǔn)化與非標(biāo)準(zhǔn)之間的平衡性掌握,任何一個(gè)技術(shù)性產(chǎn)品落地會(huì)面臨的共有問題,做AI技術(shù)落地,這些問題一個(gè)都不會(huì)少,而只會(huì)更嚴(yán)重。AI人才是個(gè)更大的坑,AI的技術(shù)性更深重,從過往來(lái)看,它跟行業(yè)的結(jié)合更弱,所以你想要真正去打磨出一個(gè)符合真正行業(yè)需求的產(chǎn)品的時(shí)候,需要把對(duì)行業(yè)的理解和對(duì)技術(shù)的理解融合在一起,這是當(dāng)前最具挑戰(zhàn)任務(wù)之一,因?yàn)檫^去可能這個(gè)世界上基本不存在這樣的人,對(duì)行業(yè)有理解的人很少?!?/p>

結(jié)語(yǔ)

視覺AI技術(shù)的落地與AI人才的培養(yǎng)是一個(gè)復(fù)雜而龐大的話題,需要對(duì)技術(shù)和人才都有比較深刻的理解和認(rèn)知。

中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來(lái)源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.connectcrack.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來(lái)源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來(lái)源的稿件,均來(lái)自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來(lái)源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0