Facebook 如何為計算機視覺技術尋求出路

時間:2016-08-30

來源:網絡轉載

導語:為提高計算機視覺能力,Facebook正為開發(fā)者社區(qū)越來越多地開源內部工具。

為提高計算機視覺能力,Facebook正為開發(fā)者社區(qū)越來越多地開源內部工具。

計算機視覺隸屬于人工智能(AI),可協助機器理解圖像。計算機視覺不需要手工輸入關鍵詞或描述語等元數據,而是將圖像分解并在逐個像素的基礎上處理圖像。

照片,視頻以及一般圖像都是Facebook的重要素材,而計算機識別圖像中的對象的能力非常利于縮放圖像的內容分類。對于一段視頻或一張圖片,人眼可以輕易確定其中有3個人、1個冰箱和6罐啤酒,但對機器來說,建立自己的意志并不簡單。面對圖像上光線和顏色的無數種混合方式,人類顯然更具優(yōu)勢。

然而計算機視覺技術已經取得跨越式發(fā)展,計算機越來越擅長識別圖像的內容以及圖像中對象的位置。檢測對象只是一方面,機器還需要認清對象的重疊部分,這種影像分割問題更加復雜。比如,機器不能將動物的部分軀體和前方站立的人體混為一談。Facebook的研究人員想要推進的就是這個方面。

Facebook將一些計算機視覺算法代碼上傳到了GitHub以供大眾下載,包括DeepMask分割框架還有SharpMask分割精細化模塊,以此促進、同時在某種意義上幫助Facebook促進這項技術。另外還有給圖像上對象逐一打標簽的“專用卷積網絡”MultiPathNet。

Facebook將一些計算機視覺算法代碼上傳到了GitHub以供大眾下載,包括DeepMask分割框架還有SharpMask分割精細化模塊,以此促進、同時在某種意義上幫助Facebook促進這項技術。另外還有給圖像上對象逐一打標簽的“專用卷積網絡”MultiPathNet。

“我們開放代碼給所有人,希望他們能夠一起助力機器視覺領域的迅速提升?!盕acebook人工智能研究組(FAIR)的研究科學家PiotrDollar在博文中說,“隨著核心技術的發(fā)展,我們仍將繼續(xù)發(fā)布最新成果,更新開放給大眾的開源工具?!?/p>

越來越多的企業(yè)轉向關注機器學習領域,為客戶尋求更優(yōu)質的自動化技術。最近被微軟收購的聯想輸入鍵盤企業(yè)SwiftKey就在研究一個與AI有關的復雜后端。其中的人工神經網絡(ANN)直接基于人類大腦的架構和工作方式。圖片庫巨頭Shutterstock也打造了自己的卷積神經網絡以提高逆向圖像搜索技術。

將自己的軟件遞交給開發(fā)者社區(qū),Facebook能夠事半功倍。其實,Facebook已多次開源內部技術。過去幾個月中,這個社交網絡巨頭就為加速AI的研究開源了Torchnet,以及將360photo和360video中的圖片和視頻嵌入到應用中的SDK。GitHub上,Facebook的項目有200多個。開源總監(jiān)JamesPearce最近解答了Facebook擁抱開源社區(qū)的原因,總的來說可以歸結為意識形態(tài),創(chuàng)新,以及開源通常利于商業(yè)的這一事實經驗?!拔覀冊贔acebook的目標是,盡可能多地開源我們的技術,特別是我們認為對更廣大的整個工程界來說有價值的技術?!?/p>

中傳動網版權與免責聲明:

凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.connectcrack.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯網或業(yè)內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內容、版權等問題,請在作品發(fā)表之日起一周內與本網聯系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0