為提高計算機視覺能力,Facebook正為開發(fā)者社區(qū)越來越多地開源內部工具。
計算機視覺隸屬于人工智能(AI),可協助機器理解圖像。計算機視覺不需要手工輸入關鍵詞或描述語等元數據,而是將圖像分解并在逐個像素的基礎上處理圖像。
照片,視頻以及一般圖像都是Facebook的重要素材,而計算機識別圖像中的對象的能力非常利于縮放圖像的內容分類。對于一段視頻或一張圖片,人眼可以輕易確定其中有3個人、1個冰箱和6罐啤酒,但對機器來說,建立自己的意志并不簡單。面對圖像上光線和顏色的無數種混合方式,人類顯然更具優(yōu)勢。
然而計算機視覺技術已經取得跨越式發(fā)展,計算機越來越擅長識別圖像的內容以及圖像中對象的位置。檢測對象只是一方面,機器還需要認清對象的重疊部分,這種影像分割問題更加復雜。比如,機器不能將動物的部分軀體和前方站立的人體混為一談。Facebook的研究人員想要推進的就是這個方面。
Facebook將一些計算機視覺算法代碼上傳到了GitHub以供大眾下載,包括DeepMask分割框架還有SharpMask分割精細化模塊,以此促進、同時在某種意義上幫助Facebook促進這項技術。另外還有給圖像上對象逐一打標簽的“專用卷積網絡”MultiPathNet。
Facebook將一些計算機視覺算法代碼上傳到了GitHub以供大眾下載,包括DeepMask分割框架還有SharpMask分割精細化模塊,以此促進、同時在某種意義上幫助Facebook促進這項技術。另外還有給圖像上對象逐一打標簽的“專用卷積網絡”MultiPathNet。
“我們開放代碼給所有人,希望他們能夠一起助力機器視覺領域的迅速提升?!盕acebook人工智能研究組(FAIR)的研究科學家PiotrDollar在博文中說,“隨著核心技術的發(fā)展,我們仍將繼續(xù)發(fā)布最新成果,更新開放給大眾的開源工具?!?/p>
越來越多的企業(yè)轉向關注機器學習領域,為客戶尋求更優(yōu)質的自動化技術。最近被微軟收購的聯想輸入鍵盤企業(yè)SwiftKey就在研究一個與AI有關的復雜后端。其中的人工神經網絡(ANN)直接基于人類大腦的架構和工作方式。圖片庫巨頭Shutterstock也打造了自己的卷積神經網絡以提高逆向圖像搜索技術。
將自己的軟件遞交給開發(fā)者社區(qū),Facebook能夠事半功倍。其實,Facebook已多次開源內部技術。過去幾個月中,這個社交網絡巨頭就為加速AI的研究開源了Torchnet,以及將360photo和360video中的圖片和視頻嵌入到應用中的SDK。GitHub上,Facebook的項目有200多個。開源總監(jiān)JamesPearce最近解答了Facebook擁抱開源社區(qū)的原因,總的來說可以歸結為意識形態(tài),創(chuàng)新,以及開源通常利于商業(yè)的這一事實經驗?!拔覀冊贔acebook的目標是,盡可能多地開源我們的技術,特別是我們認為對更廣大的整個工程界來說有價值的技術?!?/p>