國(guó)外有關(guān)擴(kuò)大機(jī)器學(xué)習(xí)規(guī)模的方法有哪些?

時(shí)間:2019-05-16

來源:企業(yè)網(wǎng)

導(dǎo)語:Gartner最近的一項(xiàng)調(diào)查顯示,很多公司才剛剛開始機(jī)器學(xué)習(xí)之旅,而37%的組織已經(jīng)實(shí)施了人工智能。如果你已經(jīng)準(zhǔn)備好接受機(jī)器學(xué)習(xí),你可能先要評(píng)估十個(gè)問題或評(píng)估人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的完整指南,然后才能對(duì)機(jī)器學(xué)習(xí)進(jìn)行概念驗(yàn)證。

Gartner最近的一項(xiàng)調(diào)查顯示,很多公司才剛剛開始機(jī)器學(xué)習(xí)之旅,而37%的組織已經(jīng)實(shí)施了人工智能。如果你已經(jīng)準(zhǔn)備好接受機(jī)器學(xué)習(xí),你可能先要評(píng)估十個(gè)問題或評(píng)估人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的完整指南,然后才能對(duì)機(jī)器學(xué)習(xí)進(jìn)行概念驗(yàn)證。

機(jī)器學(xué)習(xí)正在不斷發(fā)展,新的商業(yè)突破、科學(xué)進(jìn)步、框架改進(jìn)和最佳實(shí)踐常常見諸各大媒體。

我們可以從實(shí)施了大規(guī)模機(jī)器學(xué)習(xí)計(jì)劃并將人工智能視為業(yè)務(wù)核心的組織中學(xué)到很多東西。在紐約召開的O‘Reilly人工智能會(huì)議上,我看到了臉書和推特的機(jī)器學(xué)習(xí)計(jì)劃之間的幾股常見趨勢(shì)。

解業(yè)務(wù)需求和競(jìng)爭(zhēng)因素

臉書將機(jī)器學(xué)習(xí)用于很多領(lǐng)域。在臉書主頁上,機(jī)器學(xué)習(xí)可以搜索內(nèi)容,翻譯語言,掃描動(dòng)態(tài)消息并識(shí)別用戶上傳的照片中的面孔,以及查廣告展示的內(nèi)容。在幕后,機(jī)器學(xué)習(xí)則用于內(nèi)容理解、語音識(shí)別、內(nèi)容完整性、情感分析、檢測(cè)令人反感的內(nèi)容和欺詐性賬戶。

同樣,推文排名、廣告選擇、搜索功能和用戶推薦等一系列活動(dòng)證實(shí)推特的機(jī)器學(xué)習(xí)正在發(fā)揮作用。機(jī)器學(xué)習(xí)還用來標(biāo)記有污言穢語的推文、垃圾郵件和不適合在工作中使用的圖片。

每次機(jī)器學(xué)習(xí)操作的規(guī)模有多大,這兩家公司以什么方式投資于差異化能力,這不太明顯。

臉書每天為26億用戶執(zhí)行200多萬億次預(yù)測(cè)。它的用戶遍布全球(這些用戶在帶寬上受到一定的限制),而且大量的互動(dòng)是由手機(jī)完成的。

這帶來了一些難題,因?yàn)槿蛴?1%的用戶還在用六年前的手機(jī),甚至更老;只有不到10%的用戶使用最先進(jìn)的智能手機(jī)。臉書的戰(zhàn)略的一部分是將更多的神經(jīng)網(wǎng)絡(luò)計(jì)算轉(zhuǎn)移到邊緣設(shè)備,以擴(kuò)大規(guī)模,降低延遲并提供更個(gè)性化的機(jī)器學(xué)習(xí)模型。臉書的機(jī)器學(xué)習(xí)技術(shù)棧體現(xiàn)了這樣的目標(biāo),即可以輕松地研究新模型,同時(shí)大規(guī)模提供推理結(jié)果并將一些計(jì)算轉(zhuǎn)移到邊緣設(shè)備。

推特根據(jù)規(guī)模和延遲方面的要求對(duì)模型進(jìn)行優(yōu)化。它每秒執(zhí)行數(shù)千萬次預(yù)測(cè),每天以數(shù)十太字節(jié)的數(shù)據(jù)來訓(xùn)練模型。它專注于優(yōu)化延遲(模型做出響應(yīng)所需的時(shí)間)并明確了預(yù)測(cè)延遲方面的預(yù)算,即預(yù)測(cè)延遲數(shù)十毫秒所需要的預(yù)算。

為了擴(kuò)大規(guī)模而將平臺(tái)標(biāo)準(zhǔn)化

臉書和推特很早就開展了機(jī)器學(xué)習(xí)計(jì)劃。它們從非結(jié)構(gòu)化方法開始,但它們現(xiàn)在正在采取措施將平臺(tái),框架和管道標(biāo)準(zhǔn)化。推特旨在更輕松地共享模型并希望減少重復(fù)勞動(dòng)。臉書正在解決各種痛點(diǎn),即可靠性、可擴(kuò)展性、運(yùn)行模型的效率以及科學(xué)家和工程師的開發(fā)體驗(yàn)方面的痛點(diǎn)。

這兩家公司的平臺(tái)都根據(jù)類似的數(shù)據(jù)管道處理原則得到了優(yōu)化,它們都有處理數(shù)據(jù),提取特征,訓(xùn)練模型以及將模型部署到生產(chǎn)環(huán)境的平臺(tái)。

兩大社交媒體巨頭正在采取措施對(duì)選定的機(jī)器學(xué)習(xí)框架進(jìn)行標(biāo)準(zhǔn)化。臉書正在使用PyTorch使研究變得更輕松,使用Caffe2大規(guī)模運(yùn)行生產(chǎn)推理模型。它已將Caffe2整合到PyTorch1.0中,PyTorch1.0結(jié)合了這兩種功能,并使用Caffe2Go來運(yùn)行移動(dòng)神經(jīng)網(wǎng)絡(luò)。推特使用的是LuaTorch、TensorFlow、Scikit、PyTorch和其它平臺(tái)。它現(xiàn)在正在將Scalding、PySpark、Tensorflow和ApacheAirflow標(biāo)準(zhǔn)化。

使科學(xué)家、開發(fā)人員和工程師能夠進(jìn)行協(xié)作

推特和臉書勾勒了各種不同的工作,以實(shí)現(xiàn)生產(chǎn)力,知識(shí)共享,以及數(shù)據(jù)科學(xué)家、開發(fā)人員和工程師之間的代碼可重用性。

許多數(shù)據(jù)團(tuán)隊(duì)將數(shù)據(jù)目錄和詞典作為其數(shù)據(jù)治理計(jì)劃的一部分。這些工具使每個(gè)人在使用數(shù)據(jù)進(jìn)行分析或機(jī)器學(xué)習(xí)實(shí)驗(yàn)時(shí)更容易理解基礎(chǔ)數(shù)據(jù)模型,字段定義和質(zhì)量約束。

推特則更進(jìn)一步,它通過將機(jī)器學(xué)習(xí)實(shí)驗(yàn)中使用的功能標(biāo)準(zhǔn)化并在功能目錄中獲取這些功能。這大大減少了重復(fù)并幫助科學(xué)家訓(xùn)練新模型,而不必花大量精力將數(shù)據(jù)處理成功能。

臉書還對(duì)自身的功能進(jìn)行編目和標(biāo)準(zhǔn)化,將訓(xùn)練自動(dòng)化并開發(fā)用于管理和部署模型的工具。FBLearner是支持這些功能的標(biāo)準(zhǔn)平臺(tái)。

此外,臉書正在對(duì)自身所使用的機(jī)器學(xué)習(xí)類型進(jìn)行標(biāo)準(zhǔn)化。例如,動(dòng)態(tài)消息、廣告、搜索和異常檢測(cè)的排名使用了多層感知器。臉書還利用卷積神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)(supportvectormachine)進(jìn)行面部識(shí)別,并利用循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行語言翻譯。

將機(jī)器學(xué)習(xí)模型的持續(xù)訓(xùn)練自動(dòng)化

和軟件應(yīng)用程序一樣,機(jī)器學(xué)習(xí)模型必須持續(xù)得到培訓(xùn)和修改。臉書和推特都對(duì)這種培訓(xùn)進(jìn)行了自動(dòng)化,以便模型根據(jù)新數(shù)據(jù)進(jìn)行重新調(diào)整。

推特認(rèn)識(shí)到,將模型推向生產(chǎn)將產(chǎn)生新的要求,即不斷用最新數(shù)據(jù)來訓(xùn)練模型,并在數(shù)據(jù)科學(xué)家進(jìn)行模型改進(jìn)時(shí)對(duì)其進(jìn)行更新。ApacheAirflow能將訓(xùn)練和部署管道自動(dòng)化。

臉書專注于其戰(zhàn)略。經(jīng)常改變的模型(例如新聞源)每小時(shí)或更少地重新訓(xùn)練,而語言翻譯和面部識(shí)別模型在數(shù)周至數(shù)月的循環(huán)中訓(xùn)練。

計(jì)算成本的高低和計(jì)算資源的多少也決定了模型重新接受訓(xùn)練的頻率。臉書也許具備戰(zhàn)略計(jì)算優(yōu)勢(shì),因?yàn)樗_發(fā)了各種硬件棧,這些硬件棧對(duì)不同的機(jī)器學(xué)習(xí)工作負(fù)載進(jìn)行優(yōu)化。因?yàn)槿虻挠?jì)算資源并未得到充分利用,所以推特專注于優(yōu)化算法性能并在非高峰時(shí)段安排訓(xùn)練。

制定長(zhǎng)期規(guī)劃

與大多數(shù)組織相比,推特和臉書在應(yīng)用和擴(kuò)展機(jī)器學(xué)習(xí)方面遙遙領(lǐng)先。你能從他們的成功中學(xué)到什么?

從小事做起,對(duì)模型進(jìn)行培訓(xùn)并在使其在生產(chǎn)中運(yùn)行,從而證明其商業(yè)價(jià)值,然后努力擴(kuò)大實(shí)踐規(guī)模并使其更成熟。要使實(shí)踐成熟,與應(yīng)用程序開發(fā)類似的規(guī)則是必不可少的,包括將框架標(biāo)準(zhǔn)化、定義體系結(jié)構(gòu)、選擇維護(hù)周期、優(yōu)化性能以及將部署管道自動(dòng)化。

你會(huì)發(fā)現(xiàn),機(jī)器學(xué)習(xí)帶來了重要價(jià)值,但它也需要根據(jù)性能和投資展開持續(xù)研究,以進(jìn)行改進(jìn)。各種模型經(jīng)過培訓(xùn)、部署、優(yōu)化,然后被更好的模型替代。機(jī)器學(xué)習(xí)是一種新的工具和技能,但對(duì)于必須改善用戶體驗(yàn)或必須通過數(shù)據(jù)提高競(jìng)爭(zhēng)價(jià)值的組織來說,它們將變得越來越重要。


中傳動(dòng)網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國(guó)傳動(dòng)網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國(guó)傳動(dòng)網(wǎng)(www.connectcrack.com)獨(dú)家所有。如需轉(zhuǎn)載請(qǐng)與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)須注明來源“中國(guó)傳動(dòng)網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請(qǐng)保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動(dòng)控制公眾號(hào)獲取更多資訊

關(guān)注直驅(qū)與傳動(dòng)公眾號(hào)獲取更多資訊

關(guān)注中國(guó)傳動(dòng)網(wǎng)公眾號(hào)獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運(yùn)動(dòng)控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動(dòng)
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點(diǎn)贊 0
取消 0