機(jī)器人從車間走上工作崗位,已經(jīng)不是沒有不可能的的事情。在智能化不斷發(fā)展的今天,機(jī)器人“大腦”正逐漸豐富。機(jī)器人記者并不是首次提到,在之前就已經(jīng)出現(xiàn)了機(jī)器人記者。將機(jī)器人運(yùn)用到寫作、編輯等領(lǐng)域,這將是未來的趨勢之一。
機(jī)器人記者來了優(yōu)勢不輸給記者
從最初替代勞動(dòng)密集型的工程,到會(huì)說話的Siri和自動(dòng)駕駛汽車,計(jì)算機(jī)正在變得越來越智能。如今,居然連寫作都學(xué)會(huì)了,記者們大規(guī)模失業(yè)的那一天會(huì)很遠(yuǎn)嗎?
在前一階段熱映的電影《超能陸戰(zhàn)隊(duì)》中,私人健康助理大白(Baymax)虜獲了大批粉絲。除了討人喜歡的呆萌外表,大白的技能也毫不遜色于藍(lán)色的哆啦A夢—根據(jù)預(yù)先編制的程序,大白能對(duì)人體的健康狀況做出精準(zhǔn)的判斷并給予及時(shí)的治療。
現(xiàn)實(shí)生活中,大白的設(shè)定機(jī)器人健康助理是2014年美國最熱門的創(chuàng)業(yè)方向:機(jī)器人和醫(yī)療健康領(lǐng)域。作為弱人工智能代表的大白,似乎離我們的日常生活并不太遙遠(yuǎn)。畢竟,工業(yè)革命之后的200多年時(shí)光中,機(jī)器已經(jīng)取代人類完成了諸多工作,從最初簡單地把人類從重復(fù)單調(diào)的勞動(dòng)中解放出來,到利用大數(shù)據(jù)解決人類各種問題的人工智能。雖然就目前的技術(shù)水平而言,不少事情還是人類更加擅長,但并不妨礙機(jī)器人學(xué)習(xí)越來越多的新技能,并開始從事越來越多的新工種,譬如,聽起來似乎不太可能由計(jì)算機(jī)來完成的:寫作。
機(jī)器人碼字知多少?
2015年1月的最后一天,在蘋果公司發(fā)布創(chuàng)紀(jì)錄的一季度財(cái)報(bào)數(shù)分鐘之后,美聯(lián)社即發(fā)表了題為《蘋果打破華爾街一季度預(yù)期》的新聞報(bào)道。如果不仔細(xì)閱讀文章下方的說明,讀者很難意識(shí)到這篇沒有署名的文章事實(shí)上是出自機(jī)器人記者之手。
這些機(jī)器人記者是美聯(lián)社與致力于自動(dòng)化寫作的公司AutomatedInsights(以下簡稱“AI”)牽手合作的產(chǎn)物。自2014年年中開始,美聯(lián)社使用AI公司的Wordsmith平臺(tái)撰寫財(cái)報(bào)快訊。最開始,每篇由計(jì)算機(jī)生成的文章都會(huì)經(jīng)由人工編輯,糾正錯(cuò)誤,同時(shí)這些錯(cuò)誤也會(huì)被反饋至AI以便進(jìn)行后續(xù)改進(jìn)。10月起,完全沒有人為干預(yù)的自動(dòng)化寫作程序正式啟動(dòng),機(jī)器人記者正式上崗負(fù)責(zé)撰寫業(yè)績短評(píng)和快訊。
事實(shí)上,第一條完全由計(jì)算機(jī)程序生產(chǎn)的新聞報(bào)道產(chǎn)生于2014年3月美國加州4.7級(jí)地震時(shí)。作為首家“聘用”機(jī)器人記者的主流媒體,《洛杉磯時(shí)報(bào)(LATimes)》在地震發(fā)生后3分鐘就發(fā)布了首條相關(guān)新聞。當(dāng)時(shí)《洛杉磯時(shí)報(bào)》使用了一款名為Quakebot的軟件程序,基于美國地質(zhì)調(diào)查局(USGeologicalSurvey)的數(shù)據(jù),當(dāng)該局發(fā)出級(jí)別在一定程度之上的預(yù)警后,此程序即自動(dòng)提取數(shù)據(jù),然后生成報(bào)道。報(bào)道完成后進(jìn)入其內(nèi)容管理系統(tǒng),等候編輯的審閱和發(fā)布。
機(jī)器人的“寫作”技能還不止于此,它們不僅可以充分滿足媒體傳播真實(shí)、及時(shí)的基本需求,而且還十分多產(chǎn)—對(duì)于以“碼字”為生的記者和作家而言,誰都知道這一條有多可貴。
歐洲工商管理商學(xué)院(INSEAD)的管理學(xué)教授帕克(PhilipM.Parker)所編寫的一套算法系統(tǒng)已經(jīng)成功寫出了超過20萬本書,其中不少都在亞馬遜有售。而瑞典一名教師發(fā)明的計(jì)算機(jī)程序Lsjbot已經(jīng)撰寫了約270萬條維基百科詞條,占到了維基百科總量的8.5%。并不為人所熟知的是,早在2001年維基百科上線之時(shí),就已經(jīng)有了機(jī)器人的身影,且年產(chǎn)量在3萬篇左右。當(dāng)然,當(dāng)時(shí)的機(jī)器人“寫作”遠(yuǎn)未實(shí)現(xiàn)自動(dòng)化。以介紹美國各小鎮(zhèn)的短文為例,機(jī)器人直接從美國統(tǒng)計(jì)局抓取現(xiàn)成的數(shù)據(jù),然后將之變成短小、固定的短語,隨后由編輯接手,用歷史介紹和旅游景點(diǎn)等各種內(nèi)容串起這些短語,從而生成最后的詞條。
“賦予數(shù)據(jù)生命”
與過去計(jì)算機(jī)“寫作”停留在利用龐大文本庫所進(jìn)行的簡單拼湊相比,如今的機(jī)器人記者顯然已經(jīng)智能了許多,支撐它們的是一套嚴(yán)謹(jǐn)?shù)淖匀徽Z言生成系統(tǒng)。除了與美聯(lián)社合作的AI,另一家成立于2010年的公司NarrativeScience(以下簡稱“NS”)同樣致力于此領(lǐng)域。
如果說以Siri的語音識(shí)別技術(shù)是在信息輸入上的一種突破,那么,AI和NS想要做的就是更加擬人化的“輸出”,以文字的形式。AI表示自己公司的專長就是寫作,“正如某人在自己的特長一欄里寫上‘寫作’一樣”,NS則聲稱其計(jì)算機(jī)程序所撰寫的文章無論敘述還是表達(dá)都與人類的作品難以區(qū)別。
不僅奮斗目標(biāo)一致,兩家公司最初的“實(shí)驗(yàn)田”均是體育報(bào)道。這些機(jī)器人記者不僅能基于比賽結(jié)果等信息第一時(shí)間撰寫賽事快訊,還會(huì)對(duì)核心球員和精彩瞬間進(jìn)行重點(diǎn)描述,而NS的程序設(shè)定還會(huì)自動(dòng)生成標(biāo)題并從圖片庫上挑選相應(yīng)的球員照片作為配圖??梢哉f,目前的技術(shù)水平已基本上實(shí)現(xiàn)了賽事報(bào)道的一鍵生成。
當(dāng)然,不同的媒體有不同的行文套路和風(fēng)格。因此,機(jī)器人記者的第一步就是大量“閱讀”學(xué)習(xí)各家的不同風(fēng)格,從而生成相應(yīng)的模板,這個(gè)過程有點(diǎn)類似于《超能陸戰(zhàn)隊(duì)》中的大白在看到主人公因失去哥哥而意志消沉后,從電腦里下載了所有相關(guān)治療程序。
在模板生成之后,自動(dòng)化寫作的第一步即是數(shù)據(jù)抓取。因此,在美聯(lián)社與AI的合作中,還有專門負(fù)責(zé)處理數(shù)據(jù)的Zacks參與。接下來,AI依據(jù)一定的算法從中挑選有用的數(shù)據(jù),并進(jìn)行分析,找出其中的邏輯關(guān)系與趨勢,并把它們納入到更大的行業(yè)或社會(huì)、國家的背景中來解讀其意義。隨后就該輪到模板登場了,算法會(huì)按照重要性對(duì)各種可能的角度進(jìn)行排序,并由此提煉觀點(diǎn),選擇故事的“角度”,并形成文章的整體結(jié)構(gòu)。剩下的工作就是生成文字,系統(tǒng)會(huì)用其自然語言生成功能對(duì)此前的分析和提煉得到的觀點(diǎn)進(jìn)行故事化敘述,并按照需要生成各種形式的文本。根據(jù)各家的需要,系統(tǒng)還會(huì)通過多種方式,將內(nèi)容實(shí)時(shí)發(fā)布到指定的平臺(tái)上。
從體育到財(cái)經(jīng),不難發(fā)現(xiàn),二者的共通之處就在于都是需要大量數(shù)據(jù)支持的新聞報(bào)道,而這正是目前自動(dòng)化寫作應(yīng)用最為廣泛的領(lǐng)域。除了美聯(lián)社和《洛杉磯時(shí)報(bào)》,福布斯、雅虎以及美式橄欖球聯(lián)賽(NFL)等機(jī)構(gòu)都已經(jīng)開始“聘用”機(jī)器人撰寫一些基于數(shù)據(jù)的簡單報(bào)道。此外,還有一大批網(wǎng)絡(luò)媒體享受著機(jī)器人記者高效便捷的服務(wù),但卻羞于對(duì)外發(fā)布自己的名字。
媒體并非機(jī)器人記者的唯一服務(wù)對(duì)象,始終圍繞著數(shù)字運(yùn)轉(zhuǎn)的金融業(yè)是其另一大客戶。NS的客戶中就包括了萬事達(dá)、德勤、瑞士信貸、美國投資公司普信集團(tuán)(T.RowePrice)以及金融集團(tuán)USAA。這些機(jī)構(gòu)都需要定期向投資人以及管理機(jī)構(gòu)發(fā)送業(yè)績報(bào)告,過去這樣的報(bào)告通常需要一個(gè)專門的團(tuán)隊(duì)花費(fèi)數(shù)十小時(shí)完成,而啟用了自動(dòng)化寫作的服務(wù)之后,抓取數(shù)據(jù)、生成報(bào)告不過是幾秒鐘的事情。
此外,企業(yè)盈利分析報(bào)告、市場調(diào)研報(bào)告、銷售趨勢報(bào)告等固定模式的文本,機(jī)器人記者如今都可以輕松應(yīng)對(duì),而且其技能還逐漸向制造、零售、醫(yī)療和健康等存在大量數(shù)據(jù)分析的行業(yè)滲透。就連美國中央情報(bào)局下屬分管投資的分支機(jī)構(gòu)In-Q-Tel也使用了NS的服務(wù)—早在2013年4月,In-Q-Tel就已經(jīng)投資了NS。在2014年12月收獲了新一輪1000萬美元的融資之后,NS自創(chuàng)立以來的融資總額達(dá)到了3200萬美元。而AI在籌集了上千萬美元的資金后于2015年2月被管理資金規(guī)模達(dá)140億美元的私募股權(quán)投資公司VistaEquityPartners收購,并將整合AI與其早已全資擁有的數(shù)據(jù)內(nèi)容生產(chǎn)商STATS的業(yè)務(wù),充分挖掘大數(shù)據(jù)的價(jià)值,正如NS上的那句宣傳口號(hào),“賦予數(shù)據(jù)生命”。
搶記者飯碗?
直到被收購前,AI的員工也不到40人。但僅在2013年,其自動(dòng)化寫作系統(tǒng)就生產(chǎn)了3億個(gè)故事,2014年這個(gè)數(shù)字超過了10億,顯然它們已經(jīng)是全球最大的內(nèi)容生產(chǎn)商。而美聯(lián)社過去每個(gè)季度約發(fā)表300篇企業(yè)業(yè)績快報(bào),在與AI合作后則增加到了逾3000篇。不僅是產(chǎn)能大幅提升,計(jì)算機(jī)還能在短時(shí)間內(nèi)處理大量數(shù)據(jù),通常在上市公司業(yè)績發(fā)布的數(shù)分鐘內(nèi)即可推出相關(guān)報(bào)道,比起人類的碼字速度,優(yōu)勢十分突出。
NS合伙創(chuàng)立人、首席技術(shù)官漢默德(KristianHammond)早在兩年前接受媒體采訪時(shí)就曾表示,“機(jī)器人記者將于2017年拿下普利策新聞獎(jiǎng),到了2025年,由計(jì)算機(jī)生產(chǎn)的新聞報(bào)道比例將會(huì)高達(dá)九成。”當(dāng)時(shí),外界評(píng)論NS機(jī)器人記者的寫作水平大約相當(dāng)于一個(gè)美國八年級(jí)學(xué)生的。兩年的習(xí)得,計(jì)算機(jī)的寫作水平自然也是精進(jìn)不少。
那么,問題來了,記者會(huì)因此而失業(yè)嗎?
從美聯(lián)社和《洛杉磯時(shí)報(bào)》的情況來看,沒有人因?yàn)闄C(jī)器人記者的出現(xiàn)而被裁員。相反,由于計(jì)算機(jī)把記者從繁重的數(shù)據(jù)跟蹤和計(jì)算中解脫了出來,并在第一時(shí)間提供有價(jià)值的新聞線索,記者可以把更多的時(shí)間用來進(jìn)行深度報(bào)道,創(chuàng)作更多高質(zhì)量的、有觀點(diǎn)的干貨。在美聯(lián)社如今每季度發(fā)布的逾3000篇財(cái)務(wù)快訊中,約120篇會(huì)被加工成相對(duì)深度的報(bào)道。
畢竟,計(jì)算機(jī)既不會(huì)個(gè)性化的表達(dá),也不會(huì)煉字鍛句,既不能采訪相關(guān)專家,更不能比較和判斷話題的價(jià)值,它們所能做的只是憑借自身超強(qiáng)的記憶能力以及對(duì)數(shù)據(jù)的抓取和分析能力,發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián),用專業(yè)、易懂的語句將它們簡單表述出來,僅此而已。正如同《超能陸戰(zhàn)隊(duì)》中的主人公打算替兄報(bào)仇時(shí),需要重新給大白安裝一個(gè)攻擊性而非治療性的程序。在弱人工智能模式下,設(shè)定者依然是人,計(jì)算機(jī)并不具備獨(dú)立自主的思維,只能是模仿和學(xué)習(xí)。
但是,未來呢?在一個(gè)越來越由人工智能所定義的世界里,新聞的自動(dòng)選編和精準(zhǔn)推送都已經(jīng)實(shí)現(xiàn)了,是否會(huì)有一個(gè)真正能自主推理和解決問題的強(qiáng)人工智能計(jì)算機(jī)出現(xiàn),通過“計(jì)算機(jī)科學(xué)之父”和“人工智能之父”阿蘭·圖靈(AlanMathisonTuring)所設(shè)計(jì)的圖靈測試?“一個(gè)會(huì)寫作的機(jī)器人”甚至“一個(gè)會(huì)思考的機(jī)器人”,到底離我們還有多遠(yuǎn)呢?
更多資訊請(qǐng)關(guān)注工業(yè)機(jī)器人頻道