時間:2024-02-22 10:30:35來源:三界逆熵實驗室
而就在2月16日,OpenAI宣布推出全新的人工智能模型“Sora”。據(jù)了解,通過文本指令,Sora可以直接輸出長達60秒的視頻,并且包含高度細致的背景、復雜的多角度鏡頭,以及富有情感的多個角色。
這是繼文本、圖像之后,OpenAI將其先進的AI技術拓展到了視頻領域。Sora無疑是人工智能領域的一次重大突破,該技術不僅展示了AI在理解和創(chuàng)造復雜視覺內容方面的先進能力,而且對內容創(chuàng)作、娛樂和影視制作行業(yè)帶來了前所未有的挑戰(zhàn)和機遇。
一次性看完Sora發(fā)布的所有精彩視頻
01
對Sora問世的本源思考
我們知道,人類通過獲取和識別自然界和社會的各種信息來辨別物體,從而認知并改變世界。信息廣泛指人類社會傳播的各種內容,包括音訊、消息以及通訊系統(tǒng)傳輸和處理的對象。這些信息以多種載體形式存在,如文字、符號、表格、聲音、圖形圖像、視頻和動畫等。
然而,現(xiàn)在,Sora的出現(xiàn)意味著對現(xiàn)實世界的理解、模擬和生成不再局限于人類。它涵蓋了文字、圖形圖片、語音和視頻等形式,而過去這些只有人類才能完成。正因如此,Sora的問世預示著這個世界正在發(fā)生難以想象的變革。
02
大模型的核心技術:機器學習
大模型的核心技術是自然語言處理(NLP)和深度學習。具體而言,它基于Transformer架構,使用了大規(guī)模無監(jiān)督學習方法,例如自回歸語言建模和掩碼語言建模,來訓練一個龐大的神經(jīng)網(wǎng)絡模型。
機器學習聽起來很高大上,其本身也確實很復雜。為了將簡單問題復雜化,機器學習是模擬或實現(xiàn)人類的學習行為,如果我們從人類的學習行為來理解機器學習,也許就比較容易。
人在認識世界和學習的過程中,通常會先學習抽象的概念入手來了解某個事物或原理,這個概念其實就是對應機器學習的特征工程。比如我們在學習幾何指示的三角形,首先會從符號來認識,然后是了解三角形的定義、性質和計算公式。三角形的定義、性質和計算公式,對應機器學習的特征工程。
通常老師在講完課程后,會留一些課后作業(yè)和家庭作業(yè),用以加深和鞏固學生對三角形的概念、定義、性質和計算公司的理解。那么學生做作業(yè)的過程,就是機器學習的訓練樣本。訓練數(shù)據(jù)是用來幫助機器學習知識、建立起蘊含知識的模型的數(shù)據(jù)。
為了更好地提升學習效果和學習成績,學生還會參加課外補習班,然后做各種刷題和模擬練習,這個過程就是讓機器學習的有更多的和更有效的訓練樣本。在每個學期中,學校通常都會安排周考、月考、期中考、期末考,用以檢驗學生的學習效果并作為考核的依據(jù),最終的結果就是考上好的高中和好的大學。
學生參加各種考試就是對應機器學習的測試樣本。測試樣本是機器學習里模型服務的對象,對測試數(shù)據(jù)作出正確的預測和反饋,是機器學習一系列活動的最終目的。
我們看到,計算機世界所有的技術和手段,包括機器學習,都來源于我們現(xiàn)實日常生活和實踐,并且我們普通大眾都是能很好地理解。
很多時候父輩和祖輩們,可能他們沒讀過書,甚至不識字,但中華民族一些古老的知識和智慧(如成語、諺語)他們都能懂,甚至自然而然地去遵從。這些知識和智慧其實就是我們的基因,這些基因會一代代傳遞下來,并且不受文字和語言的限制。
這種基因的遺傳,其實也可以想象成一段“代碼”,假設這段代碼是更高維世界設計出來,那么人類也算是高維世界的“人工智能”。然后人類現(xiàn)又在自身的基因和日常實踐基礎上,設計出了第N+1代人工智能,并另類延續(xù)了人類的基因。
03
Sora會帶來哪些變局和顛覆性影響?
Sora模式的提出,必將對未來的視頻制作模式產(chǎn)生巨大的影響,并為各行各業(yè)帶來新的機遇。但Sora帶來的影響,無論從寬度和深度來說,都將遠超這些。
1、對行業(yè)、職業(yè)的沖擊和顛覆
根據(jù)OpenAI官方文章介紹以及分享的演示視頻來看,Sora稱得上是“王炸級”的AI工具。就像OpenAI將圖像生成模型DALL-E集成到ChatGPT產(chǎn)品中那樣,如果OpenAI將視頻生成模型Sora也集成到ChatGPT供所有用戶使用,那么應該能夠對視頻相關的行業(yè)逐漸帶來改變,比如影視制作、短視頻創(chuàng)作、在線教育、廣告?zhèn)髅?、游戲開發(fā)、直播,等等。
2、虛擬現(xiàn)實融合帶來的影響
Sora模式可以按照用戶的喜好和動作,在短時間內產(chǎn)生各種場景、情節(jié),增強了用戶的互動體驗。sora的問世,當人沉浸在虛擬的元宇宙的時候,比如有AR、VR,當體驗做到極致的時候,可能會分不清哪個是現(xiàn)實、哪個是虛擬。或者知道卻不愿意區(qū)分,就像人做了美夢不愿意醒來一樣,因為虛擬世界過的可能會比現(xiàn)實世界更好。
3、數(shù)實融合驅動精神境界提升
隨著數(shù)字技術發(fā)展,人類社會活動的一切過程都有可能被記錄下來,形成數(shù)據(jù)。sora的出現(xiàn),未來可以依據(jù)價值體(如組織、企業(yè)、個人、群體的標簽畫像、行為為記錄,可以方便地生成和還原完整現(xiàn)實世界的一切原始模型和軌跡。
也就是說,可能不需要查看攝像頭視頻,或需要畫像專家依據(jù)目擊者的描述來勾勒嫌犯的畫像,就可能直接生成相關的視頻(不只是靜態(tài)畫面)。因此,未來,你擁有多少財富、物資和房產(chǎn),在平臺里都是透明的,你所花的任何一筆錢,其實也是透明的.
這個可能導致的結果,隨便一筆花費別人都知道。如果是來路不正的錢,可能都不會有機會花費,違法犯罪行為也更都無法隱藏。所以,數(shù)字技術的發(fā)展,會驅使人們提升精神和道德的修養(yǎng),使得人們可能會更多地從物質層面的追求,轉向精神層面的追求和探索。
Sora只是小試牛刀,它展現(xiàn)的不僅僅是一個視頻制作的能力,而是大模型對真實世界有了理解和模擬之后,會對整個人類社會全方位帶來新的突破和變革。
04
結語
中國人常說:“六六大順、逢七必變”這句話。對于數(shù)字“七”包含著許多奧妙,例如7日來復,一周有7天,7年之癢,公司7年一個坎,個人職業(yè)往往7年會有起落等等。
二十一世紀有三個7,,一個“七”已經(jīng)讓人頭痛,兩個“七”更加復雜,3個代表“多”,很多事情都可能要變,二十一世紀會是非??焖俚囊粋€時期。因此,如果再拿二十世紀的思維,有可能是行不通。比如在數(shù)字化時代,我們可以彎道超車和選擇新的路徑,而簡單地照搬西方的思想和管理模式可能行不通。當然,這并不意味著我們之前學習和西方學習沒有必要,相反,之前的學習是非常有必要的。
Sora的出現(xiàn)是人類AI技術新的里程碑,我們在AI上暫時落后于美國,但任何事情有好有壞,AI對人類的沖擊和顛覆的后果還未最終驗證。有一種觀點,認為所有的創(chuàng)造發(fā)明其實都是發(fā)現(xiàn),即讓人們在合適的時間“發(fā)現(xiàn)”,在我們發(fā)現(xiàn)這些規(guī)律和科學奧秘之前,它們本就一直存在和起作用。
道德經(jīng):“天網(wǎng)恢恢,疏而不失(漏)”,如果“天網(wǎng)”看成是一個看不見、摸不著的高維“數(shù)字系統(tǒng)”,天網(wǎng)和現(xiàn)實世界的對接和映射,并將現(xiàn)實世界的萬事萬物進行了記錄和存檔。Sora的問世讓現(xiàn)實世界和數(shù)字世界連接和孿生趨向無縫連接和融合,那么天網(wǎng)系統(tǒng)、現(xiàn)實世界和數(shù)字世界三者的相互作用,又將會進一步給我們的未來帶來更多的變化。
中國傳動網(wǎng)版權與免責聲明:凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(wǎng)(www.connectcrack.com)獨家所有。如需轉載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。
本網(wǎng)轉載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。
產(chǎn)品新聞
更多>2025-04-30
性能躍升20%!維宏NK300CX Plus數(shù)控系統(tǒng)...
2025-04-11
2025-04-08
【產(chǎn)品解讀】全面提升精密制造檢測節(jié)拍...
2025-03-31
應用案例 | 使用宏集TELE監(jiān)控繼電器監(jiān)控...
2025-03-26
2025-03-20