【本報訊】「如果說ChatGPT模擬了人類的思維能力,那Sora則是對整個物理世界的模擬。」當地時間2月16日,OpenAI正式發佈首個文生視頻大模型Sora,圍繞著Sora技術配方的猜測,對行業影響的討論,儼然成為了科技圈的頭條。Sora崛起究竟給技術界,乃是人类社会帶來哪些啟示?
Sora爆火出圈將顛覆行業發展
2022年12月,ChatGPT概念的橫空出世,讓AI掀起一波大行情。餘溫尚未冷卻,今年春節後,AI全線再度大爆發,而這次的催化劑是Sora概念,這也是Open AI再次扔出的一副「王炸」。
業內人士樂觀地認為2024是AI行業的「視頻大年」,但對其發展時間的預期還是過於保守。比如,Pika聯合創始人Chenlin Meng在去年接受採訪預測:「目前視頻生成處於類似GPT-2的時刻。」而Sora所呈現的效果還是打破了業內人士的預期。Sora不僅能夠根據文字指令創造出逼真的場景,生成長達1分鐘的視頻,而且一個視頻內可實現多角度鏡頭切換,邏輯性和流暢度均佳。相較此前火爆一時的Runway、Pika等視頻工具,Sora的革命性表現地更加淋漓盡致。憑藉其驚人的視覺效果,Sora迅速火爆全球。
Sora的誕生可能會給人類帶來多方面的影響。首先,Sora作為一種強大的視頻生成工具,可以極大地降低視頻製作的門檻和成本,使得更多人能夠輕鬆創建高質量的視頻內容。這將為媒體、廣告、教育、娛樂等多個行業帶來變革,加速視頻內容的生產和傳播。其次,Sora的出現也可能促進AI技術的發展和應用。隨著Sora等AI工具的普及,人們對AI技術的認知和需求可能會進一步增加,從而推動AI技術在更多領域的應用和發展。
中國國內的業內人士認為,Sora的誕生可能會對某些行業的從業者產生一定衝擊,但並不會直接導致他們失業。同時,Sora的推出也將催生新的職業和就業機會。隨著人工智慧技術的不斷發展,將需要更多的專業人才來從事相關的研究、開發和應用工作。
但是值得注意的是,Sora 視頻的長度和品質超出了迄今為止所見的水準,部分視頻已經難辨真假,「眼見為實」已經是過去時。隨著視頻內容的自動生成,可能會出現大量低質量、重複甚至是誤導性的內容。這可能需要人們更加謹慎地篩選和評估所接觸到的視頻資訊。
人工智能終將改變世界
其實Sora的出現並不只是顛覆哪個行業的問題,更是關係到未來人類的生活方式。這種從純文本到圖片、音頻,乃至現在的視頻,AIGC(生成式人工智慧)技術的跨模態屬性已經越來越明顯,人類必須準備好迎接一個可能以假亂真的虛擬世界。
深入瞭解,可以瞭解到真正的Sora是作為世界模擬器視頻生成模型的存在,換個說法就是視頻版的初代源代碼。Sora可以擴展生成視頻,並在時間上向前或者向後延展視頻。只要通過簡單的提示,Sora就可以創造出一個小世界,而它可以記錄提取,更重要的是它可以隨意操縱這個世界。Sora使用這個方法向前和向後擴展視頻,從而產生無縫的無限迴圈。另外它還可以篡改視頻環境,鏈接多個視頻,融合多個視頻的世界。
更震撼的是Sora具有遠程相干性和保持物體的持久性,所以它創造的世界不是一瞬間,而是可持久的,其創造的世界中的元素是真實持續的,甚至是有因果關係的。另外它創造的世界是可以互動的。綜上可得,Sora是能夠理解現實世界的物理規律,正確呈現它們在物理世界中的存在方式,例如角色在被遮擋後仍能持續存在、人在吃漢堡後留下咬痕。
這也標誌著人工智慧在理解真實世界並與之互動的能力方面,實現了質的飛躍。馬斯克感歎「人類願賭服輸」,360集團創始人、董事長兼CEO周鴻祎預言「AGI(通用人工智慧)實現將從10年縮短到1年」。
Open AI官方隱晦地說:「我們的結果表明擴展視頻,生成模型是構建物理世界的通用模擬器的一條有前途的途徑。」他們謙虛地稱自己是世界的模擬器,其實是在創造的是一個全新的世界。
試想一下,當完善後的Sora接入了蘋果的Vision Pro,或是馬斯克的腦機介面,當人工智慧自己創造一個又一個世界,當人類進入這些世界時會變成什麼樣,這個世界會變成什麼樣呢?由此看來,Sora不僅僅是一個能改變行業的工具,它終將改變我們整個人類的未來。【編輯:溫遇桉】
編輯出版發行人:環球新聞時訊報
社長:魏月童
承印:環球電視有限公司
地址:香港上環幹諾道西20號中英大廈14樓1401室