就在這個月的16號,OpenAI官網上線了個震撼的東西——Sora影片模型。這貨不簡單,能夠根據我們說的話,畫的圖,轉化成長達一分鐘的影片,而且畫面質量超級棒,聽話得很。
為什麼說Sora是個大革命?
首先,Sora是OpenAI搞出來的第一個能把文字變影片的模型。你沒聽錯,就是把文字故事變成動畫電影那種!這意味著,咱們即將迎來科技的新浪潮。Sora的出現,讓AI領域的競爭加速,也讓資本市場上的很多公司看到了新的增長點。
Sora到底有什麼本領?
別看Sora只能生成一分鐘的影片,但它能做的事情,真的是挺炸裂的。無論是根據你的一句話,一段描述,還是一張靜態圖,它都能變魔術似的生成影片。影片不僅清晰,還能展現複雜的場景和角色的生動表情,連鏡頭轉換都像大導演拍的電影一樣流暢。
Sora有哪些厲害的特點?
國泰君安的研究報告把Sora的特點總結為三個:“超長影片”,“多角度鏡頭”,“接近真實”的處理技術。這讓Sora在AI影片製作領域裡,秒殺了其他同行。
Sora比別的AI模型強在哪?
簡單來說,就是影片長、畫質好、細節豐富。其他AI做的影片,要麼是幾秒鐘的小短片,要麼就是畫面質量一般。而Sora,無論是影片的連貫性還是場景的真實度,都做得非常出色。
不過,Sora還在進步中
儘管Sora這麼厲害,但它還在成長的路上。目前還有些小問題,比如分不清左右,或者在描述一些隨時間變化的事件時可能會有點兒困難。不過,OpenAI說了,他們相信Sora能開啟一種全新的影片創作方式,讓我們對物理世界有更深的模擬和理解。
Sora的出現,代表著什麼?
簡單說,就是AI做影片的能力,大躍進了!Sora能深度模擬真實世界,這不僅是AI技術的一個巨大突破,也意味著人工智慧在理解和互動真實世界方面,又向前邁進了一大步。
應用前景廣闊
在過去的幾年裡,OpenAI以其革命性的創新引領了人工智慧領域的前進步伐。從2021年初的影象生成系統DALL·E到2022年末的聊天機器人ChatGPT,OpenAI不僅推動了AI技術的發展,也逐步改變了我們對未來工作方式的認知。
最新的突破來自於Sora模型,這個先進的系統能夠在一分鐘內生成高保真影片,不論是橫屏還是豎屏格式,它都能夠適配,為影片創作領域帶來了前所未有的靈活性。這意味著,無論是在電影製作、電視內容製作,還是在自媒體領域,Sora的應用都將開啟新的可能性。
據國盛證券分析,Sora的出現標誌著影視動畫行業的一個顛覆性時刻。Sora模型的設計基於對DALL·E和GPT研究的深化,並且利用了DALL·E 3的高階提示詞技術來為視覺模型訓練資料生成富有描述性的標註,從而使得模型能夠更精確地根據文字指令進行創作。
360集團的創始人周鴻禕指出,Sora採用了與眾不同的技術路徑。以往的影片和影象生成依賴於真實圖片的Diffusion組合,而OpenAI這次則是將其大語言模型的優勢與Diffusion技術相結合,讓Sora不僅能夠理解現實世界,還能夠模擬它,這樣生成的影片更加真實,突破了傳統2D範圍的限制。
周鴻禕進一步強調,這種大模型的應用前景廣闊,它不僅能夠處理大量影片資料,而且能夠在影象傳達資訊量方面實現巨大的飛躍。這種進步讓通用人工智慧(AGI)的實現看起來不再是遙不可及的夢想,而是可能在不久的將來成為現實。
他預見,藉助強大的大模型基礎,結合對人類語言、知識和世界模型的深入理解,再加上多種技術的融合使用,我們能夠在各個領域創造出超級工具,這不僅包括生物醫學、蛋白質和基因研究,還有物理、化學、數學等學科的研究。Sora對物理世界的模擬能力,尤其是在機器人具身智慧和自動駕駛技術方面,預示著巨大的變革。
Sora的能力在理解並呈現物理定律方面將帶來該領域的革命性突破,也引起了工信部資訊通訊經濟專家委員會委員、數字經濟專家劉興亮的關注,他將其視為AI技術在內容創作領域開啟的新紀元。
劉興亮對Sora的評價尤其值得關注。他指出,Sora能夠在短短一分鐘內生成1080P高畫質影片,內容涵蓋多個角色、各種動作和背景細節,達到了接近電影級別的逼真效果。這不僅極大地豐富了觀眾的視覺體驗,也為內容創作者提供了強大的工具,使他們能夠以更低的成本、更快的速度把創意變為現實。這一技術的飛躍,預示著AI將在未來人類生活的方方面面扮演更加重要的角色。
從市場趨勢來看,2022年被譽為影像之年,2023年為聲波之年,而2024年則被預見為影片之年。OpenAI宣佈,Sora將作為構建世界模型的基石,推動著向實現通用人工智慧(AGI)的目標邁進。
此外,對於Sora的進一步發展,算力需求的旺盛成為不可忽視的話題。指出,Sora模型將推動AI多模態領域實現飛躍式的發展,相關領域如AI創作將經歷深度變革,AI的賦能範圍將進一步擴大。這不僅意味著多模態訓練及推理應用對算力基礎設施的需求將大幅提升,國盛證券也強調,遵循AI縮尺律,隨著訓練計算量的增加,樣本質量的顯著提升將使得算力需求成為多模態時代最核心的瓶頸之一。
重點關注:
我們的世界因為一些超級聰明的電腦程式——我們稱之為AI(人工智慧)——變得更加智慧。這些AI能做很多事情,比如幫助我們建立影片、圖片,甚至是寫文章。但是,讓這些AI執行起來,需要很強的電腦力量,我們叫它“算力”。
最近,有一種趨勢,全球對這種強大的電腦力量的需求正在飛速增長。這對於中國的一些公司來說,是一個大機會。據南方財富網的資料顯示,中國股市上有52家公司正在做與AI算力相關的事情。這些公司做的事情包括製造AI伺服器的零件、組裝伺服器、出租算力,還有建設資料中心等等。
有些公司專門做伺服器的零件,比如海光資訊、寒武紀等;有的公司則是把這些零件組裝成完整的伺服器,比如高新發展、神州數位等;還有的公司提供算力租賃服務,比如恆潤股份;還有的公司負責建設資料中心,儲存大量的資訊,比如奧飛資料。
不僅如此,還有很多大公司也在積極佈局AI基礎設施。比如,萬興科技就宣佈,他們的影片創意產品可以用來做各種影片的創作和剪輯,他們還有一個叫做“天幕”的大模型,專門用於影片創意類的AI技術。
崑崙萬維和Opera也在做短影片,而崑崙萬維的一個大模型在一次評測中拿到了第一名。還有當虹科技,他們開發了一種工具,可以把靜態照片變成三維的影片。
總的來說,有超過10家中國上市公司在過去三個月裡,分享了他們在影片生成模型領域的進展。這顯示出中國在AI算力方面正在快速發展,為世界的智慧化貢獻力量。