人工智慧在去年給人類帶來巨大沖擊,不少聲音指出在創意等方面人類尚無法被其取代。這一想法再次遭到挑戰。當地時間2月15日,人工智慧巨頭,ChatGPT母公司OpenAI宣佈,正在研發“文生影片”模型Sora,可建立長達60秒的影片,其中包含高度詳細的場景、複雜的攝像機運動以及充滿活力的情感的多個角色,也可以根據靜態影象製作動畫。根據OpenAI官網,Sora不僅瞭解使用者提出的要求,還了解這些東西在物理世界中的存在方式。
目前,Sora仍在開發中,正在接受安全測試,尚未向公眾開放使用。OpenAI CEO奧特曼在社交平臺上向公眾徵集他們想看到的影片,表示公司將製作併發布。
OpenAI CEO奧特曼在社交平臺釋出Sora影片。
Sora影片一出,立刻震驚業界。此前,其他企業也有類似文字生成影片的AI模型,其中,正在測試名為Lumiere的模型,Meta則有名為Emu的模型,還有人工智慧初創企業Runway也在開發相應產品來幫助製作影片。
針對Sora影片的釋出,Runway聯合創始人兼執行長Cristóbal Valenzuela 回應道,“遊戲已經開始”。Runway是一家AI影片公司,幾個月前剛剛推出了AI影片模型的第2代更新,並且已可供所有人使用。
人工智慧影象生成領域的另一家領導者Stability AI在去年11月推出了生成影片模型Stable Video Diffusion,但表示它“專門用於研究”,尚未準備好用於“現階段的現實世界或商業應用”(有一個等待名單,但該公司尚未透露何時釋出)。
Pika Labs是AI影片領域的新晉競爭者,它於去年11月推出了生成式AI影片工具Pika 1.0,並於去年12月底宣佈“等待(名單)已結束”,並向所有人開放。
谷歌最近釋出了下一代人工智慧模型Gemini 1.5,並公佈了Lumiere 模型的研究和演示片段,不過目前還不清楚谷歌計劃何時公開該工具,該公司表示需要強大的工具來對抗偏見和惡意內容,確保其技術能夠安全部署。
Meta擁有包括Facebook、Instagram和WhatsApp在內的穩定應用程式,並於2022年首次推出了一款名為Make-A-Video的影片生成工具,該工具生成的內容明顯虛假、扭曲和模糊,但在當時仍然是一項重大成就。
Meta在去年年底推出了一種新的文字轉影片模型Emu Video,並表示幾乎所有使用它的人都將其在質量和對文字提示的忠實度方面評為高於“僅僅製作一個影片”(Make-A-Video),在談到該工具何時釋出時,Meta執行長馬克扎克伯格表示,Emu將被整合到Facebook和Instagram中。
特斯拉CEO埃隆·馬斯克的人工智慧初創公司xAI希望能夠與DeepMind和OpenAI等行業領導者競爭,但尚未宣佈文字到影片生成器的計劃,儘管這種功能可能會融入到其人工智慧聊天機器人 Grok中。
此外,亞馬遜已經透露了一款面向工人的生成式人工智慧聊天機器人Q和人工智慧影象生成器,儘管這家電子商務巨頭尚未透露何時計劃推出這些工具,也沒有透露是否會推出更先進的影片生成器。