時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

Sora如何降維打擊其他文生影片大模型?記者實測對比

2024-02-19 08:15:04

OpenAI的文生影片大模型Sora已經發布兩天,其衝擊力依然不減。

2月18日,新京報貝殼財經記者進行了Sora與其他文生影片大模型的對比測試,發現Sora在時間和影片生成質量上均對“同行”產生了“降維打擊”:其他文生影片大模型僅能生成3至4秒的影片,而Sora生成的影片時間最多可達1分鐘,且景物也更加清晰穩定、符合描述。

不過,隨著越來越多使用Sora製作的影片出現以及部分技術細節的公開,業界開始對其進行全方位審視,其中,讚揚和驚歎聲不少,但Sora生成的影片也被發現存在諸多不合理之處。

文生影片對比實測:Sora從“動圖”升級到“短片”

“一個時髦的女人走在東京的街道上,街道上充滿了溫暖發光的霓虹燈和生動的城市標誌。她穿著一件黑色的皮夾克,一件紅色的長裙,一雙黑色的靴子,還帶著一個黑色的錢包。她戴著太陽鏡,塗著紅色的口紅。她自信而隨意地走著。街道是潮溼和反光的,創造了一個五顏六色的燈的鏡面效果。許多行人走來走去。”這是OpenAI官網介紹Sora時,出現的第一組提示詞。

在OpenAI推出Sora之前,文生影片領域的創業公司主要包括Pika、Runway等,為了驗證Sora的能力,新京報貝殼財經記者將上述同樣的提示詞輸入Pika文生影片模型,以及Runway旗下的Gen-2video文生影片模型進行了實測。

在相同提示詞下,新京報貝殼財經記者使用Pika生成的影片截圖。

在相同提示詞下,新京報貝殼財經記者使用runway旗下Gen-2video生成的影片截圖。

OpenAI官網上Sora生成的影片。

貝殼財經記者發現,在相同的提示詞下,Pika僅能生成3秒的影片,Gen-2video則可以生成4秒的影片。其中,Pika的影片為“時髦女人”的背影,無法體現她“戴著太陽鏡,塗著紅色的口紅”的描述,不過對於提示詞中“潮溼反光的街道和五顏六色燈的鏡面效果”體現得較好,但整體上影片較為模糊。

Gen-2video則跳出了“無法輸入這麼多提示詞”的彈窗,並根據能夠輸入的部分生成了一個4秒的影片,該影片相比Pika顯然精細很多,也符合提示詞描述的人物形象,包括“街道、人群、黑錢包”等。

但可以發現,無論是Pika還是Gen-2video,都忽略了“一件紅色的長裙”這個細節,且貝殼財經記者透過觀看影片發現,這兩段影片仍能看出AI生成的影子,特別是Gen-2video的人物臉部,有細微的形變,這正是AI生成影片的特點之一:難以始終保持同一人物的連貫性。

而Sora不僅體現了提示詞中的全部細節,而且還很好地保持了人物的連貫性,使得該影片幾乎可以“以假亂真”。當然,如果仔細觀察,可以發現該影片中人物的腳步在某幾個幀會出現不自然的扭曲,以及該影片中的背景廣告牌雖然酷似日文,但由於目前AI還無法直接在影片中“認識”文字,其只能生成似是而非的“日文”,這都是AI生成影片的特點之一。

但即便如此,Sora還是用事實顯現出了同其他文生影片大模型的代差。

在谷歌和推特都有從業經歷的AI創業者Gabor Cselle也釋出了使用相同提示詞,在其他四個文生影片模型中“復現”Sora“穿過下雪、櫻花飛舞的東京街道……”的場景,並表示“其他模型達不到能和Sora比較的效果”。

Gabor Cselle社交賬號截圖。

在國內,也有不少AI從業者直觀地感受到了Sora帶來的衝擊。

清華大學瀋陽教授團隊一直聚焦AI在各個領域的應用,並也一直在使用AI模型進行文生影片的操作。2月17日,他在朋友圈釋出了一條團隊成員花兩天製作的“半失敗”AI影片,並表示“從這裡可以看出和Sora的差距,我讓她暫時放棄這個作品,等演算法升級再重做一下。”

對於Sora出現後,使用AI製作影片的工作能否繼續,瀋陽回覆貝殼財經記者“慢慢弄,往前挪唄”。

理解物理世界 顛覆影視、遊戲行業 Sora是“通用世界模型”嗎?

為何Sora能夠在影片生成的質量上明顯領先同業產品?OpenAI在官方網站上表示,Sora是能夠理解和模擬現實世界的模型的基礎,相信這一能力將是實現通用人工智慧的重要里程碑。不過,Sora還存在很多不完善之處,仍然處於世界模型研究應用的初期階段。

什麼是世界模型?貝殼財經瞭解到,實際上runway公司在去年12月就提出過要開發通用世界模型(General World Model),用其旗下的Gen-2模型來模擬整個世界,“我們相信,人工智慧的下一個重大進步將來自理解視覺世界及其動態的系統,這就是為什麼我們要圍繞通用世界模型開始一項新的長期研究工作。”

從效果上看,目前OpenAI已經透過Sora部分做到了這一點,因為只有理解物理世界的執行法則,文生影片模型才能創造出更加逼真的影片。英偉達高階科學家Jim Fan就對此表示,Sora是一個數據驅動的物理引擎,“它是對許多世界的模擬,無論是真實的,還是虛構的。該模擬器透過去噪和梯度學習方式,學習了複雜的渲染、直觀的物理、長期推理和語義理解。”

而理解現實世界的物理法則,也正是通往通用人工智慧這一“終極目標”的必經之路。

對此,不少科技圈名人都發出了驚歎,馬斯克直接在社交平臺上釋出短評“GG世界”(GG是網路遊戲的用語之一,原指遊戲結束時玩家互相致意,後引申為“遊戲結束”)。

360公司董事長周鴻禕則直接在朋友圈發文稱,一旦AI能夠接上攝像頭,觀看並理解世界上所有的電影,它對世界的理解能力將遠遠超過僅僅透過文字學習所能達到的水平。在這種情況下,實現通用人工智慧不再是遙不可及的夢想。周鴻禕甚至預測,這一天可能在一兩年內就會到來,而不是十年或二十年。

在現實層面,有更多人擔心文生影片大模型可能直接衝擊影視和遊戲行業。美國舊金山早期投資人Zak Kukoff預測,在5年內,一個不到5人的團隊將可能用文生影片模型製作出一部票房收入超過5000萬美元的電影。

值得注意的是,日前大火的遊戲《幻獸帕魯》的開發團隊就僅有4人,有許多人質疑該團隊使用了AI生成技術製作遊戲角色,以節省成本。而根據OpenAI 釋出的最新Sora技術報告,Sora能夠模擬影片遊戲的數字化過程,Sora能在控制 Minecraft 遊戲角色進行基本操作的同時,高質量動態渲染遊戲世界。這意味著,個人開發製作遊戲的門檻可能會被進一步降低。

前阿里巴巴副總裁,Lepton AI公司創始人賈揚清則直接評價Sora“真的非常牛”,他表示Sora的問世可能會給對作OpenAI的公司帶來一波被大廠FOMO(害怕錯過機會而導致的收購)收購的機會。賈揚清預測,大模型市場長期仍將呈現閉源寡頭的格局,開源大模型仍然需要一段時間才能追趕上,而從演算法小廠的角度來看,要麼在演算法上與OpenAI媲美,要麼深耕垂直領域的應用,要麼選擇開源道路;最後,基礎設施的需求將繼續猛增。

記者聯絡郵箱:luoyidan@xjbnews.com

新京報貝殼財經記者 羅亦丹

編輯 嶽彩周

校對 盧茜

熱門資訊
  • 南航全新空客A321neo客機助力海南航空市場發展 | 2024-11-30 21:21:25
  • 華碩海外推出靈耀 RT-BE14000 三頻 Mesh 路由器,139 美元 | 2024-11-30 21:39:07
  • B&O Beoplay Eleven 入耳式耳機上架官網:,499 歐元 | 2024-11-30 21:48:57
  • JCI:彭宏凌/傅徵/單強/黃偉珊團隊發現,敲除這個基因,讓CAR-T細胞更持久,從而降低腫瘤複發率 | 2024-11-30 21:53:24
  • 33年前,美國曾做過一個實驗,把4男4女關在一起兩年,結果如何? | 2024-11-30 21:53:36
  • 神舟十九號將出艙安裝“防護罩”,才發射一個月,為何神舟二十號已待命 | 2024-11-30 21:54:07
  • 專訪科大訊飛副總裁王瑋:科技發展的意義是為不能作戰的人而戰|無障礙奮進者好故事 | 2024-11-30 22:23:17
  • 搶灘低空經濟,飛行汽車能否撐起下一程? | 2024-11-30 22:27:59
  • 俄羅斯16nm晶片,來了 | 2024-11-30 23:22:02
  • 光啟技術“重構世界”:從尖端裝備到無人機再到無限可能 | 2024-11-30 23:43:15
  • 小米米家聲波掃振電動牙刷Pro預約:彩屏數顯/180天續航,199元 | 2024-11-30 23:56:44
  • 某"大品牌"的無風扇PC正在製造中 採用AMD桌上型電腦處理器 | 2024-12-01 01:30:36
  • 埃隆·馬斯克認可蘋果 AirPods Pro 2 助聽器功能 稱其"夠酷" | 2024-12-01 01:30:39
  • “江蘇製造”2噸級以上eVTOL日本首飛成功 | 2024-12-01 01:58:08
  • 東航第9架C919入列,國產大飛機首現客艙區域網服務 | 2024-12-01 02:31:19
  • Nature|幹細胞樣CD4+T細胞的分化控制抗腫瘤免疫 | 2024-12-01 02:45:01
  • 一顆“神奇”的晶片 | 2024-12-01 03:31:54
  • 峰飛航空:中國噸級以上 eVTOL 電動垂直起降航空器完成日本首飛 | 2024-12-01 03:38:51
  • 國科能源申請基於充放電溫升的長迴圈磷酸鐵鋰電池迴圈壽命預測方法專利,預測電池迴圈壽命 | 2024-12-01 04:26:22
  • 傳鴻鈞微電子裁員50%!國產Arm伺服器CPU還有機會嗎? | 2024-12-01 04:26:25
  • 新華全媒+|我國首型4米級運載火箭長征十二號首飛成功 | 2024-12-01 04:50:45
  • 它們留給後代的唯一禮物是數十億個病毒,用來保平安 | 2024-12-01 06:27:28
  • 新華鮮報|首飛、首發告捷!中國商業航天“三大件”齊了 | 2024-12-01 06:40:52
  • 馬斯克點贊蘋果 AirPods Pro 2 助聽器功能:“很酷” | 2024-12-01 07:00:15
  • 胰島素口服不是夢:無針膠囊正在改變藥物遞送方式 | 2024-12-01 07:25:12
  • 上海寒武紀申請晶片效能測試專利,能夠提高晶片效能測試結果的準確性 | 2024-12-01 07:43:07
  • "歐羅巴快船"航天器正平穩駛向木星 研究木衛二隱藏的海洋 | 2024-12-01 07:43:15
  • 上海亞曼光電科技取得光刻機投影物鏡安裝調平裝置專利,方便對光刻機的投影物鏡進行調平 | 2024-12-01 07:44:53
  • 神十九乘組在軌“滿月” 多項空間科學實試驗並行開展 | 2024-12-01 08:12:42
  • 我國首個商業航天發射場首發成功 | 2024-12-01 09:21:10
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們