作者|陶然 編輯|魏曉
訊飛星火離GPT-4又近了一步。
2024年1月30日下午,星火大模型3.5版本正式釋出,公司董事長劉慶峰保持著和此前每次釋出會一樣的激動神情,照例將星火大模型與GPT-4模型能力和具體應用分別對比。
語言理解、數學能力已經超過GPT-4 Turbo,程式碼能力達到GPT-4 Turbo的 96%,多模態理解達到GPT-4V的 91%。
畢竟,過去一年,自稱追趕者的科大訊飛反覆強調著對標:2023年對標GPT-3.5,2024上半年對標GPT-4。
但這一次,比起對標GPT,科大訊飛似乎更有意強調另一項更為基礎的工程:國產自主可控的算力平臺。
這次大模型版本更新,官方最早給出的預告中就明確表示,星火V3.5是“首個基於全國產化算力平臺訓練的全民開放大模型”。而在今天的釋出會現場,劉慶峰又多次談及國產、、談及訊飛與華為如何被極限施壓、怎麼合作破局。
核心元件之一,便是與華為合作開發的大模型算力平臺“飛星一號”。
去年上半年,我們就和華為成立了聯合的特戰隊,5月6號星火大模型釋出之後,任正非看到了成果之後,親自決定要派華為史上最高規格的特戰隊加入(訊飛)聯合研發。
時任華為輪值董事長徐直軍也表示,他對國產大模型“充滿信心”。
華為大約已經成了國內科技行業的諾亞方舟,來來往往,大家都想攀上這艘大船。
“全國產化”
距離這場釋出會上被多次提及的“飛星一號”首次釋出的日期,實際上已經過去了三個月。
早在2023年10月的第六屆世界聲博會,科大訊飛就已經同華為官宣了“飛星一號”大模型算力平臺的亮相。當時的說法是,該平臺基於華為昇騰生態打造、自主可控,可用來訓練對標GPT-4的、上萬億浮點引數規模的大模型。
在此之前,科大訊飛和華為已經將昇騰910B的能力,由對標英偉達A100的20%、30%提升到了90%。
科大訊飛也在此平臺的基礎上,開啟了星火大模型對標GPT-4的更大規模訓練。
這樣來看,今天“首個基於全國產化算力平臺訓練”的大模型釋出,可以被視作“飛星一號”的首批大模型落地成果。在保持AI能力升級的前提下實現“全國產化”,也足夠驗證訊飛與華為聯合打造的算力平臺已經具備了相當的實用性。
此前釋出工具,現在陸續開始有了成果。
釋出會現場的演講,還透露了更多細節——“飛星一號”剛剛開始(執行)90多天,且中途還有很多工具調優的過程,訓練時間比較短。以及,劉慶峰非常有信心,訊飛今年上半年“還會有非常大的提升。”
對於公司與華為的合作,劉慶峰稱其為“深度聯手”,並表示國內有很多相關生態也在快速跟進,大模型產業的兩個方向,一是源頭技術向GPT-4(以及今年可能會更新的5)這些行業頂尖看齊,二是大模型需要大規模落地產業化。
總之,自主可控是大模型長期主義的前提。包括訊飛在內,國內不少科技企業顯然已不再指望外部環境有轉機,國產化算力硬體的效能如今及時跟上,卡脖子問題的解法已經越來越多、越來越便捷。
高投入一年之後
一天前,1月29日,科大訊飛釋出了2023年度業績預告。
初步計算,科大訊飛2023年預計實現營業收入200億人民幣以上,同比增長約7%;歸母淨利潤6.45至7.3億元,同比增長15%-30%;扣除非經常性損益後的淨利潤 8000萬元至1.2億元,同比驟降71%-81%。
對於扣非淨利潤大幅度下降的原因,科大訊飛在公告中給出了與此前財報季相似的解釋,即公司在核心技術自主可控和產業鏈可控的國產化替代方面堅定投入,搶抓通用人工智慧的歷史新機遇,在自主可控平臺上加大認知大模型研發投入。
高投入能帶來技術優勢,但不可避免會影響當期利潤。
公司過去一年的股價也是大起大落,2023年6月一度漲至每股81.88元高位,最新收盤價僅為41.14/股,近乎腰斬。
這樣來看,劉慶峰在釋出會上強調的大模型落地產業化,無疑更為迫切。
訊飛還是選擇從老本行開始發力,語音、教育和醫療:釋出會上,星火語音大模型首次釋出,介紹稱該模型由多語種語音合成,在首批37個主流語種上已整體超越OpenAI的Whisper-large-v3;主打toB/G、內建星火大模型V3.5的新一代星火智慧黑板釋出,具備多模態理解、自然語言互動等大模型標配能力。
以及,前段時間市場訊息顯示,拆分自科大訊飛的訊飛醫療擬在港股主機板上市,主打概念就包含AI醫療。去年10月24日星火大模型V3.0的釋出會中,訊飛方面稱星火大模型“已經在醫療領域超越GPT-4”。
只是,從營收資料上看,訊飛醫療在2021年、2022年分別錄得淨虧損8940.1萬元、2.09億元,2023年前三季度則由上年同期的1.63億元虧損增加至1.7億元,並未有任何依靠AI盈利的跡象。
AI醫療的效果和變現能力成色幾何,還有待時間檢驗。
倘若真如一些分析師的預測,通用大模型在數量上已經供大於求,最終能獲得可觀收益的玩家不會剩下太多,那高投入的訊飛想成為贏家之一,就必須找到高回報的途徑,並驗證這種途徑的可行性。
大模型本體已經完備的科大訊飛,還在等待收穫期。
來源|AI藍媒匯 作者|陶然