1月30日下午,正式釋出升級版星火V3.5大型語言模型以及首個開源大模型。據悉,星火開源大模型是在去年5月釋出的星火1.0版本(130億引數)大模型改進而來,增加了資料、能力、針對應用場景的工具鏈,並且針對國產安全可控進行了更系統性的設計,深度適配國產算力。
根據科大訊飛官方公佈的測試結果,星火開源大模型在典型應用場景方面效果領先其他同尺寸開源模型超20%。
截至當天下午收盤,科大訊飛股價上漲近2%。1月29日,科大訊飛釋出業績預告顯示,2023年公司淨利預計同比增長15%-30%,達到6.45億至7.3億元,預計2023年實現營業收入超過200億元,較上年增長約7%。
與星火開源大模型同時釋出的還有科大訊飛的升級版星火V3.5大模型。據悉,該模型基於科大訊飛與聯合釋出中國首個全國產支援萬億引數大模型訓練的"飛星一號"平臺完成訓練,但具體引數尺寸尚未對外公佈。
科大訊飛董事長劉慶峰稱星火3.5版本大模型在邏輯推理、語言理解、文字生成、數學答題、程式碼、各個能力方面均實現大幅提升,進一步逼近OpenAI公司GPT-4 Turbo的最新水平。
劉慶峰告訴第一財經記者:"通用大模型關鍵是看誰的效能好,而大模型開源是為了建立生態,因此從技術水平來看,一般開源大模型都會略低於通用大模型。"
科大訊飛的開源大模型並不是國內首個。
更早之前,浪潮資訊釋出了完全開源且可免費商用的源2.0基礎大模型,包含1026億、518億、21億不同引數規模,此外國內的開源大模型還有智源研究院的悟道·天鷹 34B大模型;上海人工智慧實驗室的書生·浦語大語言模型的升級版對話模型InternLM-Chat-7B大模型;清華大學團隊的VisualGLM-6B、ChatGLM2-6B大模型;阿里巴巴達摩研究院的多模態大模型mPLUG-Owl;百川智慧的Baichuan-7B、Baichuan-13B等。
展望2024年訊飛星火大模型發展,劉慶峰指出三點:首先,一定要在通用大模型的底層能力上持續對標國際最先進水平,從演算法研究包括更小的算力上做出相對更優效果;其次是要真正讓大模型"量質齊飛",不僅是行業應用,還要在很多關鍵技術創新上聯動大模型;第三是大模型要建立在安全可控的平臺之上,實現自主可控平臺上的生態繁榮。
劉慶峰說道,一方面是要清醒理智看到我們與國外的差距,當前在小樣本、快速訓練、多模態深度學習訓練、超複雜深度理解等領域,中國的大模型距離GPT-4的最好水平還有差距;另一方面 ,未來在對抗網路的深度連線等領域,需要整個創新的生態。
中國大模型的競爭正趨於白熱化,近期又有新的一批國產大模型透過備案。上週,監管機構批准了第四批14個大型語言模型向公眾開放使用,其中包括小米集團、第四正規化和零一萬物的AI大模型。據不完全統計,自去年8月以來,我國已經批准了總共超過40個大型語言模型。