作者:孫妍 來源:IT時報
1月30日,釋出首個全國產算力訓練的全民開放大模型訊飛星火V3.5,其語言理解、語音互動和數學已經超過GPT-4 Turbo。同時,星火語音大模型也正式釋出,首批37個主流語種效果超過OpenAI Whisper V3,將在訊飛翻譯機上搭載,並推動網際網路客服、汽車、機器人等人機互動場景變革。
此外,劉慶峰提到,經過軟硬體深度最佳化,國產算力平臺“飛星一號”單機算效提升50%,通訊頻寬利用率提升40%,並行訓練演算法最佳化10%,其中,國產晶片的訓練效率已經與A100相當。
當前,星火開發者數量已超35萬,居於全國前列,為了賦能更多開發者和千行百業,訊飛星火首次開源130億引數大模型“星火開源-13B”,這一開源大模型也是基於全國產化算力平臺“飛星一號”訓練而成,在昇思開源社群聯合首發上線。
“在今天的大模型時代,我們絕不能只用開源模型做應用落地,在通用大模型的底座上一定要有國家隊站出來。”劉慶峰強調,我們要清醒地看到差距,當前在小樣本快速訓練、深度學習訓練、超複雜深度理解等領域距離GPT-4最好水平還有差距,訊飛星火有信心在今年上半年趕上GPT-4目前最好水平。
全國產化算力平臺首個成果 三大能力超越GPT-4 Turbo
2023年10月24日,科大訊飛與華為宣佈,首個支援萬億引數大模型訓練的萬卡國產算力平臺“飛星一號”正式啟用。啟用後的90多天裡,訊飛星火投入到對標GPT-4的更大引數規模的大模型訓練中。
2024年1月,訊飛星火V3.5誕生,成為全國產算力平臺“飛星一號”的首個成果。
訊飛星火V3.5升級了語言理解、文字生成、知識問答、邏輯推理、數學能力、程式碼能力和多模態能力這七大能力,其中,語言理解、數學能力超過GPT-4 Turbo,程式碼達到GPT-4 Turbo 96%,多模態理解達到GPT-4V 91%。
“在更好的資料、更強的人機協同訓練中,我們不能只看單個的‘原子’能力,而是要以技術進步來解決真實世界的剛需。”劉慶峰認為。
“聽說今年爾濱特別火,作為南方小土豆還挺想去玩一下的。要不你用東北話介紹下有啥好玩的唄?”
在實操演示環節,科大訊飛研究院院長劉聰和訊飛星火V3.5現場互動,訊飛星火V3.5一口地道的東北話逗樂現場觀眾。幽默之餘,訊飛星火V3.5快速為劉聰定製了旅遊攻略,還催促他趕快買票,春運機票緊俏。
訊飛星火V3.5正在成為一個“打工神器”,劉聰現場演示了使用訊飛智文製作的“合肥市2024年春節旅遊推廣策略”PPT,短時間內超20頁內容豐富的PPT一氣呵成,還能給每頁PPT生成演講備註,讓數字人自動演講。訊飛智文是基於訊飛星火V3.5的一款應用,可以一鍵自動生成文件和PPT。此外,它還對年終總結計劃、述職PPT、活動策劃、政策問答等任務“信手拈來”。
星火語音大模型首發 “百搭”C端硬體
“25年了,我們目標和夢想一天都沒有變。”劉慶峰迴憶道,科大訊飛是靠智慧語音起家的,現在大模型又給語音技術帶來了發展機會,藉助大模型,可以讓一段語音具有語種、內容、韻律、音色等屬性,最重要的是,還有情緒。
據劉慶峰介紹,星火語音大模型的評測效果已經達到國際領先,中文、英語、法語、俄語等首批37個主流語種的語音識別效果超過OpenAI Whisper V3,而在多語種語音合成方面,星火語音大模型的首批40個語種擬人度超83%。
星火語音大模型搭載的第一個C端硬體產品便是訊飛翻譯機,即將上線多語種自動識別和增強式翻譯兩個功能,分別於今年1月底和3月中旬完成升級。多語種自動識別支援35中語言,增強式翻譯主要針對中英雙語這一高頻互譯場景。
星火語音大模型的野望,當然不僅限於賦能自家硬體產品,而是要在汽車、客服、家庭、陪伴機器人等場景有用武之地,引爆大模型的硬體之戰。
大模型成億萬使用者助手 走進千家萬戶、千行百業
自去年5月訊飛星火正式釋出起,有超過60萬訊飛智慧辦公本、智慧錄音筆使用者累計呼叫語篇規整、會議紀要、自動寫稿等能力650萬次。目前,基於訊飛聽見、訊飛星火App、訊飛輸入法等應用,已累計賦能億萬使用者。
此次釋出會上,科大訊飛又推出了星火智慧黑板。釋出現場,愛因斯坦出現在星火智慧黑板上,用“吸力巨大的吸塵器”來比喻黑洞,深入淺出地為現場觀眾解釋“黑洞是什麼”。在立體幾何等知識的教學中,星火智慧黑板透過解構立方體,將枯燥的理論視覺化。
大模型正在透過硬體、軟體走入千家萬戶。一位浙江的小學老師,使用智慧問答高效完成教學方案設計,已累計使用APP262天、超2300篇;一位湖南的“情感諮詢師”,透過大模型諮詢人際關係等生活中的煩惱,現已累計使用161天、超9500次……
基於全國產化算力打造的訊飛星火V3.5支援異構算力排程,可實現行業大模型訓練提效90%,支援23個企業應用場景的敏捷最佳化。
“奇瑞是安徽的驕傲,連續十幾年都是中國汽車出口量的第一名。”劉慶峰介紹,奇瑞汽車出口的國家覆蓋英語、俄羅斯語、西班牙語、阿拉伯語、葡萄牙語等數十個語種,汽車中應用的智慧語音互動技術全都由科大訊飛提供。
在深入千行百業過程中,訊飛星火與太平洋保險打造數字勞動力,用程式碼能力賦能交通銀行客服、展業、辦公、研發等,與國家能源集團聯合在煤炭、電力、運輸、化工等方面打造央企集團一體化聯動的大模型應用標杆。
首發開源模型 深度適配國產算力平臺
在1月30日的釋出會上,130億引數的訊飛星火開源-13B首發,這也是首個基於全國產化算力平臺“飛星一號”的開源大模型。全棧自主創新是它的一大優勢,讓企業和學術研究機構可以方便地訓練專用大模型。
本次開源,既包含基礎模型iFlytekSpark-13B-base、精調模型iFlytekSpark-13B-chat,也開源了微調工具iFlytekSpark-13B-Lora、人設定製工具iFlytekSpark-13B-Charater。
星火開源-13B在多項知名公開評測任務中名列前茅,在文字生成、語言理解、文字改寫、行業問答、機器翻譯等企業典型場景中,透過對學習輔助、語言理解等領域的深入研究和最佳化,大幅提升了其實用性,效果顯著優於其他同等尺寸的開源模型。對於追求高效能而對成本敏感的企業來說,是一種價效比較高的解決方案。
在星火開源-13B訓練過程中,國產軟硬體環境的深度最佳化帶來了顯著的成果。科大訊飛與華為利用昇思MindSpore AI框架,訓練效率提升40%,協同昇騰AI硬體,訓練策略針對昇騰算力最佳化,訓練效率達A100的90%。
在全球晶片供應鏈緊張的背景下,國產算力的突破為大模型行業的發展提供了強有力的支撐。
目前,華為昇思開源社群已上架星火大模型開源版-13B,面對學術、企業研究完全免費,增進學術合作的同時,增進產業探索。