全國產化算力平臺成果首發訊飛星火V3.5三方面超GPT-4 Turbo

作者：孫妍來源：IT時報

1月30日，釋出首個全國產算力訓練的全民開放大模型訊飛星火V3.5，其語言理解、語音互動和數學已經超過GPT-4 Turbo。同時，星火語音大模型也正式釋出，首批37個主流語種效果超過OpenAI Whisper V3，將在訊飛翻譯機上搭載，並推動網際網路客服、汽車、機器人等人機互動場景變革。

此外，劉慶峰提到，經過軟硬體深度最佳化，國產算力平臺“飛星一號”單機算效提升50%，通訊頻寬利用率提升40%，並行訓練演算法最佳化10%，其中，國產晶片的訓練效率已經與A100相當。

當前，星火開發者數量已超35萬，居於全國前列，為了賦能更多開發者和千行百業，訊飛星火首次開源130億引數大模型“星火開源-13B”，這一開源大模型也是基於全國產化算力平臺“飛星一號”訓練而成，在昇思開源社群聯合首發上線。

“在今天的大模型時代，我們絕不能只用開源模型做應用落地，在通用大模型的底座上一定要有國家隊站出來。”劉慶峰強調，我們要清醒地看到差距，當前在小樣本快速訓練、深度學習訓練、超複雜深度理解等領域距離GPT-4最好水平還有差距，訊飛星火有信心在今年上半年趕上GPT-4目前最好水平。

全國產化算力平臺首個成果三大能力超越GPT-4 Turbo

2023年10月24日，科大訊飛與華為宣佈，首個支援萬億引數大模型訓練的萬卡國產算力平臺“飛星一號”正式啟用。啟用後的90多天裡，訊飛星火投入到對標GPT-4的更大引數規模的大模型訓練中。

2024年1月，訊飛星火V3.5誕生，成為全國產算力平臺“飛星一號”的首個成果。

訊飛星火V3.5升級了語言理解、文字生成、知識問答、邏輯推理、數學能力、程式碼能力和多模態能力這七大能力，其中，語言理解、數學能力超過GPT-4 Turbo，程式碼達到GPT-4 Turbo 96%，多模態理解達到GPT-4V 91%。

“在更好的資料、更強的人機協同訓練中，我們不能只看單個的‘原子’能力，而是要以技術進步來解決真實世界的剛需。”劉慶峰認為。

“聽說今年爾濱特別火，作為南方小土豆還挺想去玩一下的。要不你用東北話介紹下有啥好玩的唄？”

在實操演示環節，科大訊飛研究院院長劉聰和訊飛星火V3.5現場互動，訊飛星火V3.5一口地道的東北話逗樂現場觀眾。幽默之餘，訊飛星火V3.5快速為劉聰定製了旅遊攻略，還催促他趕快買票，春運機票緊俏。

訊飛星火V3.5正在成為一個“打工神器”，劉聰現場演示了使用訊飛智文製作的“合肥市2024年春節旅遊推廣策略”PPT，短時間內超20頁內容豐富的PPT一氣呵成，還能給每頁PPT生成演講備註，讓數字人自動演講。訊飛智文是基於訊飛星火V3.5的一款應用，可以一鍵自動生成文件和PPT。此外，它還對年終總結計劃、述職PPT、活動策劃、政策問答等任務“信手拈來”。

星火語音大模型首發 “百搭”C端硬體

“25年了，我們目標和夢想一天都沒有變。”劉慶峰迴憶道，科大訊飛是靠智慧語音起家的，現在大模型又給語音技術帶來了發展機會，藉助大模型，可以讓一段語音具有語種、內容、韻律、音色等屬性，最重要的是，還有情緒。

據劉慶峰介紹，星火語音大模型的評測效果已經達到國際領先，中文、英語、法語、俄語等首批37個主流語種的語音識別效果超過OpenAI Whisper V3，而在多語種語音合成方面，星火語音大模型的首批40個語種擬人度超83%。

星火語音大模型搭載的第一個C端硬體產品便是訊飛翻譯機，即將上線多語種自動識別和增強式翻譯兩個功能，分別於今年1月底和3月中旬完成升級。多語種自動識別支援35中語言，增強式翻譯主要針對中英雙語這一高頻互譯場景。

星火語音大模型的野望，當然不僅限於賦能自家硬體產品，而是要在汽車、客服、家庭、陪伴機器人等場景有用武之地，引爆大模型的硬體之戰。

大模型成億萬使用者助手走進千家萬戶、千行百業

自去年5月訊飛星火正式釋出起，有超過60萬訊飛智慧辦公本、智慧錄音筆使用者累計呼叫語篇規整、會議紀要、自動寫稿等能力650萬次。目前，基於訊飛聽見、訊飛星火App、訊飛輸入法等應用，已累計賦能億萬使用者。

此次釋出會上，科大訊飛又推出了星火智慧黑板。釋出現場，愛因斯坦出現在星火智慧黑板上，用“吸力巨大的吸塵器”來比喻黑洞，深入淺出地為現場觀眾解釋“黑洞是什麼”。在立體幾何等知識的教學中，星火智慧黑板透過解構立方體，將枯燥的理論視覺化。

大模型正在透過硬體、軟體走入千家萬戶。一位浙江的小學老師，使用智慧問答高效完成教學方案設計，已累計使用APP262天、超2300篇；一位湖南的“情感諮詢師”，透過大模型諮詢人際關係等生活中的煩惱，現已累計使用161天、超9500次……

基於全國產化算力打造的訊飛星火V3.5支援異構算力排程，可實現行業大模型訓練提效90%，支援23個企業應用場景的敏捷最佳化。

“奇瑞是安徽的驕傲，連續十幾年都是中國汽車出口量的第一名。”劉慶峰介紹，奇瑞汽車出口的國家覆蓋英語、俄羅斯語、西班牙語、阿拉伯語、葡萄牙語等數十個語種，汽車中應用的智慧語音互動技術全都由科大訊飛提供。

在深入千行百業過程中，訊飛星火與太平洋保險打造數字勞動力，用程式碼能力賦能交通銀行客服、展業、辦公、研發等，與國家能源集團聯合在煤炭、電力、運輸、化工等方面打造央企集團一體化聯動的大模型應用標杆。

首發開源模型深度適配國產算力平臺

在1月30日的釋出會上，130億引數的訊飛星火開源-13B首發，這也是首個基於全國產化算力平臺“飛星一號”的開源大模型。全棧自主創新是它的一大優勢，讓企業和學術研究機構可以方便地訓練專用大模型。

本次開源，既包含基礎模型iFlytekSpark-13B-base、精調模型iFlytekSpark-13B-chat，也開源了微調工具iFlytekSpark-13B-Lora、人設定製工具iFlytekSpark-13B-Charater。

星火開源-13B在多項知名公開評測任務中名列前茅，在文字生成、語言理解、文字改寫、行業問答、機器翻譯等企業典型場景中，透過對學習輔助、語言理解等領域的深入研究和最佳化，大幅提升了其實用性，效果顯著優於其他同等尺寸的開源模型。對於追求高效能而對成本敏感的企業來說，是一種價效比較高的解決方案。

在星火開源-13B訓練過程中，國產軟硬體環境的深度最佳化帶來了顯著的成果。科大訊飛與華為利用昇思MindSpore AI框架，訓練效率提升40%，協同昇騰AI硬體，訓練策略針對昇騰算力最佳化，訓練效率達A100的90%。

在全球晶片供應鏈緊張的背景下，國產算力的突破為大模型行業的發展提供了強有力的支撐。

目前，華為昇思開源社群已上架星火大模型開源版-13B，面對學術、企業研究完全免費，增進學術合作的同時，增進產業探索。

全國產化算力平臺成果首發 訊飛星火V3.5三方面超GPT-4 Turbo

全國產化算力平臺成果首發訊飛星火V3.5三方面超GPT-4 Turbo