新智元報道
編輯:編輯部
【新智元導讀】首個基於全國產化算力平臺「飛星一號」的大模型,正式開源!
1月26日,美國商務部長雷蒙多表示,拜登政府正在盡全力阻止中國獲得訓練AI模型所需的算力資源。
美國的公司,都被要求確定是否有外國實體正在訪問美國資料中心以訓練AI模型。
雷蒙多表示:「我們不能讓非國家主體、中國或我們不希望訪問我們的雲計算系統的人,來訓練他們的模型。」
顯然,在被算力卡脖子的當下,深度適配國產算力的開源大模型,意義格外重大。
就在1月30日,科大訊飛重磅釋出首個全國產算力訓練的全民開放大模型——訊飛星火V3.5。
實測結果顯示,訊飛星火V3.5在七大核心能力上都獲得了全面提升。甚至,在數學、語言理解和語音互動能力上還超越了GPT-4 Turbo。
而同時釋出的星火語音大模型,也在首批的37個主流語種上,實現了對OpenAI Whisper V3的超越。
此外,科大訊飛還首次開源了深度適配國產算力,擁有130億引數的iFlytekSpark-13B模型(星火開源-13B)。不僅場景應用效果領先,而且還對學術和企業研究完全免費。
昇思MindSpore開源社群:https://xihe.mindspore.cn/modelzoo/iflytek/introduce
啟智社群:https://openi.pcl.ac.cn/iflytek/iFlytekSpark-13B
Gitee地址:https://gitee.com/iflytekopensource/iFlytekSpark-13B
首個「全棧國產化」開源模型來了
具體來說,此次開源不僅包括基礎模型iFlytekSpark-13B-base、精調模型iFlytekSpark-13B-chat,還有微調工具iFlytekSpark-13B-Lora,以及人設定製工具iFlytekSpark-13B-Charater。
基於這些全棧自主創新的套件,企業和機構可以方便地訓練自己的大模型了。
那麼,基礎模型和精調模型效能如何?
可以看到,在C-EVAL、MMLU、CMMLU、AGIEVAL、FinancelQ等多項榜單測試中,與同尺寸開源模型相比,iFlytekSpark-13B更勝一籌。
而針對典型的應用場景,iFlytekSpark-13B在文字生成上提升23%,在語言理解上提升13%,文字改寫提升25%,行業問答提升50%,機器翻譯提升17%,頭腦風暴提升29%。
正是科大訊飛團隊對學習輔助、語言理解等領域的深入研究和最佳化,大幅提升了模型實用性,使得處理複雜任務時更得心應手。
這種最佳化不僅提高了模型的理解能力和生成質量,還確保了其在面對多樣化和專業化的應用場景時能夠保持高效和準確。
這對於追求高效能、低成本的企業來說,無疑有著巨大的吸引力,同時為各行各業的企業提供了一種價效比高的解決方案。
深度適配國產算力
面對算力的緊缺,只有國產算力取得突破,才能為大模型行業的發展提供強有力的支撐。
為此,訊飛星火與昇騰強強聯合,打造了全國產的通用智慧新底座,和基於自主創新的算力平臺。
2023年8月15日,「星火一體機」正式釋出——不僅可以為大模型提供源源不斷的算力,還能提供大模型的訓練、推理、最佳化、部署等全流程能力。
緊接著,在2023年10月24日又釋出了國內首個可以訓練萬億浮點引數大模型的大規模算力平臺「飛星一號」。
合作期間,科大訊飛發揮多年積累的演算法優勢,深度參與大模型底層運算元庫開發和最佳化、大模型演算法遷移和超大規模叢集智慧化運維軟體開發等工作。
而攻關團隊也放棄了中秋等節日的休息,才加班加點地推出了「飛星一號」平臺。
具體來說,「飛星一號」平臺採用的是昇騰AI叢集和大容量交換機構建無損ROCE組網,以及高空間的全閃和混閃並行檔案系統。
模型透過昇思MindSpore AI框架的訓練效率提升了40%,與昇騰AI硬體協同實現超強效能。
此外,訓練策略針對昇騰算力進行了極致最佳化,充分展示了國產算力在追趕國際先進水平方面的決心和能力。
有了國產軟硬體環境的深度最佳化,模型的訓練效果也直接翻番。
如今星火開源-13B的釋出,距離1024「訊飛星火認知大模型」V3.0的升級才剛剛過去三個月。
自主創新開源生態
而開源,則是為了推動人工智慧和機器學習領域的協作,在全球範圍內促進技術革新。
它可以讓更多的做理論研究和學術探索的科研院所、企業和個人加入進來,以此增進學術合作,增進產業探索。
因為,只有當開源有更多的落地場景,才能更好地促進生態合作。
一直站在「開源派」陣列的圖靈三巨頭之一LeCun曾在AI Native大會上稱,「我認為開放是必然之路。因為大模型將成為社會人人依賴的基礎設施,所以必須是開放的」。
對於國內的大模型生態來說,亦是如此。
此前,科大訊飛開源的中文預訓練模型,成為許多高校和企業打造創新應用的基石,推動了業界在語音和語言處理技術上的快速發展。
而現在,iFlytekSpark-13B的釋出,成為中國在自主創新和科技自立自強道路上的重要里程碑。
針對算力安全問題,科大訊飛提出了一種全新的實踐方案——「全棧國產化」開源。
自主開發的大模型和算力平臺,不僅能促進國內科研人員和企業的創新,還可以推動相關領域科技進步,增強國家技術安全,加速AI技術的社會和經濟應用。
為此,科大訊飛還在2023年7月正式成立了星火軍團,負責助力客戶大模型產品打造和應用落地,賦能千行百業。
未來,在全國產化算力平臺的支撐下,星火認知大模型將進一步對標國際先進水平,而星火開源大模型,也將使國內開源生態更加欣欣向榮。
參考連線:
https://openi.pcl.ac.cn/iflytek/iFlytekSpark-13B
https://gitee.com/iflytekopensource/iFlytekSpark-13B
https://xihe.mindspore.cn/modelzoo/iflytek/introduce