作者|深水財經社 何離
自2023年5月首次釋出訊飛星火認知大模型之後,科大訊飛在一年時間內開了五次釋出會,從1.0開始到3.5,訊飛星火在一年時間裡已經有四次迭代,每一次迭代都是星火大模式里程碑式飛躍。
1月30日下午,訊飛召開了星火認知大模型V3.5升級釋出會,這次會議是透過線上召開,但是也同樣熱鬧非凡,有數萬人在直播間觀看。
據介紹,星火3.5版本七大核心能力全面提升,數學、語言理解、語音互動能力超GPT-4 Turbo,此次還首次釋出星火語音大模型,首批37個主流語種效果超過OpenAI Whisper V3,賦能訊飛翻譯機迎來全新升級助力更自由溝通,推動萬物互聯時代下客服、汽車、機器人等場景人機互動的變革。
“訊飛星火V3.5能力的提升,已經達到了量質齊飛的關鍵點。”劉慶峰表示,2024年訊飛星火認知大模型的應用,一定會在越來越多的場景和領域中大放異彩。
銜枚疾進追趕GPT-4
2022年12月15日,科大訊飛正式啟動“1+N”認知大模型專項攻關,其中“1”就是指通用認知智慧大模型,“N”就是大模型在教育、辦公、汽車、人機互動等各個領域的落地。
2023年是從語音智慧科技公司向人工智慧科技跨越的元年,在去年5月份,他們首次釋出星火認知大模型,這也算是星火的1.0版本,但已經集成了通用人工智慧領域文字生成、語言理解、知識問答、邏輯推理、數學能力、程式碼能力以及多模態能力七大維度。
星火1.0一炮走紅,讓國內AI界立刻對科大訊飛刮目相看,基於對標世界AI巨頭ChatGPT,劉慶峰也是給出了明確的追趕時間表,甚至在當時外界對科大訊飛的AI大模型是不是在畫大餅存在爭議。
但是劉慶峰和他們AI團隊並沒有食言,在1.0釋出後,公司接下來如約在5月、8月和10月分別釋出了星火V1.5、V2.0和V3.0,在這一次3.5版本釋出的同時,還發布了與華為聯合打造的大模型算力底座“飛星一號”平臺。
三個月後,也就是1月30日,基於這個全國產算力平臺“飛星一號”訓練的訊飛星火大模型V3.5版本正式對外發布。在這一版本中,通用AI七大核心能力全面提升,數學、語言理解、語音互動能力超GPT-4 Turbo,首次上線的星火語音大模型首批37個主流語種語音識別效果超過OpenAI Whisper V3。
據瞭解,V3.5之所以能夠這麼快釋出,正是去年10月釋出的飛星一號的功勞。作為首個支撐萬億引數大模型訓練的國產算力平臺,飛星一號在啟用後的90多天裡,訊飛星火便釋出了對標GPT-4的更大引數規模的大模型,目前已經在語言理解、數學能力超過GPT-4 Turbo,程式碼達到GPT-4 Turbo 的96%,多模態理解達到GPT-4V 的91%。
透過試用發現,訊飛星火V3.5不僅在語義理解、指令跟隨和多輪對話的演示中,展現出優異的能力,更是在情緒感知和擬人合成方面表現出色。
在實操演示環節,科大訊飛研究院院長劉聰和訊飛星火V3.5現場互動,訊飛星火V3.5一口地道的東北話逗樂現場觀眾。幽默之餘,訊飛星火V3.5快速為劉聰定製了旅遊攻略,還催促他趕快買票,春運機票緊俏。
行業應用加速落地
AI大模型並不是拿來做遊戲的,而是必須要實實在在能夠在不同行業應用,提升企業經營效率的。
技術進步如何為人類生活帶來真正有效的解決方案?劉慶峰從全新賦能萬物互聯時代人機互動、全新賦能知識學習與內容創作、全新提升數智化生產力三個方面,向現場觀眾展示訊飛星火V3.5的能力提升。
在進化至V3.5之後,科大訊飛在行業應用開拓方面已經大有突破,甚至已經走在國內同行的前列。
首先是在開發者生態建設方面,星火開發者已經超過35萬,其中企業開發者超22萬,開發者數增長迅猛,大模型應用加速落地,持續夯實第一開發者生態。
劉慶峰表示:“我非常自豪,訊飛星火大模型的開發者數量,在中國是最高的,而且使用者口碑非常好。”
1月30日,會上,首個基於全國產化算力平臺”飛星一號”的開源大模型——星火開源-13B和昇思開源社群也同時首發上線。
星火開源大模型在技術上形成了差異化優勢。據瞭解,星火開源-13B在多項知名公開評測任務中名列前茅,在文字生成、語言理解、文字改寫、行業問答、機器翻譯等企業典型場景中,透過對學習輔助、語言理解等領域的深入研究和最佳化,實用性大幅提升,在處理複雜的自然語言任務時更加得心應手。
共享原始碼、開發出更好的軟體,是廣大開發者、高校、企業自主研發熱衷於開源的關鍵原因,也是共建第一開發者生態的重要途徑。
其次是利用星火大模型為各行業企業賦能。在這次釋出會上,劉慶峰提及了訊飛與奇瑞的合作,奇瑞汽車出口的國家覆蓋英語、俄羅斯語、西班牙語、阿拉伯語、葡萄牙語等數十個語種,汽車中應用的智慧語音互動技術全都由科大訊飛提供。“我們用大模型全力支撐中國汽車的全球化出海戰略,要讓汽車變得更聰明、更智慧、更面向未來。”
除了汽車行業,還與太平洋保險合作,透過星火太平洋計劃賦能內部知識服務、辦公、審計、展業等,打造數字勞動力在保險領域的應用標杆;聯合交通銀行,賦能客服、展業、辦公、研發等,重點打造銀行領域的程式碼能力應用標杆;與國家能源集團聯合,賦能煤炭、電力、運輸、化工等方面,打造央企集團一體化聯動的大模型應用標杆等。
展望2024年訊飛星火大模型發展,劉慶峰指出三點:“首先,一定要在通用大模型的底層能力上持續對標國際最先進水平,我們要清醒理智看到差距,當前在小樣本快速訓練、多模態深度學習訓練、超複雜深度理解等領域距離GPT-4的最好水平還有差距,訊飛星火有信心在今年上半年趕上GPT-4目前最好水平。”
“今天的通用大模型並不一定代表人工智慧的全部未來,還有很多創新要做,如腦科學互動、對抗網路的深度連線等需要整個創新的生態,但我們一定要有勇氣、有期許走在最前列。”劉慶峰指出。
(全球市值研究機構深水財經社獨家釋出,轉載引用請註明出處)