“今天中國通用人工智慧的狀況,就跟訊飛25年前創業的時候一樣,跟中國語音產業發展之初的狀況無比相像”,1月30日,訊飛星火V3.5釋出會上,董事長劉慶峰分享了由他主編的圖書《星火相傳》,講述科大訊飛技術奠基人王仁華教書育人的經歷和科大訊飛的創業故事。
25年前,智慧語音產業爆發前夜,IBM、等國際巨頭紛紛在中國設立研究院,進軍中國市場。語音是文化的基礎、民族的象徵。著名語言學大師吳宗濟向王仁華和劉慶峰說:“中國被人掐住了咽喉。”劉慶峰在王仁華的鼓勵下帶著5個大學同學創立科大訊飛,立志“中文語音技術要由中國人做到世界最好,中文語音產業要掌握在中國人自己手上”,開啟了科大訊飛的“登山”之路。
初心:讓中文語音技術掌握在中國人自己手裡
王仁華是中國科學技術大學電子資訊與資訊科學系的教授。上世紀80年代,乘著改革開放的東風,王仁華成為赴美訪學的教授之一。在美國,他研究數字訊號處理,參觀貝爾實驗室,學習美國大學的科研模式,下定了要做產學研一體化的決心。
回國之後,他打破體制侷限,一邊在中國科學技術大學任教,一邊創立了中語音實驗室。這是中科大首個“教授負責制”的實驗室。王仁華一邊做研究一邊四處拉專案,赴東京大學學習,與東京大學、香港大學等國內外高校展開合作,引進先進裝置,壯大實驗室的實力。
1992年,大學二年級的劉慶峰被選中,踏入了實驗室的大門。劉慶峰很快脫穎而出,他做的KD-863系統在當時國家“863計劃”的語音合成評測中獲得最高分。科大訊飛的種子由此萌芽。
那個年代,中科大的學生以出國為榮。看到優秀的師兄弟們陸續離開,劉慶峰一直想:怎樣才能把這些人才留在國內,做中國自主創新的技術?
1999年,碩士畢業的劉慶峰放棄出國留學的機會和高薪offer,在王仁華的鼓勵和支援下,創立科大訊飛,走上以公司化促進產學研合作的道路。
王仁華任公司首任董事長,但他毫無私心,頂著壓力、創新機制,把學校獎勵的總計600多萬元技術股權獎勵分配給學生,並說“慶峰應該拿得比我多”。
科大訊飛從被稱為“草臺班子”的大學生創業公司成長為如今的人工智慧“國家隊”,併成為中國高校產學研合作的樣本案例,王仁華和劉慶峰的“師生配”也為學界、業界所關注。
攀登:從智慧語音到認知智慧,堅持AI不動搖
科大訊飛以技術起家,創業5年才實現盈利。當時,網際網路、遊戲、房地產,哪個行業都比人工智慧賺錢,訊飛內部也曾出現分歧,有人認為“開公司應該什麼賺錢就做什麼。”劉慶峰頂住壓力,堅持人工智慧方向不動搖。
他和王仁華一起,先是帶著科大訊飛攀上語音合成、語音評測、語音識別三座大山。科大訊飛研究院篤定“從研究中來,到產品中去”的研究邏輯,堅持從產業出發,“做有用的研究”。一旦堅定研究的方向,就不計投入。
以語音識別為例,當時,科大訊飛已經在和移動、電信等運營商以及華為等公司合作,將語音技術嵌入到他們的裝置、應用中。當時,國內語音識別技術的市場主要被美國公司Nuance佔據,科大訊飛也與之合作了一段時間。2005年,科大訊飛首次實現盈利,立刻決定做中國自己的語音識別技術。
王仁華和劉慶峰做了三個佈局:一路人去香港大學學習;一路人和清華大學合作,組建聯合實驗室攻關;第三路則外請加拿大約克大學教授江輝(王仁華的學生)作為技術顧問。
清華大學-科大訊飛聯合研究中心主任吳及至今仍感嘆他們的魄力:“那時,訊飛剛剛賺錢,立刻拿出幾百萬和清華合作。”
這背後的邏輯,是科大訊飛做自主創新技術的決心,也是產業上長期主義的佈局。
這個邏輯貫穿科大訊飛之後的每一次技術攀登。
語音識別最終被科大訊飛做到了行業領先,聲動炫鈴、訊飛輸入法、訊飛語點等典型產品應用讓科大訊飛躍上新的臺階。當深度學習技術的苗頭冒出,嗅覺敏銳的科大訊飛立刻決定跟進,成為國內率先將深度學習技術應用在語音識別系統上的公司,佔據先機。
創業12年,科大訊飛不僅實現了當初的承諾“中文語音技術要由中國人做到世界最好,中文語音產業要掌握在中國人自己手上”,還把多語種技術做到了世界領先行列,站在技術之巔建立起自己的智慧語音王國,並創造了蓬勃的產業生態。
與此同時,科大訊飛將眼光看向更長遠的未來,佈局認知智慧,開啟“超腦計劃”,要讓機器從能聽會說到能理解會思考,決心要再攀一座高山。
在技術上,科大訊飛的目標還是一樣:“要做就做第一”。在認知智慧的關鍵技術自然語言理解上,科大訊飛佈局機器翻譯、機器閱讀理解、常識推理等多項核心技術,連續在國際比賽中取得第一。截至目前,科大訊飛在認知智慧領域一共獲得40餘項世界冠軍。在應用上,科大訊飛始終面向社會剛需,相關技術在教育、醫療、金融、工業、司法等多個領域常態化應用。
這就是科大訊飛所說的“技術頂天、應用立地”。
現在,科大訊飛不僅承建了語音及語言資訊處理國家工程研究中心、認知智慧全國重點實驗室,還入選首批國家新一代人工智慧開放創新平臺,成為中國歷史最長、最專注的人工智慧公司之一。
再攀高山:通用人工智慧時代的訊飛“星火”
為什麼劉慶峰會說現在的情況和25年前相似?2023年被稱為通用人工智慧元年,隨著ChatGPT的釋出,大模型的競爭有目共睹。
但是,浪潮褪去,才知道誰在裸泳。通用人工智慧如當初的智慧語音一樣,只有真正將技術掌握在中國人自己手裡,只有真正做到產業落地、量質齊飛,才能真正有利於人類的生產生活和發展。
科大訊飛一開始做大模型,就確定了“1+N”的方向:“1”就是指通用認知智慧大模型,對標ChatGPT拆解文字生成、語言理解、知識問答、邏輯推理、數學能力、程式碼能力、多模互動等七大核心能力;“N”是指應用,要讓大模型在教育、辦公、汽車、人機互動等各領域真正落地。
2023年至今,科大訊飛總共舉辦了5次大模型的釋出會,每一次迭代都帶來7大核心能力的升級和多個領域的應用案例。訊飛“星火”在《麻省理工科技評論》大模型評測、新華社研究院大模型體驗報告等權威機構對主流大模型的評測中,科大訊飛均獲得第一名。
最新版本,是1月30日的訊飛星火V3.5,七大能力全面升級,在語言理解、數學能力、語音互動能力超過GPT-4 Turbo,程式碼達到GPT-4 Turbo 96%,多模態理解達到GPT-4V 91%。
訊飛星火可以像人一樣和使用者對話,發音自然,“情商”還挺高;搭載了訊飛星火的翻譯機可以不切換就識別出多個語種,“跨語言群聊”變得稀鬆平常;越來越多的大企業將業務和訊飛星火結合進行打磨,太平洋保險、交通銀行、國家能源集團、中國移動等企業在保險、金融、電力、商務等領域全面探索如何為企業提質增效、開發出對客戶更有價值的解決方案……
最值得一提的是,訊飛星火V3.5,是在全國產化算力平臺上訓練的全國產大模型。
“科技自立”是科大訊飛做技術一貫的堅持。在複雜的國際形勢下,面對“卡脖子”的算力難題,科大訊飛迎難而上。在安徽省和合肥市的支援下,科大訊飛聯合華為建立了中國首個國產化算力平臺——“飛星一號”,該平臺可支撐萬億引數大模型的訓練。
為什麼訊飛星火能幹得成?劉慶峰總結出三個原因:
第一,最核心的是這麼多年的技術積累,科大訊飛有成熟的演算法,並在過去25年一直專注人工智慧領域。第二,有成建制的團隊。團隊組織氛圍特別好,不存在內耗,凝聚成了非常強的戰鬥力。第三,有像華為這樣的深度合作伙伴。
科大訊飛的大模型以“星火”命名,和25年前創業之初就鐫刻在科大訊飛牆上的那句話——“燃燒最亮的火把,要麼率先燎原,要麼最先熄滅”一脈相承。“正是因為幾代人接續的長期主義,才有了今天,我們在如此重要的語音領域敢於對全世界說:‘我們是領先的’。”在訊飛星火V3.5釋出會上,劉慶峰說,只要堅持頂天立地的產業發展路線,堅持面向未來,2024年一定可以實現星火燎原,通用人工智慧能夠在中國的各大領域深度廣泛應用,堅持源頭技術創新,大模型的底層能力一定會站上全新的臺階。
《星火相傳》書中有兩處寫到“王仁華的預言”。
第一次是2008年,科大訊飛剛剛上市,王仁華獲得安徽省重大科技成就獎,在答辯時,評委們問王仁華“真正的人工智慧,什麼時候才能成為現實”?王仁華回答“十五年”。2022年ChatGPT驚豔了全世界,每一個普通人都可以0門檻使用人工智慧,王仁華一語成讖。
第二次是在2023年8月4日,在王仁華80歲壽辰的生日宴上,他對學生們說,“今天,我們說的20年後的兩件事,一個是科大訊飛在世界上掌握話語權,一個是我要活到100歲,我們都要努力!大家不要忘記自己的承諾,我也要拼命活到100歲!”話畢,臺下掌聲經久不息。
科大訊飛一直有登山文化,每年司慶劉慶峰都會組織員工去登山。劉慶峰曾說,為什麼要登山?因為山就是信仰,而“攀登本身的過程就是一種巨大的幸福。”
版權與免責:以上作品(包括文、圖、音影片)版權歸釋出者【經觀新科技】所有。本App為釋出者提供資訊釋出平臺服務,不代表經觀的觀點和構成投資等建議