證券時報“中國智造面對面”採訪團走進科大訊飛,圖為公司展廳
科大訊飛AI+教育行業產品
證券時報社常務副總編輯週一(左)對話科大訊飛AI工程院院長潘青華(右)
證券時報記者 葉玲珍
過去一年多,以ChatGPT為代表的生成式AI(人工智慧)技術狂飆突進,各路科技巨頭爭相入局,試圖在技術演進、應用落地風口搶佔更多話語權,“百模大戰”已然打響。本期“中國智造面對面”走進科大訊飛,證券時報社常務副總編輯週一對話科大訊飛AI工程院院長潘青華,解讀生成式AI技術發展現狀及挑戰,展望大模型規模化應用前景。
深耕人工智慧賽道二十餘載,科大訊飛積極擁抱“智慧湧現”的大模型時代,依託源頭技術創新和成建制的行業頂尖研發團隊,透過與等合作伙伴強強聯合,打造了基於自主可控技術底座的訊飛星火認知大模型。“星星之火,可以燎原”,歷經數次迭代升級,訊飛星火大模型迅速在教育、醫療、工業、金融、汽車、法律、科研等應用場景落地開花,正以更好的姿態賦能千行百業,解決社會剛需。
2024年上半年
對標GPT-4
證券時報記者:能否介紹一下科大訊飛星火認知大模型最新的研發進展?
潘青華:2022年12月,科大訊飛啟動“1+N認知智慧大模型技術及應用”專項攻關,並在2023年5月6日正式釋出訊飛星火認知大模型。
經過多次迭代升級,2023年10月24日,公司在全球開發者節上正式釋出星火大模型V3.0,對標ChatGPT(GPT-3.5),實現中文超越,英文相當。
目前,團隊還在馬不停蹄地攻關,公司將於1月30日釋出星火大模型V3.5版本,各方面能力相較過去都會有非常大的提升。
預計在2024年上半年,星火大模型還將迎來新的迭代版本,屆時可實現全面對標GPT-4。從現在的訓練情況來看,我們對2024年上半年對標GPT-4非常有信心。
證券時報記者:與國內外大模型相比,科大訊飛星火認知大模型有哪些特點和優勢?
潘青華:首先,星火大模型是在科大訊飛前期積累上自主研發的,從預訓練到微調,再到強化學習,每一步訓練都有技術上的創新。得益於過去十幾年在深度學習技術和等演算法上的積累和持續創新,星火大模型底層技術更為紮實。
其次,星火大模型在釋出之初便同時公佈了在教育、汽車等領域的落地產品應用,在過去的業務開展過程中,公司已經在教育、醫療、工業、智慧城市等領域開拓了豐富的認知智慧行業應用場景,在利用大模型解決實際問題方面形成了獨特優勢。
再次,訊飛星火大模型是國內首個完全基於國產算力平臺訓練的大模型。此前,公司兩次被美國製裁,我們堅定走軟硬一體國產化的必由之路。2023年10月24日,科大訊飛對外發布基於華為昇騰生態的自主可控算力平臺——“飛星一號”,透過與華為強強聯合,合力打造我國通用智慧新算力底座,並在此平臺上開展更大規模的大模型訓練。我們判斷,未來2~3年國產算力生態將持續繁榮,完全可以支撐通用人工智慧大模型的自主研發。
證券時報記者:科大訊飛在大模型方向的研發團隊規模如何?
潘青華:此前,公司在人工智慧方面已經構建了成建制的行業頂尖研發團隊,這也是星火認知大模型的底氣所在。
目前公司AI演算法相關研發人員主要集中在AI研究院、AI工程院以及資源資料團隊,合計超過1500人,其中直接參與大模型研發的人員有幾百人。如果疊加產品線上從事大模型應用開發、落地的相關團隊,以及外部合作伙伴和開發者,團隊規模會更大。
“技術+需求”雙輪驅動
證券時報記者:目前來看,訊飛星火認知大模型的迭代升級主要是技術驅動還是需求驅動?
潘青華:星火大模型的迭代其實是技術、需求兩條線並行驅動的。
目前來自於技術層面的驅動更為直接,所以我們也有比較明確的大模型升級時間節點;除此之外,需求端也是重要的驅動力。最初啟動大模型攻關的時候,公司就明確了“1+N”的路線,“1”為基礎模型,“N”指的便是行業應用,即讓大模型在教育、醫療、汽車、辦公、工業、智慧硬體等多個領域落地。
當然,大模型進入千行百業並不是一蹴而就的,需要在長時間的打磨中,以潛移默化的方式逐步變成常態。
不要高估技術短期的影響,也絕不能低估技術長期的影響。據我們判斷,相比於過去的人工智慧技術,大模型進入到實際應用的週期可能會大幅縮短。因為大模型的認知能力一旦有突破口,會很快形成“漣漪效應”,在應用中讓越來越多的使用者形成使用習慣。
證券時報記者:大模型會在哪些行業率先得到大規模應用?
潘青華:根據目前訊飛星火認知大模型的落地應用情況來看,在程式碼領域程式設計師對大模型的接受能力是最強的,還有教育、醫療、金融等領域也會有較快應用。另外,還有一個重要的方向是人機互動,包括智慧汽車、智慧家居、智慧硬體終端等,目前已經有搭載大模型的全新互動產品在不斷湧現。
證券時報記者:您如何看待大模型對各行各業的賦能作用?會帶來替代效應嗎?
潘青華:對於大模型的應用前景,業內還是比較樂觀的。我們認為,大模型對於很多崗位的工作人員,特別是腦力勞動者,比如程式設計師、文字工作者、工程師、醫生、教師等職業,都能輔助他們更好、更高效地完成工作。
大模型帶來的提效並不意味著對原有工種的替代,它更多的是一種生產工具,在某種程度上改變工作模式,提升崗位生產效率。
規模化商用指日可待
證券時報記者:大模型進化到目前的水平,哪些方面讓您覺得驚豔?哪些方面表現平平?
潘青華:應該說大模型進化到現在,雖然表現得不夠完美,但已經足夠讓人驚奇。
我們注意到,大模型在幾個方面的能力尤為突出:首先是對複雜、深層次語義的理解能力,這種理解並不是靠死記硬背,而是結合上下文,真正理解了背後的意思;其次是跨領域的學習能力,大模型能夠快速呼叫外部外掛及相關工具,在較短時間內成為一個“全科人才”;再次是大模型已經具備了思維鏈,能夠像人類解題一樣,對複雜任務分步驟推導求解。
當然,大模型也有表現不盡如人意的地方,比如文字生成能力雖然在某些場合已經夠用,但還不夠好用,不夠個性化。
我們認為,大模型最大的短板,在於目前還無法精準地成為每個人的個性化助手,因為從現在的情況來看,為每個人定製大模型的成本是很高的;另外,與人腦相比,大模型並不是在所有的場景都表現得一樣聰明,一致性和穩定性還有待提升。
證券時報記者:目前各家的大模型尚處於探索性應用階段,您認為大模型距離規模化、商業化應用大概還需要多長時間?
潘青華:我們覺得,在未來一年多的時間內,就能看到大模型大規模應用的進展。當然,不同的應用場景落地的速度會有差別,直接面向C端使用者的應用應該是最快的。
從現階段來說,成本是最大的制約因素。如果按照現有算力水平,想要大模型隨時隨地被呼叫,成本是無力承受的。
未來,大模型的普及一方面取決於演算法的進步,另一方面取決於硬體的進步,即如何在單位晶片功耗相同的情況下,實現更強的計算能力。
需要說明的是,最終大模型的形態可能也會有一些變化,或許不是一個大模型部署在一個大的節點上,而是分散成一些小的輕量化節點,就能夠很好地完成任務。
證券時報記者:在您看來,應如何打通大模型在行業落地的“最後一公里”?
潘青華:我們知道,行業模型的底座其實是基礎大模型,伴隨著底座模型的迭代,行業模型的落地會加速推進。
另一方面,行業模型是一個複雜的智慧系統,有賴於專家知識、行業資訊、行業資料等,還需要更多理解大模型演算法的人做精、做透相關應用,才能推動大模型技術最終在行業順利落地。
共建大模型繁榮生態
證券時報記者:當前,市場呈現出“百模大戰”的白熱化競爭態勢,您認為哪些因素會成為決定勝負的關鍵?
潘青華:我們認為,要想在“百模大戰”中勝出,做出效果最好的模型,不僅僅靠堆算力,也要靠原理層面的演算法創新。基於現有演算法框架,仍然看誰模型更大,能帶來能力提升,但無限堆算力可能不是最優路徑,預計很快就會進入演算法層面的創新比拼階段。
我們判斷,最終能夠走出來的通用大模型可能只有幾家。未來國內可能就是幾個底座,大家各自選擇合適的底座去做自己上層的應用。
證券時報記者:大模型在快速發展過程中,也引發了各界對於資料保護、合規風險及隱私洩露等問題的擔憂。您如何看待大模型的安全問題?應該從哪些方面規避風險?
潘青華:我們認為,從演算法原理來看,大模型距離形成自主意識還為時尚早。而從大模型本身的安全性來看,如何防止生產有害的、錯誤的資訊,這是必須引起重視的,可以從資料來源頭、訓練方法、演算法等技術層面建立配套的鑑偽等機制。與此同時,還需要從政策法規層面進行引導,在不影響技術迭代的前提下,避免技術濫用。
證券時報記者:您對人工智慧行業發展有哪些建議?
潘青華:首先還是需要鼓勵實事求是的精神,對人工智慧技術不要過度包裝、“神話”,讓市場客觀理性認識技術。另外,希望更多的人能夠參與到人工智慧生態,以更積極的心態擁抱技術,促進生態繁榮,推動社會進步。
黃劍波、葉玲珍/攝 彭春霞/製圖