經濟觀察網 記者 張鈴 “中國現在有數以百計的通用大模型,其中的90%沒多大用處,也發展不起來,只會加劇資源和人力的浪費,應該被淘汰。”1月18日,在“北京CGT新勢釋出會”上,中國科學院院士、翊博生物首席科學家陳潤生向經濟觀察網談及他對國產大模型的看法。
陳潤生是中國最早從事理論生物學、生物資訊學以及非編碼RNA研究的科研人員之一,也是中國最早開設《生物資訊學》課程的人。他曾參與人類基因組計劃,負責分析遺傳密碼的生物資訊,也參與了水稻遺傳密碼的破譯。
三年前,年過80的陳潤生走出書齋,加入翊博生物這家從事免疫細胞基礎研究和臨床應用的企業擔任首席科學家,希望將基礎研究轉化為解決實際問題的產品。
現在,陳潤生已經83歲,他依然活躍在中國科學院大學公開課的課堂上,他開設的《生物資訊學》每每吸引上千名年輕人前來聽課。陳潤生覺得,要讓一千多人坐在臺下,且認真聽講,必須向他們傳遞有用、有趣的內容。為了能和年輕人打交道,“跟上潮流”,陳潤生每天都會看書,還自學了大模型。
在迸發大模型熱潮的2023年,陳潤生團隊開發了一個醫學多模態資料智慧整合計算平臺“靈樞”,能夠將當前生物醫藥的整合在一個大模型中,其核心內容包括1個演算法框、3個醫學應用和3類多模態資料。目前,陳潤生團隊正嘗試將中醫中藥資料整合到該模型中,希望實現“中西醫結合”,為疾病治療帶來更大益處。
在陳潤生看來,真正專業的大模型應該是縱向打造的,能解決特定的實際問題,提高社會效率,在某個領域成為第一才有價值。他認為,中國應該考慮建立一個國家級的大模型,這是適應當前國際競爭的一種方式。
圖源:受訪者供圖
|對話|
經濟觀察報:談談你們團隊研發的“靈樞”醫學資料平臺,現在進展如何,有什麼成果?
陳潤生:我希望將大模型應用於健康領域,因此搭建了一個大模型,希望將轉錄組、表觀組和蛋白組等與生物相關的資訊整合在一起,利用大模型去分析。
我希望這個大模型能有些特色,因此將中醫中藥的知識融入進去。中醫中藥與現有知識的融合程度較低,我認為這種融合有深遠的意義。多模態融合不是簡單地將資訊加在一起,其中有內部知識之間的相互作用,如果我們成功將中醫中藥加進去後,它能夠更好地改變醫療引數的話,那就說明中醫中藥的資訊是不可替代的,這樣的資訊能提高大模型的判斷力。
當然,其中會存在一些技術問題,因為沒有先例,美國人不會將中醫中藥納入大模型,因為他們不懂。將中藥納入大模型相對容易,只是其成分比西藥更復雜。但中醫要加進去是很難的,望聞問切、診脈,這些內容根本沒有語言。我們嘗試建立了一些規則,但現在還不完備的,在不斷改進。
我希望建立一個專業的大模型,用專業資料來訓練它,它就會變成一個特化的“腦子”,“靈樞”就是這樣的,將中醫中藥架構在系統裡建立的一個模型。為什麼叫“靈樞”?我們詢問了一些老中醫,他們提到中醫最經典的兩個經典是《靈樞》和《素問》,我認為從語言上來看,“靈樞”這個名稱更美。
經濟觀察網:以醫療領域的大模型為例,什麼樣的大模型是真正有價值的?
陳潤生:人工智慧需要學習,在技術條件相同的情況下,知識和資料積累情況決定了一個模型的好壞。要做一個真正能夠為臨床服務的大模型,需要付出很多努力,主要是資料比較難收集。比如要做一個影像學的大模型,只給它幾個影像,這個模型肯定沒用,需要提供數十萬甚至上百萬的影像才行。需要讓模型學習到可能出現的所有情況,這樣它才能成為權威。
如果泛泛地談論一個通用醫療大模型,我不相信誰能夠做得很好,我更傾向於垂直的大模型。真正專業的大模型應該是縱向打造的,能解決特定的實際問題,提高社會效率,在某個領域成為第一才有價值。
舉個例子,可以做一個模型來管理所有病人的掛號、就診流程等相關資訊,不過不涉及具體病人的診療。醫療過程中涉及臨床檢驗、影像學等多方面,從病人拿藥到醫生給出解決方案,整個流程都能透過大模型來管理,很多問題都能被解決。比較現實的例子是內科,內科其實就是把病人的各種指標集中到內科醫生處,將來大模型就可以處理所有的指標。醫學界第一個被取代的群體可能是內科醫生,因為他們主要負責整合檢測指標。
好的大模型要真正解決實際問題,並具有足夠的準確度和效率。中國現在有上百個大模型,其中的90%沒多大用處,只會加劇資源和人力的浪費,應該被淘汰。
中國應該考慮建立一個國家級的大模型,這是適應當前國際競爭的一種方式。
經濟觀察報:在翊博生物,你主要負責什麼內容?
陳潤生:在基礎研究方面,中國科學院的研究人員已經積累了一定能力,這些積累基本上是解決科學問題的,但也可以轉化為解決實際問題的產品。這是我在這裡的重要原因。
人類抵抗疾病依賴於免疫系統,免疫系統如何起作用呢?它涉及許多細胞,如大家熟知的T細胞(一種淋巴細胞)、NK細胞(自然殺傷細胞)等。但誰能感知到哪些是異物呢?感知後又將訊號傳遞給具有殺傷功能的免疫細胞?這就要由DC細胞(樹突狀細胞)承擔起始責任。
DC細胞一直是免疫系統和疾病相關免疫研究的重要領域。既然這個細胞在整個免疫系統中起著如此重要的作用,我們是否可以人為地給它加上一些訊號呢?我們是否可以人為地改造DC細胞,透過給它加入某些物質來激發免疫系統?這就涉及到許多與分子水平相關的內容,也與遺傳密碼有關,這是我在這個領域可能發揮作用的地方。
經濟觀察網:中國生物資訊學領域產學研融合的情況如何?
陳潤生:在我熟悉的領域,中國的基礎研究做得還是不錯的,在一些狹隘的領域如非編碼RNA,論文數和論文他引數甚至超過美國,但我們的轉化水平比美國要差得多。
我們需要建立一套更有效的機制以實現基礎研究成果的轉化。以前,科研人員只是發表論文,發現某個靶點和腫瘤有關聯,但並沒有思考如何將其轉化為可使用的藥物,這需要一套轉化機制。美國的大學有專門的申請專利和律師團隊,研究人員在完成研究後,自然地與學校內部的團隊接觸,他們會幫助處理轉化的各個環節,非常順暢。
因為最近做轉化工作,我也接觸了一些與公司相關的事務,發現這些事務需要各自分工,只有分工協同才能有效地推進,我們的角色永遠是技術提供者。讓那些從事後端工作的人來代替我們是不行的,因為他們沒有原始發現,但是讓我們將原始發現轉化為產品、應用,我們也難以做到。將創新轉化時,科學家要麼採取協同模式,要麼就得轉換角色,迫使自己從科學家變成執行長。
經濟觀察網:精準醫學研究可能成為國家之間新一輪科技競爭的關鍵,這會不會導致遺傳資料在國家間的流通更加困難?
陳潤生:這是一個基本且重要的問題。如果完全封閉遺傳資源,不向外界提供任何資訊,別人也不會給你提供資訊,就沒有交流了。我們必須對敏感資訊進行精細化處理,確定哪些可以交流,哪些需要保密。例如,如果中華民族有特定的遺傳特徵,顯然需要保密,但這並不意味著人類基因組測序的結果不能公開。如果我們只針對黃種人進行測序,而不公開這些結果,那人類基因組學就無法進行不同人種的多組學分析了。
我們自己的人類基因組資料是最豐富的,未來我們或許可以憑藉這一點和其他國家博弈和交流。
經濟觀察網:漸凍症患者蔡磊希望人工智慧可以幫助攻克像漸凍症這樣的疑難疾病,從科學的角度來看,這種可能性存在嗎?
陳潤生:這種可能性是存在的。大模型至少可以為漸凍症的診斷和治療提供更好的資訊,這是可以實現的。透過積累更多資訊,並透過人工智慧的分析,科學家肯定可以找到更有效的漸凍症解決方案。當然,這需要大量的工作,例如收集漸凍症患者組學資料和臨床表現,將這些資訊集中起來建立一個縱向大模型,然後看是否可以得出臨床醫生以前不知道的新發現。如果有新的發現,就會有新的可能幫到患者的新嘗試。
經濟觀察網:你理解的科學家精神是什麼樣的?
陳潤生:科學家精神就是鑽研科學規律,探索科學真理,實事求是。
我83歲了,所有的報告幻燈片依然自己做,而且每天都要讀書,大模型就是我自學的。不能放棄學習,這是做科研的基本素質,哪天不學習了,肯定就跟不上潮流了。
版權宣告:以上內容為《經濟觀察報》社原創作品,版權歸《經濟觀察報》社所有。未經《經濟觀察報》社授權,嚴禁轉載或映象,否則將依法追究相關行為主體的法律責任。版權合作請致電:【010-60910566-1260】。
張鈴經濟觀察報記者
大健康新聞部記者 關注健康領域大公司、大醫生、重要事件、人物 郵箱:[email protected]