時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

LLM為何頻頻翻車算術題?最新研究追蹤單個神經元,「大腦短路」才是根源

2024-11-20 12:10:53

新智元報道

編輯:peter東 喬楊

【新智元導讀】大模型在數學問題上的表現不佳,原因在於採取啟發式演算法進行數學運算的,透過定位到多層感知機(MLP)中的單個神經元,可以對進行數學運算的具體過程進行解釋。

由於缺少對執行邏輯的解釋,大模型一向被人稱為「黑箱」,但近來的不少研究已能夠在單個神經元層面上解釋大模型的執行機制。

例如Claude在2023年發表的一項研究,將大模型中大約500個神經元分解成約4000個可解釋特徵。

而10月28日的一項研究,以算術推理作為典型任務,借鑑類似的研究方法,確定了大模型中的一個模型子集,能解釋模型大部分的基本算術邏輯行為。

論文地址:https://arxiv.org/abs/2410.21272

該研究首先定位了Llama3-8B/70B, Pythia-6.9B及GPT-J四個模型中負責算術計算的模型子集。

如圖1所示,少數注意力頭對大模型面對算術問題的正確率有顯著影響。第一個 MLP(多層感知機) 明顯影響運算元和運算子位置,而中間層和後期層的 MLP 將token資訊投影到最後位置,提升正確答案的出現機率。

圖1:Llama3-8B中發現算術相關的模型子集

該研究聚焦於單個神經元層面,發現了一組重要的神經元,它們實現了簡單的啟發式演算法。只需要關注特定的極少量神經元,就能正確預測大模型進行算術運算的結果(圖2)。

圖2:大模型 中每層神經元中只需要關注1.5%的少數子集,就能預測大模型進行四則運算的結果

舉個例子:當輸入的提示詞為“ 226−68= ”時,神經元24|12439在結果介於150和180的減法提示下顯示出高啟用值,可被視為一個啟發式演算法。而每個啟發式演算法識別一個數值輸入模式,並輸出相應的答案。

具體可分為兩種不同的啟用模式:第一種直接啟發式指的是在某些神經元中,啟用模式取決於兩個運算元,值向量編碼了算術計算的預期結果(圖 3b,c)。

第二種間接啟用模式取決於單個運算元對應的神經元中,值向量通常編碼下游處理的特徵,而不是直接的計算結果(圖3a)。

圖3:啟發式方法的視覺化

神經元和運算的因果聯絡

該如何確認特定神經元和相關數學運算之間存在因果關係?一種常見的方法是消融分析,即將大模型大模型中特定的神經元敲除,看看模型的效果會有何改變,結果如圖4所示。

圖4:四則運算中敲除對應的算術神經元后模型的效能對比

去掉了對應神經元后,模型的運算準確性無論加減乘除都顯著下降。

不僅如此,相比去除特定算術神經元時造成的效能下降,可以發現,去除隨機神經元的影響相對較小,而且這種效應在模型8B和70B不同引數量中普遍存在。

圖5:敲除與算術相關的啟發式演算法的神經元(實線)相比與算術無關的相同數量的隨機神經元(虛線)

上述結果表明,可僅根據其相關啟發式演算法來識別對特定對大模型進行算術重要的神經元,也證明了屬於幾個啟發式演算法的神經元與提示正確完成之間的因果關係。

此外,該結果還支援了啟發式演算法集合的主張:即每個啟發式演算法僅略微提高正確答案的機率,但它們結合在一起,使得大模型以高機率產生算術題的正確答案。

大模型為何做不對算術題

Llama3-8B模型無法可靠地對每道算術題時給出正確的回答。基於啟發式規則,該研究闡述了模型為何會做錯,可能的機制共有兩種:

第一,由於引數量的限制,大模型缺乏足夠的算術神經元,無法針對每一種情況都給出應對。

第二種原因是,可能存在回憶不完整的情況,比如某個啟發式規則對應的神經元沒有在運算時被觸發。

圖6:隨機抽取了50個正確完成和50個錯誤完成的算術題目,考察大模型中被正確和錯誤啟用的算術神經元個數

如圖6所示,在大模型回答正確及錯誤時,啟用的算術神經元個數不存在差異,這不支援前述的第一種算術神經元個數不足的假設。

然而,在大模型回答正確的情況下,更多比例的正確神經元被激活了,而回答錯誤的案例中,應當被啟用的神經元啟用機率反而較小。

這意味著大模型在特定算術題上失敗的主要原因是對能得出正確答案的神經元缺少泛化能力,而不是算術神經元的數量不足。

「算術神經元」何時誕生

由於其訓練檢查點可供公眾獲取,該研究採用Pythia-6.9B來考察大模型過程中算術神經元的出現階段。

結果顯示,大模型在訓練過程中逐漸發展其最終的算術啟發式機制,且算術神經元在模型訓練早期就已出現。

圖7 :啟發式的算術神經元的百分比隨著訓練增加

在模型訓練的不同階段,移除特定的啟發式神經元會大幅降低模型在所有訓練檢查點的準確性,這表明算術準確性主要來自啟發式,即使在早期階段也是如此。算術啟發式神經元與大模型算術能力的因果關係在整個訓練過程中都存在。

圖8:不同階段敲除算術神經元對大模型進行算術運算準確性的影響

結論

理解大模型如何進行數學運算,不僅可以開啟大模型內部執行的黑箱,解釋它們為何在簡單的數學題上翻車,例如最著名的「9.11和9.8哪個大」。

這項研究告訴我們,並不是因為大模型缺少相關訓練,而是激活了錯誤的啟發式神經元,例如將這個問題當成了詢問哪個版本更大。

理解了大模型的算術運算,是依賴於啟發式方法集,而非單純的依靠記憶(背題目)或學會規則,這表明提高大模型的數學能力可能需要訓練和架構的根本性改變,而不是像啟用引導這樣的小修小補。

對訓練過程的分析結果指出,大模型在訓練早期就學會了這些啟發式方法,並隨時間推移逐漸強化。這可能會導致模型過度擬合到早期的簡單策略,因此可作為之後最佳化方向的參考。

參考資料:

https://arxiv.org/abs/2410.21272

熱門資訊
  • 關於量子計算時代,微軟與NVIDIA各執一詞 | 2025-01-31 13:08:34
  • 市場要變天?中國批准首個幹細胞技術上市,日本還能領先多久? | 2025-01-31 13:42:55
  • 三星晶片,艱難一戰 | 2025-01-31 13:42:58
  • DeepSeek銳評水凝膠研究! | 2025-01-31 14:04:07
  • 供不應求?博主稱多地小米之家手機家電賣斷貨 | 2025-01-31 14:37:28
  • 用過極空間私有云Q4,你會知道NAS可以這麼易用又智慧 | 2025-01-31 15:03:15
  • 三星新專利顯示未來 Galaxy Buds 耳機有望配備 UWB 技術播放音訊 | 2025-01-31 15:13:30
  • 國補期間入手平板超划算 小米平板7到手價1699元起 | 2025-01-31 15:16:56
  • 英偉達發Game Ready 572.16 WHQL驅動 帶來新卡新功能支援 | 2025-01-31 15:19:43
  • 我國光子毫米波雷達技術取得突破性進展,為 6G 技術應用奠定基礎 | 2025-01-31 15:29:19
  • 深海冰晶 靜謐溫控 iGame RTX 5080 Neptune圖賞 | 2025-01-31 15:34:55
  • 我國科研人員提出新方法 有望提高水稻等作物產量 | 2025-01-31 15:39:38
  • 高通驍龍X2產品線晶片曝光,Ultra Premium型號 | 2025-01-31 15:43:46
  • 1月全球液晶電視面板全面漲價 2月價格維持1月漲幅 | 2025-01-31 15:46:45
  • NASA批准公理太空公司第四次私人宇航員任務 | 2025-01-31 16:05:04
  • 中國空間站男、女航天員同框:為何都“胖”了一圈,怎麼保護隱私? | 2025-01-31 16:59:59
  • 飛船飛往月球時需要不斷變軌,為何不直接飛向月球? | 2025-01-31 17:19:35
  • Immunity丨基於特異性的工程平臺T-Switch用於開發安全有效的T細胞療法 | 2025-01-31 17:19:38
  • 美式絞索煉出中國真金,這把鐵拳砸爛西方科技霸權! | 2025-01-31 17:25:59
  • 從一臺量子計算機的“絕技”看中國算力未來 | 2025-01-31 17:26:00
  • Cancer Discovery丨BBO-8520,一款同類首創GTP/GDP結合KRAS^G12C的直接共價雙重抑制劑 | 2025-01-31 17:27:42
  • 唐本忠院士總主編,我國原創研究成果“聚集誘導發光叢書”全部出版 | 2025-01-31 17:27:50
  • 未來的三星 Galaxy Bud 可能會透過 UWB 而不是藍芽傳輸音訊 | 2025-01-31 17:42:28
  • 新春走基層·春節他們在崗|C919的“護航人” :國產大飛機帶你平安回家 | 2025-01-31 17:42:59
  • Blackwell的真正實力!GeForce RTX 5080 FE首發評測:功耗低於RTX 4080、效能接近RTX 4090D | 2025-01-31 17:45:06
  • 原價搶到算我輸!英偉達RTX 5090D/5080正式開賣:16499、8299元 | 2025-01-31 17:45:10
  • 蘇東莊逝世 | 2025-01-31 18:04:08
  • 訊息稱 Rapidus 計劃引入 10 臺 EUV 光刻機 | 2025-01-31 18:04:12
  • Apple Intelligence將從四月起支援更多語言 包括簡體中文 | 2025-01-31 18:15:23
  • Cancer Cell:董晨院士團隊發現影響癌症免疫治療效果的T細胞亞群 | 2025-01-31 18:48:08
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們