時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

Nat. Mach. Intell. 速遞:超越無限寬度限制的貝葉斯深度神經網路的統計力學框架

2024-02-11 22:50:41


關鍵詞:深度神經網路,統計物理,機器學習可解釋性



論文題目:A statistical mechanics framework for Bayesian deep neural networks beyond the infinite-width limit 論文來源:Nature Machine Intelligence 論文地址:https://www.nature.com/articles/s42256-023-00767-6 斑圖地址:https://pattern.swarma.org/paper/946de568-9df9-11ee-bc79-0242ac17000e

在計算技術進步的推動以及數十年研究的鋪墊下,深度學習的發展超過了研究者為之構建堅實理論基礎的解釋能力。多個研究團隊長期努力在基礎層面上填補我們理解深度學習的空白。統計物理在這方面取得了深遠的成果,並且仍然是一個新的視角和突破的源泉。

儘管深度神經網路在實踐中取得了成功,但目前缺乏一個全面的理論框架,可以從訓練資料的知識中預測實際相關的分數,如測試準確度。在無限寬度的極限下,每個隱藏層中的單位數(其中=1,…,L,其中L為網路的深度)遠遠超過訓練示例數P,因此會出現巨大的簡化。然而,這種理想化與深度學習實踐的現實明顯不符。該研究使用統計力學的工具集來克服這些限制,並推匯出完全連線的深度神經結構的近似配分函式,它編碼了有關訓練模型的資訊。該計算在熱力學極限下進行,其中和P都很大,它們的比率則是有限的。這一進展使我們獲得:(1)一個針對具有有限α1的單隱藏層網路的迴歸任務相關的泛化誤差的閉合公式;(2)深度架構的配分函式的近似表示式(透過一個依賴有限數量序參量的有效作用),以及(3)深度神經網路在比例漸近極限下與學生t過程(Student’s t-processes)之間的聯絡。

圖1. 1HL網路的學習曲線。透過方程進行有限寬度1HL(one-hidden-layer)結構的泛化誤差的可測試預測。a,基於Erf啟用函式的1HL架構的學習曲線,測試誤差隨隱藏層尺寸N1變化。在不同訓練集大小P上進行實驗測試損失(帶有誤差條表示一個標準差)與從方程1計算得出的理論進行比較(實線)。b、c,最後一層的高斯先驗λ1的不同值下的測試誤差隨N1的變化曲線。其中,誤差條在點內,虛線用於引導觀察(圖2、3同)。網路在來自CIFAR10資料集的P=3,000個示例(b)和MNIST的P=500個示例(c)上進行訓練。檢查了理論在零溫度下的兩個定性預測:(1)當λ1增加時,泛化損失應該對任何N1都減小;(2)在大λ1極限下,學習曲線對N1的依賴性消失,是因為此時偏置是常數。

圖2 深度網路(L>1)的實驗。a,d,採用ReLU啟用函式的接近無限寬度和小α(α=0.1)情況下訓練於CIFAR10和MNIST上的深度為L的LHL神經網路的測試損失,其中P=100(a對應CIFAR10結果,d對應MNIST結果)。有限寬度的網路只能在SL<1(陰影區域,即只能在MNIST任務和深度L<3。其中,可觀測標量。)時優於無限寬度的預測。b,e,視覺化網路不斷迭代後的無限寬度NNGP核在不同層的條目(b對應CIFAR10,e對應MNIST)。ReLU NNGP核在不斷迭代後趨於零,導致了特徵值幾乎消失,使得SL最終總是大於1。c,f,基於P=1,000個示例訓練的4HL網路的測試損失,不同正則化強度的情況(其中=N=1000;c對應CIFAR10,f對應MNIST)。儘管增加最後一層高斯先驗的大小仍然改善了所有N的泛化效能,但不再像1HL網路那樣清晰,在大λL情況下,曲線隨N變化不再是一個常數。

圖3. 隨著深度L的增加,隨機資料和序參量的普遍行為。a,不同1HL架構在完全隨機任務上隨α1變化的訓練損失(即輸入 ,其中N0 = 5和標量輸出y都是從均值為零、方差為單位的正態分佈中取樣獨立同分布的隨機變數)。 其中,誤差條在資料點內。 目前本文理論只描述了訓練誤差恰好為零的過引數化極限,而無法解釋這種普遍現象。 b,採用ReLU啟用函式在各向同性網路情況下,對於不同的深度L對解(在零溫度極限下的鞍點方程的精確解)進行數值評估。 隨著L的增長(L≈30),對所有的α來說,序參量迅速趨近於1。 這表明在漸進區域中,DNNs也會在在P,N之後深度L趨於無窮時收斂到一個核心限制

編譯|餘孟君

神經網路的統計力學課程

課程詳情:

‍1.

2.

3.

4.

5.

6.

熱門資訊
  • 小米 Redmi 智慧電視 X 2025 系列等新品 11 月 27 日釋出 | 2024-11-24 17:21:20
  • 喬思伯推出ZB系列風扇:聯體設計、配360°四面鏡 | 2024-11-24 17:26:01
  • 喜事,長征十號重大突破!首飛時間鎖定,NASA局長或一語命中了 | 2024-11-24 17:56:32
  • AMD Zen5撕裂者仍有16核心:3D快取誰與爭鋒! | 2024-11-24 18:19:43
  • 臺積電確認正在按路線圖推進:A16工藝將於2026年末投產 | 2024-11-24 18:23:15
  • 小漏洞大破壞,那些“名垂青史”的病毒 | 2024-11-24 18:49:08
  • 在無人運輸機領域,再次上演“美國人做PPT,我們來實現” | 2024-11-24 19:26:49
  • AMD銳龍200全系型號曝光:Zen4第二次套馬甲 | 2024-11-24 20:13:25
  • Science重磅:破解40年謎題,揭開自來水消毒產生的神秘化合物 | 2024-11-24 20:44:21
  • 俄羅斯“進步 MS-29”貨運飛船與國際空間站對接 | 2024-11-24 20:44:25
  • 中國超算居全球圖計算能效榜首 | 2024-11-24 20:47:16
  • 蘋果為2024款M4 MacBook Pro提供獨立揚聲器維修部件 | 2024-11-24 21:09:25
  • Intel XeSS遊戲已超100款:普及速度飛快 | 2024-11-24 21:16:18
  • 帶走調查!可疑男子手持三維鐳射掃描器“逛”航展,想幹啥? | 2024-11-24 21:22:54
  • 電弱統一理論:誰是真的英雄? | 2024-11-24 21:23:01
  • 對話人才丨陳奧:推動生命科學臨床醫學的突破 | 2024-11-24 21:43:35
  • 擴散模型=進化演算法!生物學大佬用數學揭示本質 | 2024-11-24 21:56:15
  • 99.9元起 九鯊推出JF500miniRuby散熱器:記憶體避讓設計 | 2024-11-24 22:10:23
  • 冰島大力士“魔山”拉起 282PB 固態硬碟,打破“資料硬拉”紀錄 | 2024-11-24 22:10:26
  • 衛網君:垣信衛星與TELEBRAS達成合作;星艦將使SpaceX成為最具價值的公司;馬斯克對AI的未來提出警告 | 2024-11-24 22:22:37
  • 5分鐘能上手,第一輛能上路的「飛行汽車」來了 | 2024-11-24 22:22:44
  • 古爾曼:蘋果暫時沒有計劃對 AirPods Max 耳機進行重大更新 | 2024-11-24 22:25:15
  • 香港航空:恢復長途航線,瞄準C919 增量顯著 | 2024-11-24 22:37:02
  • AMD RX 7800M外接顯示卡實測:OCuLink介面比USB4效能高28% | 2024-11-24 22:54:13
  • 榮耀300系列續航被確認:標配5300mAh+100W快充,無線快充未缺席 | 2024-11-24 23:26:35
  • 359元起 振華髮布ZILLION DB系列電源:透過雙銅牌測試 | 2024-11-24 23:44:44
  • 韓國半導體,短板太多了 | 2024-11-24 23:50:32
  • 蘋果尚未計劃推出具有"重大"變化的AirPods Max 2 | 2024-11-25 00:16:48
  • 國芯科技:公司研發的高效能AI MCU晶片新產品內部測試成功 | 2024-11-25 01:43:02
  • 《權力的遊戲》中的"魔山"舉起了996磅固態硬碟 創造了世界紀錄 | 2024-11-25 01:53:18
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們