時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

中國科學院用數學研究深度學習,助力理解神經網路深度的有效性

2024-11-23 18:32:16

深度學習的成功已經無需多言。一直以來,研究者們都嘗試從數學角度去解釋神經網路的有效性。然而,由於網路的結構可以看作是高維線性變換和逐元素的非線性變換(如 ReLU 啟用函式)之間的多重複合,因此實際上並沒有很好的數學工具去破解這樣複雜的結構。

所以,對於神經網路的理論研究往往侷限在諸如網路的逼近、最佳化、泛化以及其他觀測到的現象等方面。

如果拋開理論的限制,一個無可爭議的事實是:更寬、更深的網路總是有著更好的效果。小到幾層的全連線網路、大到萬億規模的大模型,都一致性地保持著這樣的規律。

那麼,如何從理論上理解這樣的事實?啟用函式又在其中扮演什麼樣的角色?

相比於寬度,對深度的研究更加具有挑戰性,因為層數的增加還伴隨著非線性函式的不斷複合。

一個典型的問題是,當模型寬度固定的時候,增加模型的深度是否比淺層的模型擬合更多的資料點?

中國科學院應用數學所博士畢業生蓋闊在讀博期間完成一個生成網路演算法設計的工作和一個現象驅動的可解釋性工作之後,希望探索關於人工智慧的為題。

因為自己是數學背景出身,所以就想做一些理論的結果。但在當時神經網路理論研究的框架已經很清晰,研究剩下的空白難題則都非常有難度。

“以至於我讀了很久的已有文獻,也沒能找到原創性的切入點。”他說。

經歷一系列不成功的嘗試之後,蓋闊又回到了最初的一個直覺的想法:因為網路的寬度更容易分析,比如對於一個簡單的線性方程

來說,當增加 W 的尺寸之後,能求解的關於 X 和 Y 之間的方程個數也會線性增加。

如能把深度等效為寬度,將兩層網路等效為一個單層的大矩陣,那麼就可以透過消元法去找到這個大矩陣方程的解,也就對應著兩層神經網路的解,這也說明增加網路深度就像增加寬度一樣有效。

但是,對於逐元素非線性啟用函式與矩陣乘法之間的複合幾乎沒有什麼工具來幫助計算,也不具備很好的最佳化性質。

例如,對於方程

假設

都是已知的,如果

是 ReLU 或者 Sigmoid 函式,那麼求解這個方程是很困難的。

因為不是凸問題,所以即便使用最佳化後的方法也無法保證一定會求到解答。但是,求解這樣一個方程卻是他在課題構想中的重要一步。

雖然沒能進一步推進,不過問題的具體形式已經相對清晰了。蓋闊表示如果將啟用函式的範圍拓寬,這樣的方程就可以找到解(例如把啟用函式換成矩陣指數)。

這樣做的好處是,當兩個矩陣是可交換的時候,經過矩陣指數函式啟用之後,所得到的矩陣也是可交換的。

為了使特定矩陣具有可交換的性質,就需要額外增加一層網路引數。有了可交換的性質,就很容易求解上述方程,那麼就可以在等效的大矩陣裡做消元,找到三層函式的一組解。

就這樣,他就在這種特殊的啟用函式下實現了最初的設想。

具體來說,蓋闊和博士導師張世華研究員討論之後認為:如能找到一個簡單直接的例子,能夠說明在有啟用函式的情況下,網路加深一層後能夠擬合更多的資料點,那麼這樣的結果可能更有意義。

為此他們將網路引數擴充套件到複數域,並且將逐元素的啟用函式替換為矩陣指數啟用函式,從而可以對三層的神經網路:

找到一組解析解使得:

其中,所有的矩陣均為 d 維的方陣,這就說明了網路深度的有效性,因為假如只有一層網路的話就只能滿足一組

總的來說,他們在理論上找到了一個解釋性較好的例子,可以幫助人們更好地理解神經網路深度以及非線性啟用函式的有效性。

實驗中他們觀察到,雖然本次理論結果是針對矩陣指數啟用函式而言的,但對於逐元素的 ReLU 或者 Sigmoid 啟用函式,也能在網路較寬時觀察到類似的最佳化結果,即兩層網路擬合數據點的能力大概是單層的二倍。而這可能會啟發其他研究者發現更加一般性的結論。

日前,相關論文以《矩陣指數啟用函式的三層網路的解析解》(ANALYTICAL SOLUTION OF A THREE-LAYER NETWORK WITH A MATRIX EXPONENTIAL ACTIVATION FUNCTION)為題發在arXiv[1]。

蓋闊表示:“非常感謝張世華老師的支援與鼓勵。當課題遲遲沒有進展的時候,張老師沒有就論文發表施加壓力,也沒有催促更換課題。”

“幸運的是,本來已經計劃和張老師討論放棄這個課題了,但在討論前一天又突然有了靈感,最終找到了解決的路徑。如果張老師沒有這樣多的耐心,可能我也最後等不來靈感出現。”他最後表示。

參考資料:

1.https://arxiv.org/pdf/2407.02540

排版:溪樹

熱門資訊
  • 全能不斷網!華為Mate X5、靈犀通訊:搶票、連網都快人一步 | 2024-02-11 00:17:03
  • 大腦如何區分和儲存記憶? | 2024-02-11 00:22:11
  • 優派推出27英寸OLED顯示器:2.5K解析度、240Hz重新整理率 | 2024-02-11 00:23:26
  • 三星智慧手錶睡眠呼吸暫停檢測功能獲FDA批准 | 2024-02-11 00:41:27
  • 英特爾Arrow Lake的GPU部分開始為Linux 6.9提供支援 | 2024-02-11 00:41:34
  • 即將推出的聯想ThinkBook筆記本計劃首次採用全透明OLED顯示屏 | 2024-02-11 00:42:06
  • 技嘉修改其GeForce RTX 4090和RTX 4080 GPU的PCB設計以解決開裂問題 | 2024-02-11 02:28:00
  • AMD遙遙領先英特爾 再創記憶體超頻記錄 | 2024-02-11 02:34:47
  • SpaceX“龍”飛船 Ax-3 四名宇航員返回地球,完成近 22 天任務 | 2024-02-11 03:08:50
  • 蘋果公司正在調查影響Apple Watch Series 9 和 Ultra 2的"幽靈觸控"問題 | 2024-02-11 03:48:49
  • 石頭洗地機登上春晚 同款產品售價僅2499元起 | 2024-02-11 06:06:37
  • 臺積電計劃將3nm月產能提高至10萬片晶圓,在日本追加建造第二座工廠 | 2024-02-11 06:25:21
  • 美國將啟動價值50億美元的研究中心 以在晶片競賽中保持領先地位 | 2024-02-11 06:26:53
  • 春節後小米14 Ultra、華為P70 Pro、尼康Z6 III集中登場,你選誰 | 2024-02-11 07:01:47
  • 即將到來的第六代iPad Air:更大螢幕 換M2 | 2024-02-11 07:01:50
  • 華為Mate X5亮相春晚,成功實力搶鏡! | 2024-02-11 07:01:56
  • 蘋果頭顯價格跳水,黃牛黨遭重創 | 2024-02-11 07:01:58
  • OPPO徹底發飆,釋出不足半年直降800元,12GB+256GB+20倍變焦 | 2024-02-11 07:02:02
  • 蘋果證實部分Apple Watch Series 9和Ultra 2觸控出現問題 | 2024-02-11 07:07:33
  • 體驗 Vision Pro 兩週,我們發現了空間計算的殺手級應用 | 2024-02-11 07:10:17
  • 華為或將推出Vision頭顯!4K Micro-OLED、350克,定價15000元左右【附頭顯行業預測】 | 2024-02-11 07:10:22
  • 索尼WF-1000XM5耳機評測:三年磨一劍,技術、舒適性與音質的完美融合 | 2024-02-11 07:10:24
  • 這個海灘為什麼是紅色的? | 2024-02-11 07:10:27
  • Sci Transl Med | 東南大學姚紅紅等團隊透過多組學方法,表徵缺血小鼠腦的分子和細胞結構 | 2024-02-11 07:10:30
  • 日均銷量15萬部!iPhone15成中國最暢銷手機,力壓華為mate60! | 2024-02-11 07:17:23
  • 三年獲三輪億元融資,支撐SCI 170篇,慧創醫療用近紅外光技術深度賦能腦科學 | 2024-02-11 07:17:34
  • 更高能的AI!三星Galaxy S24系列特色體驗解讀,驍龍助攻 | 2024-02-11 07:17:38
  • 手機殼還能液冷散熱?華為Mate 60系列微泵液冷殼,顛覆你的想象 | 2024-02-11 07:22:55
  • 華為Pocket 2開啟預約,麒麟晶片小摺疊屏,春節後正式釋出! | 2024-02-11 07:22:58
  • 英特爾欲從AMD手中搶奪半定製SoC業務,正在向微軟推銷全美國化方案 | 2024-02-11 07:23:01
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們