在神經科學領域諸多關於記憶的研究論文中,有一個高頻出現的名字—— Henry Molaison(簡稱H.M.)。
他曾是一位嚴重的患者。1953年,他決心接受一項有望治療癲癇的外科手術——切除包括海馬體1(圖1)在內的腦組織。手術後的H.M.在大多數方面都表現得相當正常:他的個性、抽象思維能力和推理能力並未受到影響;他也保留了童年的記憶,能夠清晰地記得小時候老家的地址。然而,讓世人感到疑惑的是,H.M.幾乎完全喪失了創造長期記憶的能力。他不記得手術後經常看他的醫生,甚至也不記得剛剛吃過飯。
1 海馬體:組成大腦邊緣系統的一部分,位於大腦皮質下方,擔當著關於短期記憶、長期記憶,以及空間定位的作用。
H.M.的經歷,讓人們對海馬體與記憶之間的功能聯絡產生了興趣。目前,神經科學家和心理學家已經開始認識到,我們的大腦中存在多種型別的記憶:有關過去經歷的情節性記憶,有關事實的語義記憶,短時和長時記憶等。但是,為什麼這些記憶會以不同型別存在?不同型別的記憶都儲存在大腦的什麼地方?對科學家來說,這些問題仍是未解之謎。
▷圖1 :H.M.的海馬體在手術中被剝除。圖片來源:brainfacts
記憶指的是大腦編碼、儲存和檢索過往經驗的能力。對過往經驗的儲存和概括有益於動物做出適應性的決策。舉例來說,記住通往特定水源的安全路徑,並對這些記憶線索進行概括,就能發現能預測新水源的環境特徵,如周圍的地貌、植被型別等。因而,這種能夠被用來識別和理解當前的情境,並基於過去的經驗預測將要發生的事情的記憶的能力,即可預測記憶,對生物的環境適應能力尤為重要。
▷ 原始論文:Organizing memories for generalization in complementary learning systems
如今,一項經人工神經網路實驗證實的新理論表明,大腦可能會透過評估記憶在未來的有用程度,對記憶進行分類。具體來說,可預測記憶2(比如每天早餐吃什麼或上班的路線怎麼走)會儲存在大腦的新皮質中,它們將幫助你更好的適應不斷變化的環境和做出相應有效的決策。至於一些不太有用的記憶,比如在一個派對上喝過的特殊飲料的味道,則會被直接儲存在海馬體中,不再會在新皮質中被鞏固。
可見,大腦會根據記憶的有用性和可預測性對其進行分類“裝箱”,優化了記憶的可靠性,來幫助我們應對新穎的情境。
2 可預測記憶:過去的經驗和記憶對未來事件的發生或特徵產生一定程度的可預測性。當大腦接收新資訊時,先前儲存的記憶可以用來識別和理解當前的情境,並基於過去的經驗預測將要發生的事情。這種可預測性有助於個體更好地適應環境和做出有效的決策。系統鞏固神經網路模型
關於記憶在腦區間的儲存,目前較為經典的研究理論是互補學習系統假說(圖2)。該理論認為,大腦中存在兩個互補的學習系統——海馬體和新皮質。海馬體,位於腦內深處,人們認為它在學習初期特別活躍。海馬體主要負責快速地將新的資訊進行編碼和儲存,並且對於空間導航、事實和事件的短期記憶至關重要。新皮質則是大腦外層的一部分,它會對資訊進行更長期的儲存和整合。新皮質的學習過程相對較慢,但它能夠處理更加複雜和抽象的資訊,並將其整合到長期記憶中。這兩個系統配合著一起工作,就形成了學習和記憶的動態過程。海馬體在學習初期迅速編碼新資訊,然後逐漸將這些資訊傳遞給新皮質,再由新皮質進行更加穩固和長期的儲存。
▷ 圖2:海馬體與新皮質在儲存記憶時的互補學習過程。圖源:researchgate
基於上述互補學習系統假說,研究人員建立了一個叫做“教師-筆記本-學生”的系統鞏固神經網路模型(圖3),該模型由三個功能不同的神經網路組成——教師、筆記本和學生網路。教師網路代表生物生存的環境,它提供經驗性的輸入;筆記本網路則代表海馬體,能夠快速地編碼環境所提供的每個經驗的所有細節;而學生網路則代表新皮質,其透過海馬體(筆記本)中記錄的經驗來預測環境(教師)提供的資訊。
具體來說,在神經網路模型中,“教師”是一個線性前饋網路,透過固定的權重和附加輸出噪聲生成“輸入-輸出對”。“學生”是一個與之大小相匹配的權重可學習的線性前饋網路。“筆記本”則是一個稀疏的Hopfield網路。在模型訓練的過程中,“學生”從包含訊號和噪聲的有限經驗集合中進行權重的學習,最終希望“教師”的輸出和“學生”的預測之間的平方差應儘可能小。另外,研究人員也提出假設,在這個模型中,“學生”的主要目標是最佳化泛化效能,能夠最終較好地預測新的“教師”輸出。
▷圖3:教師-學生-筆記本結構圖 圖源:參考文獻1
研究人員使用該神經網路模型模擬了記憶和泛化的動態過程,來研究系統鞏固3的實際影響和特徵。為了最佳化學生的記憶回溯,研究人員將模型建模為無限的筆記本回放。在每次模擬中,他們會根據三個不同可預測性(信噪比)的教師網路(高預測性、輕微預測性以及不可預測性),生成經驗輸入。
結果發現(圖4),儘管對於無噪聲的教師網路輸入,學生網路的泛化誤差單調減小,但有噪聲的教師網路輸入最終仍使得學生網路泛化效果不佳(紅色實線)。也就是說,在不可預測的環境中,過度的系統鞏固可能會嚴重降低模型的泛化效能,導致新皮質(學生)過度擬合環境(教師)中不可預測的元素。
這也預示著,在建構神經網路模型的過程中,為了最終能夠提高模型的泛化能力,有必要將系統鞏固水平考慮在內。
3 系統鞏固:研究人員將系統鞏固建模為學生網路內部突觸的可塑性。學生網路的可塑性機制受筆記本重新啟用的指導,類似於假設海馬體回放有助於系統鞏固的方式。
▷圖4:在最佳化學生記憶時,學生概括錯誤、學生記憶錯誤、筆記本概括錯誤和筆記本記憶錯誤的動態變化。圖源:參考文獻1
泛化最佳化的互補學習系統 (Go-CLS模型) Go-CLS模型
Go-CLS模型是在系統鞏固神經網路模型的基礎上建構而成的。考慮到上述實驗中在不可預測的環境裡系統鞏固對模型泛化能力的不利影響,研究人員調整了模型的系統鞏固水平。該理論的基本假設是,系統鞏固的程度是自適應調節的,當系統鞏固到一定程度後,如果繼續鞏固反而會削弱模型的泛化能力,就應該停止鞏固。從目前Go-CLS模型的訓練結果看,在這種設定下,學生(紅色實線)可以從每位教師的經驗中實現幾乎最佳的泛化效能。
▷圖5:在最佳化概括的表現時,學生概括錯誤、學生記憶錯誤、筆記本概括錯誤和筆記本記憶錯誤的動態變化。(b)高可預測性(無噪聲);(d)輕微可預測性(輕微噪聲);(f)不可預測性(多噪聲)。圖源:參考文獻1
與系統鞏固的神經網路模型比較
研究人員將上述兩個模型進行比較,發現兩者在處理不同預測性教師資料時表現出明顯差異。在標準系統鞏固模型中,所有記憶都會被鞏固,但泛化能力隨著教師可預測性的不同而有很大變化。對於可預測性較低的教師,這種模型的泛化誤差較高(圖6,左)。與之相較,Go-CLS模型消除了過擬合的有害效應,在學生能夠到達最優記憶效能之前結束。並且隨著教師的可預測性程度增加,泛化效能和記憶效能均得到改善(圖6,右)。
▷圖 6: 鞏固模型與Go-CLS模型下學生泛化效能隨教師的可預測性程度變化的比較。左:系統鞏固的神經網路模型,右:Go-CLS模型。圖源:參考文獻1
可見,Go-CLS模型不僅在逆行性遺忘4(即過去記憶的丟失)方面與系統鞏固的神經網路模型表現不同,還在時間依賴性泛化方面表現出顯著差異。在模擬海馬體剝除後,在逆行性遺忘方面,系統鞏固的神經網路模型總會表現出記憶逐漸丟失的趨勢,即過去的記憶更容易被遺忘。而Go-CLS模型則能夠解釋不同型別的記憶丟失現象,包括那些隨時間變化而不同的記憶丟失模式。在時間依賴的泛化層面,在處理不同的可預測性的經驗時,兩種模型都會產生多樣的泛化曲線,最大泛化效能隨著教師的可預測性增加而提高。然而,在學生過擬合時,只有Go-CLS能夠維持其隨時間變化的泛化能力。系統鞏固的神經網路模型甚至可能導致學生過度泛化,產生極不準確的輸出。
4 逆行性遺忘(retrograde amnesia):在某個特定時間點之前發生的事件或資訊無法被記憶,而在這個時間點之後的記憶則相對保留。這種記憶缺失通常是由於腦部受損或其他神經系統障礙引起的,影響了個體對過去經歷和資訊的回憶。逆行性遺忘可能涉及特定型別的記憶,如語義記憶或事件記憶,而不是影響所有記憶型別。研究者通常根據記憶缺陷在最近和遠期記憶中是否相似(平坦逆行性遺忘)、在最近記憶中是否更為明顯(分級逆行性遺忘),或者在最近和遠期記憶中是否都不存在(無逆行性遺忘)來對海馬體遺忘動態進行分類。對互補學習系統理論的補充
Go-CLS神經網路模型的實驗結果為互補學習系統假說提供了新的見解。海馬體和新皮質耦合的快速和慢速學習模組——是互補學習假設的基本前提。
於是,研究人員又利用Go-CLS神經網路模型比較了耦合的學生-筆記本網路(圖7,左)與孤立的學生(圖7,中)和筆記本網路(圖7,右)的泛化效能。考慮到Go-CLS神經網路模型中,“學生”表徵的是互補學習系統假說中的新皮質,“筆記本”表徵的是海馬體,因此孤立的學生和筆記本網路的實驗組,則分別表示各自僅用新皮質或僅用海馬體學習的情境。
▷ 圖 7: 學習系統模型示意圖,(a)使用學生-筆記本網路;(b)僅使用學生網路;(c)僅使用筆記本網路。圖源:參考文獻1
孤立學生網路模型必須線上從每個教師網路的經驗中學習,並且無法重新訪問或是回顧以往的資訊。這就限制了它的泛化效能(圖8,橙色與黑色曲線相比)。結果表明,使用兩個包含學生的網路模型都要比僅含筆記本的網路模型泛化效能更好。另外,當教師網路提供適量可預測的資料時,學生-筆記本耦合網路模型的泛化增益要遠遠大於孤立的學生網路模型。因此,在資料適中且環境中噪聲適度的情況下,學生-筆記本耦合網路模型在泛化效能上更為優越。
另外,當學生的經驗數量等於學習模型中可調整的引數數量時,使用“回顧先前的學習經驗來進行學習”(回放功能)可以最有效地提升學生的學習能力。但這種情況下也存在風險:大腦可能會過度適應這些舊資訊,導致對新情況的反應不夠靈活,就像機器學習中的“雙峰下降”現象一樣。在這種現象中,當資料量處於與網路大小相關的中等水平時,過擬合最為嚴重。當記憶模式的數量接近網路模型可以處理的最大數量(容量)時,神經網路必須最精細地調整其權重。這通常需要對權重進行大幅度的更改,以減小小的訓練誤差。為了避免這個問題,最優學生-筆記本網路模型可以透過根據教師的可預測性調整系統鞏固的數量,以防止過度適應噪聲。這預示著,大腦可能也在以類似的方式根據經驗的可預測性來調節學習和記憶的方式。
▷圖8:互補學習系統的優勢。圖源:參考文獻1。
總結
Go-GLS模型為我們提供了一個有趣的理論假設,即大腦可能是透過評估記憶的可預測性和對未來的有用性來對記憶進行分類的。
▷圖9:用一則故事說明系統鞏固模型與 Go-CLS 模型在概念上的差異 圖源:參考文獻1。
設想這樣的情境:一個小女孩與父親在湖邊度過快樂的一天。在這一天的經歷中,可能包含了新鮮採摘的草莓,味道很甜這樣的可預測關係。Go-GLS模型的研究結果表明:可預測關係應該從經驗中提取出來,並與相關經驗的記憶相互整合,透過系統鞏固過程來生成記憶,並被強化,實現可預測經驗的泛化。在這一天的經歷中,也可能會出現不可預測的共現事件,比如父親的襯衫顏色剛好與草莓的顏色都是紅色。但這類關係不應在新皮質中被鞏固。當然,它們仍然可以作為這一天的情景記憶的一部分存放在海馬體中。
另一方面,Go-GLS模型與人工智慧研究有許多微妙的聯絡。Go-CLS模型透過教師-學生對的最優逼近誤差來定義可預測性。但是,這與實際情況中,是否可以學到最優學生權重是不同的。比如梯度下降可能陷入區域性最小值或短暫地降低泛化效能。另外,由於過擬合同樣可以在更復雜的學生架構以及現代深度學習模型中觀察到,Go-GLS模型中提出的基本概念也適用於更廣泛的模型類別。同樣,一些機器學習方法可以插值訓練資料並很好地泛化,因此我們有必要尋找能夠在學習過程中更好地平衡記憶和泛化的學生網路架構和學習規則。
然而,Go-GLS模型僅關注了簡單的監督學習問題,未來我們仍需要解決在具有更為多樣化的泛化情境下的最優鞏固問題,例如強化學習和大型語言模型中的新興少樣本學習。
參考文獻:
- [1] Sun, W., Advani, M., Spruston, N. et al. Organizing memories for generalization in complementary learning systems. Nat Neurosci 26, 1438–1448 (2023).
- [2] https://www.quantamagazine.org/the-usefulness-of-a-memory-guides-where-the-brain-saves-it-20230830/