奇月 發自 凹非寺量子位 | 公眾號 QbitAI
入職MIT電氣工程和計算機科學系的何愷明,第一波門下弟子現在曝光——
可以看到,四位研究者中其中有三位都是3位是華人:白行建、鄧明揚、黎天鴻。
我們熟悉的IMO、IOI雙料奧賽金牌得主鄧明揚也在列。
事實上,在不久之前,他們就已經合作了一篇文章:無需向量量化的自迴歸影象生成何愷明新作再戰AI生成:入職MIT後首次帶隊,奧賽雙料金牌得主鄧明揚參與
這篇文章提出了一種新的影象生成方法,透過擴散過程來建模每個標記的機率分佈,從而避免了使用離散值的tokenizer,並在連續值空間中實現了自迴歸模型的應用。
這篇文章黎天鴻博士後是論文的一作,此外他還參與了何愷明團隊的其他多項學術研究:
何愷明副教授的主頁也更新了頭像、聯絡方式和履歷,還有一些最新的MIT課程和演講等:
何愷明MIT實驗室成員首次公開
博士一年級生鄧明揚
鄧明揚,MIT數學和計算機科學本科。
他從小學三年級就開始競賽,在高一獲得IMO(國際數學競賽)金牌,高三獲得IOI(國際資訊學奧林匹克競賽)金牌,國內首位在不同學科獲得國際金牌的選手,也是IOI歷史上第三位滿分選手,人稱“乖神”。
此外他還曾獲得ICPC國際大學生程式設計競賽世界總決賽的第1名。
目前鄧明揚的研究重點是機器學習,特別是理解和推進生成式基礎模型,包括擴散模型和大型語言模型。
博士一年級生白行健
白行健高中畢業於北師大實驗中學,在牛津大學獲得了數學和計算機科學的碩士和學士學位。
他的研究重點目前是是經典演算法和深度學習的交叉領域。
他也參與了多項競賽,曾獲得2018年CCO(加拿大資訊學奧林匹克競賽)第一名,NOI(中國資訊學奧林匹克競賽)銀牌,NOIP(中國資訊學聯賽)北京市提高組一等獎第3名等。
高三時,他就憑藉自適應檢測網路暴力的論文入圍了丘成桐中學科學獎決賽。
博士後黎天鴻
黎天鴻本科畢業於清華叉院姚班,在MIT獲得了碩博學位之後,目前在何愷明組內從事博士後研究。
根據他的主頁最新訊息顯示,他將擔任ICLR 2025的區域主席。
他的主要研究方向是表示學習和生成模型,目標是構建能夠理解人類感知之外的世界的智慧視覺系統。
此前曾作為一作和何愷明開發了自條件影象生成框架RCG,團隊最新的多項研究中他也都有參與。
有趣的是,他還非常喜歡做飯,主頁上放了很多自己總結的食譜。
博士生Jake Austin
還有一位博士生Jake Austin,之前在加州伯克利大學人工智慧研究所任職。
她的谷歌學術主頁被引數超過了500,主要成果也是集中在計算機視覺領域。
何愷明團隊的最新動態
CV相關
何愷明團隊最新的學術研究成果還是主要集中在他擅長的CV領域。
最新一篇是發表於10月17日的一篇論文:Fluid: Scaling Autoregressive Text-to-image Generative Models with Continuous Tokens。
這篇論文透過實證研究表明,使用連續標記和隨機順序生成的自迴歸模型在文字到影象生成任務中表現出最佳的擴充套件性和生成質量,團隊提出的Fluid模型重新整理了新的零樣本FID和GenEval分數。
另一篇Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transformers發表於9月30日。
這篇文章提出了一種名為Heterogeneous Pre-trained Transformers (HPT) 的架構,透過跨不同機器人本體和任務的異構預訓練來學習通用的策略表示,並在大規模機器人模擬和真實世界環境中驗證了其有效性。
主頁還列出了更多研究內容,包括自迴歸影象生成、單張影象3D物理建模、使用拉格朗日體積網格表示高質量幾何形狀等等,多篇文章都已被NeurlPS 2024接收。
AI for Science相關
之前,何愷明副教授在MIT的求職演講上特意提到,AI for Science也將是他未來的工作方向。
5月他曾發表了這個方向的首個工作:使用強化學習的動態異構量子資源排程。文章使用自注意力機制處理量子位元對的序列資訊,在機率性環境中訓練強化學習模型,提供動態實時排程指導,最終將量子系統效能提升了3倍以上。
多位大神雲集,讓我們一起期待何愷明團隊未來的更多成果吧!
參考連結:[1]https://people.csail.mit.edu/kaiming/