他們在人生分岔路口的偶然選擇,成就了自己,也成就了港中文。
不速之客
一九九七年,秋冬時分,位於中國科技大學西區教三樓最東面的資訊處理中心迎來了兩位「不速之客」。
一位是中科大9406班的學生李學龍。
彼時他剛升大四,準備保研本校,正在找導師,來到資訊處理中心、希望提前跟著高年級的學生熟悉科研,然後加入時任中心主任的劉政凱教授門下研究影象處理。
中科大的資訊處理中心(IPC)始建於1988年,隸屬於電子工程與資訊科學系(代號6系),聚集了很多像李學龍一樣的6系學生,被稱為「IPCer」,研究氛圍很活躍。
李學龍到中心後,裡面有很多自己熟悉的面孔,但有一個人,穿著洋氣,談吐幽默,不是6系的學生,格外引起他的注意。
這個人,就是湯曉鷗。
湯曉鷗(1968-2023)
當時,30歲左右的湯曉鷗剛結束七年留美求學生涯回國,還是一籍籍無名的青年學者。
1997年香港迴歸,為吸引美國高材生來港工作,中國香港出臺了一系列優惠政策。湯曉鷗博士畢業於美國麻省理工學院(MIT),回國找工作,就選擇了去香港中文大學任教。
但在入職之前,他想回自己的本科母校中科大看一看,於是回了一趟合肥,順便訪問了那時距他不遠的資訊處理中心。
該中心主要研究視覺資訊檢索和模式識別,與湯曉鷗當時感興趣的人臉識別方向有許多技術相通之處,於是湯曉鷗常去交流。
幾次交流下來,湯曉鷗就結識了許多中科大6系的師弟師妹,李學龍也與之相識。
李學龍是中心的活躍分子。雖然湯曉鷗在中科大讀書時是在精密機械與精密儀器系,不是6系的直屬師兄,但訪問期間李學龍也與他交流了許多。
訪問結束後,湯曉鷗去港中文報到,李學龍則繼續留在資訊處理中心做研究。
令許多人都沒想到的是,在這次尋常的學術訪問中,湯曉鷗與李學龍的相識會成為後來港中文計算機視覺迅速發展的起點。
李學龍
湯曉鷗在港中文入職的院系是資訊工程系。他在MIT讀博時開始接觸機器視覺,還了解到了像人臉識別這樣的前沿方向,畢業後也希望在這些領域深耕。
港中文的資訊工程系由華裔科學家、2009年諾貝爾物理學獎得主高錕所創,建系時的起家方向是通訊,包括通訊編碼、光通訊、無線通訊等,至今該系仍是全世界通訊領域的學術重鎮。
湯曉鷗剛開始當教職時,正趕上全球網際網路發展的大潮,出現了一個熱門方向叫「多媒體」。在1997年左右,多媒體就跟今天的AI一樣,是一個非常圈地的名詞。通訊基礎設施建立後,大家也越來越關注通訊中所傳輸的內容,例如影象。
當時影象處理是港中文資訊工程系的短板,湯曉鷗希望把這塊補起來,於是在2001年7月創立了「多媒體實驗室」(又稱「MMLab」),主要研究系統性能與人臉識別。
剛成立的MMLab實驗室沒有太多擅長影象處理的老師,只有一個叫做劉健莊的博士後與湯曉鷗搭檔。湯曉鷗去港中文的那一年,他剛從港中文博士畢業,後來去新加坡南洋理工大學做研究,2000年又回到了港中文,如今在華為諾亞方舟實驗室。
那時湯曉鷗已經經歷了一遍「青椒」的焦慮,在香港這個以粵語為主要交流語言、學生主要是香港學生的小島,他缺人脈,缺經費,也缺學生,MMLab的成立幾乎是孤注一擲。但湯曉鷗決定賭一把。
2001年,雖然香港的經濟與文化繁榮,比內地的城市國際化,但香港三大高校最優秀的學生在畢業後都是計劃去美國深造,湯曉鷗縱有三寸不爛之舌,也招不到優秀的香港本土學生來讀研。於是他想到了一個「曲線救國」的辦法:邀請李學龍來訪問。
李學龍欣然接受了湯曉鷗的邀請,到MMLab訪問了半年。
這次訪問打開了李學龍的視野。
在港中文,25歲的李學龍第一次知道CVPR是計算機影象處理方向的一個國際頂級學術會議,知道每年全世界最優秀的視覺研究者都會去參會、近距離交流。此前他們在中科大,只知道往國內的期刊投稿,對國際交流這件事是沒有概念的。
後來博士畢業,李學龍沒有選擇留在國內、而是先去英國高校任教,接觸國際前沿的知識再回國,也有此次訪問的影響。
在英國,李學龍先後任教於阿爾斯特大學和倫敦大學,將認知計算引入資訊領域,僅用4年時間就拿到了英國倫敦大學終身教職。到2009年作為第一批歸國教授回國任教時,他已經是國際上大名鼎鼎的計算機科學家。
後來,憑藉在視覺領域的成就,他也當選了2011年度IEEE Fellow和國家傑青,2020又年當選 ACM Fellow。如今,李學龍在西北工業大學任教,培養了許多優秀的AI人才,也承擔了許多重要科研專案。
不過,在港中文視覺的這一篇上,更重要的是,李學龍結束訪問、回到內地後,在他的分享與介紹下,中科大資訊處理中心的許多學生都對湯曉鷗的實驗室產生了興趣,希望去香港讀研,如王曉剛、陶大程、林達華、曹亮亮等等,結束了湯曉鷗招生難的窘境。
王曉剛與陶大程
如果把時間拉回到2001年,像王曉剛這樣的天才學生,選擇到一個毫無名氣、又初初成立的實驗室去讀書,其實是一件不可思議的事情。
這中間,李學龍的搭線起到了重要作用。
王曉剛來自中科大00班(9600)。那時能進中科大的已經是學霸,能進00班的更是學霸中的學霸:
當時的教育分級化還沒有那麼嚴重,許多能上清北的學生都不去清北、而是選擇去中科大(如科大訊飛的董事長劉慶峰),而能進00班的,一般都是每年各省報考中科大的前三名。
而且,王曉剛還是00班最出類拔萃的學生之一,在校期間獲得過中科大學子夢寐以求的最高獎——郭沫若獎,獎金2000元。AI圈另一位獲此榮譽的中科大校友是鄧力,全球第一個將深度學習在產業應用上成功落地的人。
王曉剛
當時李學龍在中科大資訊處理中心讀博,與所有人的關係都很近。王曉剛也在中心做研究,李學龍知道湯曉鷗想招一些優秀的學生去香港做研究,就推薦了王曉剛。
同是中科大畢業的湯曉鷗一看,立刻判斷出王曉剛的分量,很快動員了王曉剛加入當時才剛成立不到兩個月的MMLab。
一年以後,李學龍又推薦了徐東和陶大程,兩位9706班的同學去香港。那時,陶大程的數學基礎就非常突出,創新和程式設計能力也很強。
徐東告訴雷峰網,那時國內最火的領域其實是通訊,他們同學一度最想去的是研究通訊技術的實驗室,因為有機會到UT斯達康(生產小靈通的公司)這樣的企業去實習,實習工資很高,一個月就能給到三千。而AI是冷門方向,大家對湯曉鷗正在研究的人臉識別、CVPR等更是毫無概念。
聽了李學龍對港中文與湯曉鷗的介紹後,陶大程很感興趣,徐東則沒有太動心,而是選擇留在中科大,直到2004年才去MMLab訪問。
陶大程
王曉剛與陶大程到港中文都是讀的研究型碩士(MPhil),兩年制。王曉剛是2001年入學,陶大程是2002年入學。
湯曉鷗強調兩點:一是科研方面的自學能力,二是研究交流方面的「華山論劍」,即向CVPR、ICCV、ECCV這三大計算機視覺領域的頂會投稿。
這種對在頂級會議發表文章的重視程度,是湯曉鷗在MIT讀博時形成的認知。
他一直認為,做研究就像比武論劍,要論劍就要到華山論劍,如果去太行山、大別山論劍,即使聲名大噪,也難以與全球其他傑出團隊論資排輩。
在湯曉鷗的影響下,實驗室的同學們對做高水平的研究也很執著。碩士兩年,單單是研究論文,王曉剛就列印了幾大箱。因為功夫紮實,加上無比的勤奮,王曉剛碩士兩年在CVPR和ICCV上一共就發表了5篇論文。
在他們的努力下,2004年,整個MMLab在CVPR上發表的論文數量甚至達到了7篇,王曉剛、陶大程、李志峰(9400),每人分別有兩篇文章被接收,而當年CVPR在全球的論文接收總量也不過三百來篇。
那時舉目全球,能在頂級會議上發科研論文的學生也是屈指可數,所以兩年碩士結束後,王曉剛和陶大程都相繼拿到了世界頂級學府的讀博通行證:
2004年,同一年,王曉剛去了美國的MIT視覺組讀博,陶大程則被英國的劍橋大學錄取。但是,最終陶大程去了倫敦大學伯貝克學院追隨計算機視覺的知名學者Stephen J Maybank教授讀博。
王曉剛從美國學成歸來後繼續與湯曉鷗搭檔,成為MMLab的靈魂人物,把MMLab推上了一個更高階的水平,共同創立商湯科技,擔任商湯研究院的院長,是中國推動計算機視覺技術產業化的重要人物。
陶大程在英國完成博士學習後,於2007年加入香港理工大學做助理教授,加入京東前在悉尼大學任澳大利亞桂冠教授,不到40歲當選澳大利亞科學院院士。目前就任京東探索研究院的首任院長、京東集團高階副總裁。
在MMLab讀研期間,他們奠定了整個MMLab的研究氛圍:以頂會「死亡線」(Deadline)為目標制定科研規劃,在投稿前熬夜備戰衝刺,並且閱讀大量的科研論文。
比如後來,林達華到港中文時,湯曉鷗就把王曉剛去MIT讀博前留下的幾大箱論文給了林達華。林達華制定一個論文閱讀計劃,規定每天要讀X篇論文,到兩年碩士畢業時,他已經讀了2000多篇論文,基本把當時計算機視覺方向的所有論文都讀了一遍,由此入門該方向。
湯曉鷗離港,顏水成加入
2004年,顏水成也「意外」地來到了港中文。
顏水成是1995年湖南衡陽高考的榜眼,高分考進了北京大學數學系,本碩博連讀。2001年開始,顏水成在微軟亞洲研究院(MSRA)媒體計算組跟著張宏江實習,期間認識了常來MSRA訪問的湯曉鷗,開始相熟。
2002年,湯曉鷗與高新波(重慶郵電大學校長)、張宏江(智源研究院院長)一起在IEEE神經網路期刊上發表了一篇論文(“A Spatial-Temporal Approach for Video Caption Detection and Recognition”),由此與MSRA建立了聯絡。
2004年顏水成博士畢業時,想到境外的高校當博士後。
當時,剛好湯曉鷗從香港創新科技署拿了600萬港幣做一個人臉識別專案,同時湯曉鷗又受張宏江和沈向洋的邀請去MSRA領導視覺計算組,需要一個人在港中文領導專案的開展,就找了顏水成。
顏水成於是先去港中文做博士後,研究(3D)人臉識別。
顏水成
顏水成是第一個加入MMLab的清北學子。此前MMLab的生源主要來自中科大,湯曉鷗到MSRA訪問後,開始招納北京高校的學生(如何愷明),MMLab也一度被稱為「清北分舵」。
沒過幾個月,徐東也來到了MMLab訪問,還有劉青山、唐明、林達華、曹亮亮等人。
顏水成加入後,還帶去了他在北大的班友許春景。許春景先是做研究助理,後又讀博。如今,許春景擔任華為諾亞方舟計算機視覺實驗室主任。MMLab最先去華為的是劉健莊,帶了張維,之後還有李振國等人。
這段時期,顏水成、徐東等人的加入對MMLab的發展承接至關重要,因為那時的湯曉鷗受聘去MSRA,經常需要長時間呆在北京。
當時香港的研究比內地發達,但與美國的機構相比還是差一大截,湯曉鷗當時也只是一個副教授,而MSRA是全球科技巨頭微軟的分舵,向MSRA看齊就是向全球頂尖看齊。
MMLab的研究氛圍與MSRA很像,都重視發論文、頂會熬夜趕DDL,所以顏水成和徐東很適應。
顏水成與徐東是在MSRA實習時的好夥伴。在MSRA,徐東跟著張磊,顏水成跟著張宏江,張磊的團隊在張宏江領導的大組內,徐東也由此跟著顏水成一起做研究。有一年,他們一起合作投頂會,一口氣就投了7篇論文、一下子中了5篇,之後兩人研究交流也很緊密。
徐東
在MMLab的兩年,林達華也取得了很傑出的成果:兩年碩士一共中了7篇論文,順利申請到了MIT讀博,實現了當初來到港中文讀研時的目標。
湯曉鷗說服林達華到港中文讀書的談話,是一場典型的「湯老師會談」:
那是2003年。林達華在香港科技大學交換,受權龍的影響對計算機視覺產生了興趣。當李學龍跟他說港中文相關方向的湯曉鷗老師想招一些學生去做研究時,林達華就給湯曉鷗寫了一封郵件,湯曉鷗立刻約他見面。
林達華所交換的港科大位於清水灣半島,湯曉鷗所在的港中文靠近深圳羅湖。林達華坐接駁公交到附近的地鐵站,又坐了一個多小時才到港中文所在的大學站,累得要死。結果見面沒多久,湯曉鷗就跟他說,你很有希望上MIT。
這讓21歲的林達華很震驚:上MIT,那可是全球最強的學府。林達華此前想都不敢想,但湯曉鷗就這麼隨意地說了出來。
「湯老師在他整個事業的發展上真的是一個很優秀的HR。」林達華事後笑道。
湯曉鷗用了超過一半的時間去吸引優秀的人才。
林達華告訴雷峰網,湯曉鷗遊說人,不是跟人分析加入他的團隊後能做什麼,而是告訴別人:你在未來能到達一個怎樣的、極其有吸引力的高度,並且告訴他們一條清晰可行的實現路徑。
據說湯曉鷗遊說王曉剛、何愷明等等青年加入他的團隊時,也都是類似的「套路」。而且,他看準的人才,會一遍一遍地遊說,直到對方同意或再無可能。
他把這些優秀的人聚在一起,還給了大家一種「是在為自己的前程奮鬥」的感受,所以團隊出成果很容易。
林達華當然很心動,沒有多猶豫就決定了去香港讀研。後來,林達華也確實去了MIT讀博,還跟王曉剛一樣成為接棒MMLab發展的重要人物,現在是MMLab的主任。
林達華
再說回顏水成和徐東。
他們當時更多是處於博士畢業、找教職的拐點,而在香港的訪問,給他們的簡歷增加了「國際色彩」。在MMLab訪問了6個月後,徐東回MSRA又呆了9個月,然後就去了美國的哥倫比亞大學當博士後,顏水成也去了美國的UIUC當博士後、師從華人視覺鼻祖黃煦濤。
再後來,他們結束在美國的研究生涯找教職時,也是首先將目光定在了香港與鄰近香港的新加坡。對於這個決定,黃煦濤也贊同,認為他們應該「Return to Asia(回到亞洲)」,因為他們不是美國本土培養的博士生。
徐東拿了南洋理工大學(NTU)的offer,後來去悉尼大學、現在又返回到了香港,在香港大學任職。顏水成本來是計劃與徐東一起去NTU,後來又收到了新加坡國立大學的offer,就去了新加坡,後來無論是輾轉在360、依圖還是蝦皮,也都帶出了許多優秀的中國研究者。
深度學習浪潮掀起
MMLab的名聲開始遠揚:全球的計算機視覺研究者都開始知道這座位於香港北邊的實驗室。
林達華告訴雷峰網,2005年他去CVPR參會、作演講時,雖然只是一名碩士生,但已經有很多人知道他、知道湯曉鷗。
但客觀來說,此時湯曉鷗的名氣和地位跟如今相比還是有較大差距,MMLab與MIT、斯坦福幾個高校的頂尖實驗室相比,也還不是一個等級。
真正的拐點發生在2009年。
那一年,MMLab發生了兩件重要的事:一是MMLab與MSRA合作的論文獲亞洲第一篇CVPR最佳論文(何愷明一作),聲名大噪;二是王曉剛回歸,與湯曉鷗搭檔、將MMLab及時搭上了深度學習的春風,讓這個實驗室、以及與這個實驗室相關的人都成為了談論中國計算機視覺歷史時繞不開的話題。
那一年,湯曉鷗也憑藉在模式識別和影片處理方向的成就入選了IEEE Fellow(全球電子工程領域最高榮譽)。
湯曉鷗與何愷明(右)
湯曉鷗選擇加入MSRA的決定,與他當時接受張宏江與沈向洋的邀請擔任視覺計算組主任的第二天就決定在北京買房一樣,具有深謀遠略。
MSRA成為湯曉鷗與內地聯絡的起點,他在MSRA發現了何愷明、崔靖宇這樣的天才學生。2009年他從MSRA離開後,又加入了中國科學院深圳先進技術研究院(簡稱「深圳先進院」),運用先進院的龐大計算資源幫助MMLab在早期成為全球最早跑通深度學習的團隊。
2009年王曉剛回到港中文後,雖然加入的是電子工程系,但與湯曉鷗和MMLab的關係很密切,兩人在指導兩邊學生上找到了很好的配合模式:湯曉鷗負責找前沿的大方向,王曉剛負責帶學生執行,成果開始更加爆發,影響了更多 AI 青年。
這一時期的青年,有羅平、歐陽萬里、周博磊(現任教於UCLA)、趙叢(大疆首位AI掌舵人)、徐冰(商湯聯合創始人)等等博士生,還有趙德麗(阿里達摩院視覺帶頭人之一)等研究助理,人員規模大約有四十人。
說回深度學習。
湯曉鷗第一次聽說深度學習,也是因為MSRA:
2009年,當時在微軟雷德蒙工作的中國科學家鄧力與深度學習三巨頭之一的Geoffrey Hinton第一次將深度學習應用於大規模語音識別,只用了很短的時間就完成了微軟一個龐大團隊花幾個月做的事,在業內小範圍引起了轟動。
敏銳的湯曉鷗很快嗅到這個新方向的潛力:他心想,語音的訊號與視覺差不多,既然深度學習能在語音上取得驚人的效果,那深度學習也可能在視覺上取得驚人的效果。當即和王曉剛商量。
王曉剛在MIT讀博時研究計算機視覺的方法主要是機率圖模型,但也聽過神經網路,也很感興趣,堅定要研究神經網路。
徐東告訴雷峰網,事實上,2011年他去UIUC黃煦濤的組裡訪問時,也有人跟他說過神經網路。他聽到之後覺得很有意思,但因為當時在研究視覺域適應,方向不一樣,沒有精力再去關注這一塊。直到2012年AlexNet大火、他才開始用深度學習做影象處理。由此一對比,就更加佩服湯曉鷗和王曉剛早期的科研嗅覺。
對於這個當時很少人關注的方向,湯曉鷗和王曉剛選擇了兩位學生來探索,其他人繼續做原來的工作。這兩位被選中的學生分別是歐陽萬里和羅平。
歐陽萬里
歐陽萬里屬於電子資訊工程系,師從香港影片編解碼大牛湛偉權,王曉剛初任教職時與湛偉權共同指導一些學生,就認識了歐陽萬里。
羅平比歐陽萬里晚兩年(2011年)到港中文,此前在中山大學就讀,期間跟著朱松純(現北京大學人工智慧學院院長)在湖北蓮花山研究院做過很多計算機視覺方向的研究,讀博前就已經在ECCV等頂會上發過文章。
羅平告訴雷峰網,最開始他們研究計算機視覺是用玻爾茲曼機(深度學習的前身)。去到港中文後,湯曉鷗讓他研究人臉識別,他本來也是用玻爾茲曼機來做,但後來轉用深度學習,效果也很好,就果斷換了方向。
羅平
這當中,主要角色是王曉剛。湯曉鷗決定要研究深度學習後,王曉剛堅定推進,一直在關注歐陽萬里和羅平的研究進度,跟他們一起看國外的相關論文、把控方向等。
一般來說,在讀博士生與自己導師的交流不會很緊密,但羅平回憶,博士第一年,他幾乎每天都能看到王曉剛。王曉剛的辦公室在四樓,羅平的座位在七樓,王曉剛幾乎每天都上樓來跟他討論工作。
那時研究深度學習的條件是很差的。類似Caffe這樣的早期深度學習框架還沒出現,全球能跑通深度學習的團隊屈指可數,他們從零開始,是摸著石頭過河。
最開始,他們是用C++寫程式碼在CPU來跑。羅平回憶,他發表在CVPR上的第一篇深度學習文章是在個人膝上型電腦上完成的。
湯曉鷗在深圳先進院有任職,港中文團隊與內地學者深入合作,可以申請一些內地的專案,拿到經費後就買了很多CPU。當時他們根本沒有拿GPU來跑的意識,結果一個研究做了幾個月,都沒有獲得好的實驗結果,調一次引數、又是幾個月。
那時王曉剛還是一個處於長聘制(Tenure Track)考核的助理教授,其實是很有壓力的。但他們就是失敗了又繼續、失敗了又繼續,從來沒有過放棄的說法,所以在AlexNet火起來之前就積累了很多經驗。
比別人先行那麼一點點,就拉開了那麼大的差距。
據統計,2011年到2013年期間,港中文MMLab在ICCV和CVPR上一共發表了14篇基於深度學習的研究論文,佔了兩大頂會在全球範圍內接收的深度學習論文總量(29篇)的一半。
港中文學者在全球計算機視覺研究領域封神。
因為湯曉鷗、王曉剛這批人的存在,加上港中文有越來越多的名師與才子(如賈佳亞一脈),每次計算機學科分類排名,港中文或香港總是在「計算機視覺」一列排名前三,基本排名第一。
到了2014年,港中文在深度學習視覺上的研究已經突破了學術與科研的邊界,開始體現出落地與產業化的野心:3月的GaussianFace人臉識別演算法在LFW資料庫上準確率達到98.52% ,首次超過人眼識別率;6月的DeepID系列演算法將準確率提升至 99.55% ,突破落地的9字門檻。
資本的嗅覺很敏銳,IDG牛奎光立刻飛往香港拜訪了湯曉鷗,在MMLab看了十幾個實驗demo,很快投出了罕見的、高達數千萬美元的天使輪。中國視覺AI市場從此拉開帷幕:2014年10月,商湯成立。
先有勇氣,後有運氣
林達華是在2014年8月回到港中文。
他是繼王曉剛後第二位從MMLab走出、學成歸來後又回到MMLab任教的學生。在他之後,還有歐陽萬里、羅平、周博磊等人,他們都在MMLab呆過一段或長或短的時間,見證了MMLab一步步成為中國計算機視覺研究重鎮的過程。
林達華向雷峰網回憶,他是2013年決定回港中文的,那時他還不知道湯曉鷗要創業。
從MIT博士畢業後,林達華先是在美國的豐田研究院工作了一段時間,但他的內心還是想去高校,就想找湯曉鷗聊一下。
他告訴雷峰網,即使是離開港中文多年,他對湯曉鷗也還是一個非常信任的狀態,所以在元旦回國探親的時候就特地去香港找了湯曉鷗。
當時湯曉鷗就請林達華和王曉剛一起吃了個飯,談到香港與內地都有一些非常重要的機會,因為國家在人工智慧這塊有非常大的投入。除了宏觀的趨勢分析外,湯曉鷗還站在林達華的角度講了幾個非常實在的點,跟他說:做一個大學教師,最重要的是你的研究資源,要有學生、有研究經費,還有研究的自由度。
林達華當時到美國各個學校去筆試時也瞭解到,剛當教職的時候是非常艱難的。舉個例子,那時他在MIT讀博時的好朋友去美國高校任教,一年就要寫十幾個經費申請方案,幾乎每個月一個。
除了錢,還有建立生源。湯曉鷗是親身經歷過這個過程的,所以他說的每一個點都打在了林達華的思考上。這頓飯吃完,基本上他就做出了決定:回港中文。
回去時,MMLab剛好在緊鑼密鼓地籌備商湯的成立,他也機緣巧合地成為了創始團隊的一員。
多位接近湯曉鷗的人都告訴雷峰網,MMLab的今天能有此成就、乃至港中文能代表中國在全球計算機視覺領域叱吒風雲,離不開湯曉鷗對人才的重視。
2016年歐陽萬里找教職時,剛開始在香港找不到工作,因為香港高校有個傾向,就是不太願意招香港自己培養的博士生。
湯曉鷗就主動出馬,找悉尼大學電子與資訊工程學院的院長談能否多招一個老師。院長請湯曉鷗幫忙找一個公司一起出資,湯曉鷗就自己出了一半的工資、悉尼大學出另一半的工資,設了一個崗位,把歐陽萬里招了進去。
那幾年,歐陽萬里在悉尼大學的研究做得很不錯。
2015年徐東在悉尼大學任教時,想申請經費做一個新專案,但一直碰壁。2015年商湯剛成立,其實湯曉鷗的經濟也不算寬鬆,但還是給了徐東大約10萬澳幣(大約45萬人民幣)去開展研究。
徐東總結,其實湯曉鷗團隊在視覺研究這條路上一直是少數者:無論是人臉識別還是深度學習,他們都是從沒有什麼人關注這個方向的時候開始研究的,所以他們走得更快,也能走得更遠。
甚至是近日很火的生成式AI,他們也是很早就開始摸索並取得成果。羅平告訴雷峰網,2012年他就做過一個人臉生成的工作:把人臉側臉的影象直接恢復成正臉;2014年,他們在NIPS(後改名 NerulPS)上發表的工作也是人臉生成,網路可以輸入任意角度的人臉並輸出任意角度的人臉。有趣的是,號稱生成式AI鼻祖的GAN模型也是2014年釋出。
羅平回憶,那時MMLab與王曉剛EE系的學生一起開會,每個學生都要上臺用一句話總結自己想要做的工作,而湯曉鷗的要求是,這句話必須總結到位,只要別人聽這一句話,就能立刻判斷出這個課題是否有研究的價值,或者論文能否被接收。
湯曉鷗選題就兩個標準:一個是開闢一個新方向,另一個是結束一個方向。博士畢業後,羅平先後在MMLab和商湯都呆了一段時間,2019年回到香港大學追求科研後,指導學生和開展研究的要求也是如此。
更神奇的是,在湯曉鷗選擇一條冷清的道路時,有李學龍、王曉剛、陶大程、林達華、徐東、曹亮亮等等一批中科大校友與他共闖華山,隨後又遇到顏水成、許春景、喬宇、李振國、歐陽萬里、何愷明、周博磊、羅平等等同路人繼承出新。
他們走在了時代的前面,也得到了時代的饋贈:大多數從MMLab走出來的往日少年,都在四十歲左右的年紀就問冕了院士、ACM Fellow、IEEE Fellow、AAAI Fellow等等頂尖科研榮譽,擔任中國多個企業的視覺AI掌門人,成為AI騰飛的中流砥柱。
香港,這座曾經無數人神往的國際大都市或許已褪去昨日的風采,但一代青年與它的短暫交匯所成就的人生卻是永恆。
他們在充滿不確定性的關口走過,也繼續在不確定的探索中前進。
本文原發於2022.10.11。
- 1、天下第一銘,湯曉鷗,https://www.it610.com/article/1278144121713737728.htm
- 2、https://mmlab.ie.cuhk.edu.hk/
- 3、https://www.ustcif.org.cn/default.php/content/1977/
- 4、https://www.ustcif.org.cn/default.php/content/809/