DeepSeek的火爆,讓其創始人也走進大眾視野。
春節到來,梁文鋒的行蹤備受關注。記者從其初中班主任容老師獲悉,目前梁文鋒已回到吳川,還於1月27日下午與舊時同學好友一起踢足球。
另據南方都市報,DeepSeek的創始人梁文鋒是位80後,來自廣東湛江吳川。2002年,他以吳川市第一中學“高考狀元”的成績考上浙江大學電子資訊工程專業,畢業後在浙江大學攻讀研究生。在大學期間,梁文鋒就已積累市場行情資料和探索全自動量化交易。
梁文鋒的高中同學兼好友陳先生表示,讀書的時候,梁文鋒就經常做課題實驗,學習刻苦,也熱愛足球。大學時期,梁文鋒讀的AI工程專業前景並不明朗,但他很有前瞻的眼光。“完全是白手起家,創業以來還做過全自動繡花機等產品,不斷探索總結溯源。”
陳先生還表示,“梁文鋒的衣著打扮和為人處世都非常低調,淳樸有善心,此前以個人名義捐了很多錢。看到他火了很開心,前幾天我給他發資訊祝賀,他還說會回吳川過年,但今年要躲起來。”
深圳夢注意到,在校期間,梁文鋒對金融市場產生了濃厚的興趣,2008年全球金融危機之際,他帶領團隊探索機器學習技術在全自動量化交易中的應用潛力。
梁文鋒決定量化投資,但這個決定並不容易,畢竟當時量化還是個新事物,很多人不相信量化可以賺錢。
梁文鋒苦熬了2年,2010年,滬深300股指期貨推出,量化投資迎來了春天。據公開資訊顯示,梁文鋒團隊正是乘上這股東風,很快自營資金超過 5 億元。
這應該是他畢業後賺到的第一桶金,為他後來的創業打下了物質基礎。
(深圳夢注:由中證指數公司編制的滬深300指數於2005年4月8日正式釋出。滬深300指數以2004年12月31日為基日,基日點位1000點·滬深300指數是由上海和深圳證券市場中選取300只A股作為樣本,其中滬市有179只,深市121只樣本選擇標準為規模大,流動性好的股票。滬深300指數樣本覆蓋了滬深市場六成左右的市值,具有良好的市場代表性。
作為一種商品,滬深300股指期貨是以滬深300指數作為標的物的期貨品種,在2010年4月16日由中國金融期貨交易所推出。)
2015年,梁文峰與浙大校友共同創立幻方量化,立志打造中國的頂級量化對沖基金。他們將數學與人工智慧深度融合,開啟了量化投資的創新之旅。
2016年,幻方量化上線首筆AI驅動的實盤交易,隨後全面實現交易策略AI化。這一創新舉措使旗下基金回報率遠超同期滬深300指數,推動公司管理規模快速增長,2021年突破千億元大關,躋身國內量化私募“四大天王”行列。
隨著業務拓展,AI交易策略對算力的需求急劇增加。為解決這一難題,梁文峰展現出非凡的前瞻性和魄力,從2019年開始大規模佈局AI算力。當年投資2億元建成“螢火一號”AI算力叢集,搭載1100塊GPU算卡,在特斯拉提出Dojo超算概念時便已先人一步。英偉達A100晶片釋出後,他又迅速成為亞太地區首批獲取者。
2021年,投資10億元打造的“螢火二號”上線,搭載1萬張A100算卡,算力驚人,相當於76萬臺個人電腦,佔地面積超過10個籃球場。在當時AI大模型尚未爆發的情況下,如此大規模的算力投入被外界視為瘋狂之舉,但這恰恰體現了梁文峰對AI未來發展的堅定信念和長遠佈局。
2017年,谷歌提出Transformer架構,OpenAI基於此架構成功推出ChatGPT,引爆AI大模型時代。多數企業選擇跟隨OpenAI的步伐,而梁文峰帶領的團隊卻另闢蹊徑。
2023年,幻方量化成立子公司“深度求索”(DeepSeek),進軍通用人工智慧領域。儘管團隊規模僅有139人,遠不及OpenAI的1200人,但他們憑藉創新精神和紮實技術,在大模型研發上取得了驚人突破。
2024年5月釋出的DeepSeekV2,憑藉創新的MLA(多頭潛在注意力機制)和DeepSeekMoE(混合專家模型)架構,實現了高價效比的訓練和推理,API定價僅為GPT-4 Turbo的百分之一,引發行業價格戰,推動了算力普惠。2024年12月推出的DeepSeek-V3更是震撼全球,在多個基準測試中效能超越頂級開源模型,與GPT-4o等頂級閉源模型不相上下,而研發成本不到後者的二十分之一。這一成果不僅打破了中國AI企業依賴模仿的刻板印象,更以首創精神讓中國在全球AI競爭中佔據一席之地。
梁文鋒和他的DeepSeek還在繼續求索。
就在1月20日,DeepSeek正式釋出DeepSeek-R1模型。該模型在數學、程式碼、自然語言推理等任務上,效能比肩OpenAI o1正式版。DeepSeek稱,R1在後訓練階段大規模使用了強化學習技術,在僅有極少標註資料的情況下,極大提升了模型推理能力。DeepSeek不僅將R1訓練技術全部公開,還蒸餾了6個小模型開源給社群,允許使用者藉此訓練其他模型。
1月27日,據AI社群Hugging Face,DeepSeek釋出分別名為Janus-Pro和JanusFlow的一系列開源多模態AI模型。
DeepSeek的展示圖顯示,在文生圖GenEval和DPG-Bench基準測試中,Janus-Pro-7B的準確率較前代Janus大幅提高,準確率測試結果分別為80%和84.2%,高於包括OpenAI DALL-E 3在內的其他對比模型,Janus的準確率分別為61%和79.7%。
《華爾街日報》| DeepSeek梁文鋒:從數學天才到全球AI顛覆者
一位低調、技術至上的工程師正在改變世界。
作者:Gregory Zuckerman, Raffaele Huang
編譯:未來學人
來源:華爾街日報
有人稱他為中國的薩姆·奧爾特曼。
也有人稱他為中國量化投資的吉姆·西蒙斯。
梁文鋒與這兩位創新者有許多共同之處,而他的影響力也可能達到同樣的高度。
在梁文鋒的帶領下,DeepSeek的人工智慧模型震驚了世界,無論是效能還是受歡迎程度,都躍居全球前列。用低成本的晶片實現與OpenAI等公司花費巨大成本打造的旗艦模型同樣的效能,這著實讓矽谷技術高管、華盛頓政客和全球投資者大吃一驚。
與西蒙斯一樣,梁文鋒也是一位痴迷數學的“極客”,後來迷上了投資。他發現透過計算機分析海量市場資料,能夠發掘隱藏的模式,從而開闢盈利之路。他創立的對沖基金幻方量化(High-Flyer)現管理約80億美元資產,已成為中國最大的量化基金之一。
據同事透露,梁文鋒對財富和名利並不在意,但他曾說過,希望獲得美國主導的科技界的認可。
可以肯定地說,他的願望已經實現。
數學天才到量化投資
梁文鋒生於 1985 年,在湛江長大。湛江是中國南部沿海的港口城市,有著幾個世紀的世界貿易歷史。他在學校裡成績優異,初中時就開始自學微積分,後來考入著名的浙江大學。
學生時代的梁文鋒就開始編寫人工智慧演算法來選股。畢業幾年後,2013年,他創立了以德國數學家卡爾·雅可比命名的投資公司。2015年,他與兩位大學同學一起創辦了幻方量化。
幻方量化是中國最早將新型AI技術應用於投資的先驅,使計算機能夠處理市場價格之外的多種資料型別,並從中發現關鍵模式。
與追求毫秒級交易優勢的高頻交易員不同,梁文鋒和他的團隊採用中頻交易策略,持倉週期更長。
梁文鋒從西蒙斯那裡汲取靈感,這位數學家和量化金融先驅在20世紀80年代便開始運用機器學習技術,並創立了位於長島的對沖基金文藝復興科技。
梁文鋒為《解決市場的人:西蒙斯如何開創了量化革命》的中文版撰寫了序言,這本書記述了西蒙斯團隊的故事。“每當工作遇到困境,我就會想起西蒙斯的話:‘一定有辦法對價格進行建模’”,梁文鋒寫道。
據金融資料提供商Simu Paipaiwang統計,過去五年中,幻方量化旗下至少五隻基金的平均超額收益率超過20%。
然而發展過程並非一帆風順。2021年,幻方量化因業績不佳向投資者致歉,承認誤判了市場走向。去年又遭遇挫折,中國金融監管機構嚴厲打擊量化交易,認為這類交易助長羊群效應,加劇市場波動。
用量化交易模式開發AI模型
技術高管、前對沖基金經理理查德·迪威指出,DeepSeek的AI發展策略讓他聯想到量化交易模式,即用更少資源(更小的團隊、更少的資金、更少的晶片)實現更多目標。
“他們善於從有限資料中獲取大量訊號,這與量化交易的核心理念不謀而合,”迪威說。
據知情人士透露,和許多量化交易員一樣,梁文鋒更願意以工程師而非交易員的身份示人。DeepSeek對此未予置評。
熟悉幻方量化的人士將梁文鋒描述為一位親力親為的領導者,他致力於改進演算法,使其在選股和風險對沖方面更加智慧,有時為了趕專案甚至會睡在辦公室。他表示,對於渴望探索機器學習極限的工程師來說,將進軍AI模型是自然而然的事情。
2019年,梁文鋒的團隊開始使用英偉達的GPU構建計算系統。到2022年末OpenAI釋出ChatGPT時,中國只有少數幾家公司擁有超過一萬塊英偉達高階晶片,而幻方量化就是其中之一。
“這就像買鋼琴,”梁文鋒在2023年談到購買晶片說,“首先是因為你買得起,其次是因為你有一群渴望用它演奏音樂的人。”
梁文鋒最重要的決定之一是將程式碼開源,讓任何人都可以訪問。他表示,希望DeepSeek能打破大型科技公司的壟斷。
“對技術人員來說,看到他人追隨自己的工作會帶來極大的成就感,”他說,“開源更多是一種文化而非商業行為,為開源做出貢獻會讓我們贏得尊重。”
同事們說,梁文鋒是典型的中國工程師形象:不太在意穿著和髮型,做決定時會運用公式和計算,而且熱愛足球。
他們表示,梁文鋒一直保持低調,對DeepSeek一夜成名感到驚訝。
當大量使用者突然湧入使用DeepSeek的模型時,梁文鋒和公司措手不及,DeepSeek的服務經歷了多次崩潰。在與團隊一起解決需求問題後,他才開始春節的休假。
但他不會休息太久。同事們說,假期過後,梁文鋒將重返工作崗位,開發DeepSeek的下一代模型。
本文為翻譯作品,原文版權歸原作者所有。未來學人僅作編譯,文章觀點不代表深圳夢立場。
DeepSeek創始人梁文鋒回家廣東鄉踢球!
與粵西唯一狀元是同鄉
除夕
開啟蘋果中國區應用商店免費App排行
被稱作“來自東方的神秘力量”的
AI智慧助手DeepSeek穩穩佔據榜首
熱度持續攀升
圖源:央視新聞
DeepSeek的火爆,讓其創始人梁文鋒也走進大眾視野。這位來自湛江吳川的85後“科技奇才”出席國家超高規格座談會併發言,相關報道刷爆湛江人的朋友圈,不乏“家鄉驕傲”“天才”“湛江人的高光時刻”等讚揚。
春節到來,梁文鋒的行蹤備受關注。記者從其初中班主任容老師獲悉,目前梁文鋒已回到吳川,還於1月27日下午與舊時同學好友一起踢足球。
此外據據南方都市報報道,DeepSeek的創始人梁文鋒是位80後,來自廣東湛江吳川。2002年,他以吳川市第一中學“高考狀元”的成績考上浙江大學電子資訊工程專業,畢業後在浙江大學攻讀研究生。在大學期間,梁文鋒就已積累市場行情資料和探索全自動量化交易。
梁文鋒的高中同學兼好友陳先生表示,讀書的時候,梁文鋒就經常做課題實驗,學習刻苦,也熱愛足球。大學時期,梁文鋒讀的AI工程專業前景並不明朗,但他很有前瞻的眼光。“完全是白手起家,創業以來還做過全自動繡花機等產品,不斷探索總結溯源。”
陳先生還表示,“梁文鋒的衣著打扮和為人處世都非常低調,淳樸有善心,此前以個人名義捐了很多錢。看到他火了很開心,前幾天我給他發資訊祝賀,他還說會回吳川過年,但今年要躲起來。”
位於廣東省域副中心城市湛江的吳川被譽為“粵西唯一狀元故里”。這片富饒而充滿文化底蘊的土地,究竟蘊含著怎樣的獨特魅力,能夠持續孕育出一輩輩傑出人才?梁文鋒又是如何從家鄉出發,踏上國際科技大舞臺?
從出身吳川到轟動矽谷
在吳川一中九九屆初三(5)班畢業師生合照中,梁文鋒的身影赫然在列。
最後一排右邊第6個是梁文鋒。(圖源:湛江釋出)
記者從容老師處獲悉,梁文鋒是湛江市吳川市覃巴鎮米歷嶺村人,他成長於一個很普通的家庭,父母為人很淳樸,都是小學語文老師。
梁文鋒從小成績優異,小學就讀於吳川梅菉小學,小學六年級時透過考試被吳川一中錄用,在吳川一中完成了初中、高中學業,一直是學校裡的“尖子生”,並在數學學科表現出極大天賦。
“他初中就學完高中的數學,甚至已經開始學大學的數學,數學思維能力很強。”容老師表示,初中時期的梁文鋒性格很文靜,但不是書呆子,他在學習上很有自己的“一套方法”,很注重勞逸結合,彷彿不需要花很多時間來學習就可以學好每一個學科。
梁文鋒的高中同學兼好友陳先生接受南方都市報採訪時表示,讀書的時候,梁文鋒就經常做課題實驗,學習刻苦,也熱愛足球。
2023年,梁文鋒創立深度求索品牌DeepSeek。DeepSeek,全稱“杭州深度求索人工智慧基礎技術研究有限公司”。
2024年12月,梁文鋒和團隊開發的大模型“DeepSeek-V3”釋出。由於這款大模型太過好用,在AI發燒友圈子傳播後,傳到了海外社交平臺、技術論壇,這個由中國製造的大模型迅速轟動矽谷、震驚全球,被海外稱作“來自東方的神秘力量”。
“狀元故里”誕生的刻苦天才
2002年,17歲的梁文鋒以吳川一中“高考狀元”的成績考上浙江大學本科電子資訊工程專業,於2006年考上浙江大學資訊與通訊工程專業研究生。
“狀元”的榮譽,並非一蹴而就。
據曾在梅菉小學任教並擔任過樑文鋒班主任的李老師講述,梁文鋒在小學時期便展現出了極高的課堂專注力。他總是能夠全神貫注地傾聽講授,並積極地參與課堂討論,回答問題。
此外,梁文鋒對挑戰難題抱有濃厚興趣,善於總結學習方法,具有刻苦鑽研的精神,能迅速歸納老師的授課內容,形成自己的知識體系。
提到“狀元”,不少人都會聯想到梁文鋒的家鄉吳川。據統計,吳川歷史上出過1名狀元、20名進士、165名舉人,培育了一批批名人才俊、仁人志士。文化薈萃的吳川還獲“中國民間文化藝術之鄉”之美譽。
其中,林召棠是廣東九狀元之一、粵西唯一的狀元,生於1786年,字愛封,號芾南,嘉慶八年中秀才第一名,人稱“海濱秀才”。嘉慶廿一年,中舉人。道光三年,林召棠金榜題名,狀元及第,皇帝硃批“今科得一佳元”,授職翰林院修撰與國史館纂修官。
發展好狀元故里文化將推動文化事業和文化產業的繁榮發展,狀元故里文化中蘊含的精氣神也須在實踐中持續傳承發揚。
吳川擁有65公里的海岸線和粵西獨一無二的狀元故里文化,為打響“狀元牌”,吳川透過外塑“顏值”、內修“氣質”,打造好狀元故里文化,推動經濟社會高質量發展。
眼光前瞻白手起家
大學時期,梁文鋒讀的AI工程專業前景並不明朗,但他很有前瞻的眼光。
“完全是白手起家,創業以來他還做過全自動繡花機等產品,不斷探索總結溯源。”陳先生接受採訪時說。
深究梁文鋒身上的“拼搏勁”,離不開家鄉經商氛圍的薰陶。得益於三面環江、一面臨海的地理優勢,吳川是廣東著名的古商埠,其中梅菉更是粵西有名的古商埠之一。或許是血脈中流淌的基因,一直以來,吳川人善於經商。
經過數十年的摸爬滾打,如今的吳川已成為遠近聞名的“商人多”城市。這樣的變化,凝結著吳川企業家的智慧與精神。
愛國愛家、敢闖敢拼、守法守信、善創善成——新時代“吳商精神”進一步則宣傳和弘揚新時代“吳商精神”,擦亮“吳商”這張對外展示城市形象的閃亮名片,既是吳川企業家的精神品格,也是吳川城市精神的重要組成部分。
年味正濃,近日梁文鋒成為湛江熱議的焦點,為家鄉的同胞帶來了鼓舞。“我對科技也很有興趣!希望能學習梁文鋒哥哥的鑽研精神,堅持學習思考,創一番事業!”家住吳川振文鎮的陳雨明瞭解梁文鋒的事蹟後,興奮地說道。
作為我國首批14個沿海開放城市,開放創新早已成為湛江這座城市不可或缺的“基因”。
專案建設熱火朝天、客商遊人紛至沓來、生態環境不斷向好……湛江,這顆鑲嵌於南海之濱的璀璨明珠,在新時代的浪潮中奮勇向前,不斷釋放城市發展新活力,堅定扛起“全力建設省域副中心城市、加快打造現代化沿海經濟帶重要發展極”使命擔當,著力啟用改革、開放、創新“三大動力”。
未來將有更多“梁文鋒”
從這片熱土上誕生!
(來源:深圳夢綜合自湛江釋出、南方都市報)
來源:深圳夢(微訊號ID:SZeverything)綜合
我們的使命是:星辰大海,只與夢想者同行!
擁有深圳夢,請關注(微訊號ID:SZeverything)