時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

阿里挖來AI大牛許主洪,接下來目標明確:要靠多模態打通AI應用了

2025-02-09 15:55:36

作者 | summer郵箱 | [email protected]

隨著AI競爭加劇,消費市場成為各大科技公司的必爭之地。在文心一言、豆包、Kimi等產品瘋狂爭奪C端使用者的當下,如何開啟AI消費市場,成為阿里巴巴的緊迫課題。

2月6日,多家媒體訊息稱,人工智慧科學家教授(Steven Hoi)正式加入阿里巴巴,將出任集團副總裁。據內部人士透露,許主洪教授將專注於AI To C業務的多模態基礎模型及Agents相關基礎研究與應用解決方案,提升阿里巴巴AI應用C端產品在模型結合應用上的端到端閉環能力。

稍後,許主洪在X上確認了這一訊息,並提到“未來十年,為消費市場開發基礎模型和 AI Agents應用存在大量機會!”

這位技術大牛的加入,意味著阿里在AI To C的又一嘗試。

自去年底阿里巴巴“少壯派”吳嘉執掌智慧資訊事業群以來,阿里的AI C端產品開始加速整合:先是將通義系列C端產品從剝離,隨後又整合了天貓精靈所屬的智慧互聯事業群;在產品層面,阿里選擇了使用者量已達2億的夸克作為主攻方向,將其重新定位為"AI全能助手",並開始與天貓精靈展開聯動。據悉,雙方正在籌備包括AI眼鏡在內的AI新產品。

如今技術人才的引入只是一個開始,進入2025年,阿里AI急需一場面向消費市場的反擊。

1

從Salesforce到阿里,專注多模態預訓練

作為一位深耕AI領域20餘年的研究者,許主洪的學術履歷頗為豐富。2002年獲清華大學計算機系學士學位後,他在香港中文大學完成了碩士和博士學位。在學術界,他於2019年當選IEEE Fellow(電氣和電子工程師協會會士),入選斯坦福"全球前1%AI科學家"榜單。

許主洪的研究領域覆蓋機器學習基礎理論及多個應用方向,包括多媒體資訊檢索、計算機視覺、大資料分析等。其中,他在多模態預訓練方面的工作獲得了最多關注,特別是BLIP模型系列的研究成果,釋出在了多個開源社群。

BLIP系列有多篇論文,研究聚焦於視覺-語言多模態預訓練(Vision-Language Pre-training, VLP),旨在透過統一模型架構和高效資料增強策略,實現視覺語言理解與生成任務的協同最佳化,可以應用於影象-文字檢索、影象標題生成、視覺問答、視覺推理和視覺對話等多種任務。

在Github社群,BLIP獲得了5000顆星,而BLIP2則是直接點爆了當年的圖文模型圈,獲得業界高度評價,並被認為是多模態啟發性工作,對開源社群做出了顯著貢獻。此外,據許主洪在X稱,BLIP-2還被排名為the 5 top AI Research paper of 2023,僅次於GPT-4。

《BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models》也是許主洪參與的引用量最高的工作,具體來看,透過創新的"凍結模型+輕量橋接"策略,以Q-Former架構對齊了影象和文字,在保持高效能的同時大幅降低了計算成本。

這些研究大多完成於他在Salesforce期間。在Salesforce,許主洪參與了多個AI研究專案,並嘗試將研究成果轉化為應用產品。

在離開Salesforce,加入阿里巴巴之前,許主洪還有一段創業經歷,於2023年創立了一家多模態生成式AI初創公司HyperGAI並擔任CEO,釋出了三款開源多模態大模型。其中,開源多模態模型Hyper-Pretrained Transformers (HPT) 1.5 Edge 能夠實現文字和視覺輸入的多模態理解,專為邊緣和移動裝置量身定製,引數小於 5B。

不過,在競爭激烈的AI創業市場中,HyperGAI的產品未能獲得市場反響,其開源模型在Huggingface平臺上少有人關注。

從總體來看,多模態研究和橫跨學術、產業、創業,是許主洪兩個關鍵詞。

1

重組、融合、創新,阿里AI to C需要新牌

在多模態AI成為技術競爭焦點的當下,我們不難理解:在發力To C的關鍵時刻,阿里恰好需要這樣一位既能突破演算法邊界、又能推動產品創新的科學家。

在過去一段時間裡,阿里AI To C產品中,除夸克以外,其他AI產品包括通義APP本身在C端的表現並不突出。也正是因此,目前的阿里正在透過整合通義、夸克等產品力量,配以頂尖人才加持,打造一個更具競爭力的AI To C新生態。

首先是在模型與應用的關係上,阿里經過一年多的探索後逐漸明確了"分而治之"的策略,讓基礎模型研發和消費級應用各自獨立發展,以適應不同的創新節奏。

2024年底,阿里將原屬阿里雲的“通義”應用剝離出來,併入智慧資訊事業群由吳嘉統管,而此前通義千問更多是整體打包的思路,模型和應用捆綁發展。但在實踐中發現,大模型研發和消費級應用分屬不同賽道,各自面臨的挑戰和節奏都不盡相同,為雙方鬆綁後通義千問團隊可以專注技術突破,而C端產品團隊則能更靈活地進行調整。

此後更多的AI to C整合開始了。特別是天貓精靈所屬的智慧互聯事業群併入之後,加上原有的夸克、書旗小說、UC瀏覽器等業務,一條從搜尋到內容,從文字到語音互動,從軟體到硬體的創新鏈條正在形成。在這條鏈條上,多模態技術成為連線各個場景的關鍵。

許主洪的加入,也恰好印證了阿里的這一技術佈局。作為BLIP系列的參與者,他在多模態預訓練和效率最佳化方面的積累正是阿里所需要的。從夸克的圖文理解到天貓精靈的視覺互動,再到未來可能推出的AI眼鏡,多模態互動將成為阿里AI產品的標配。

不過,在AI消費市場,先進技術只是起點,過去一年的市場競爭已經證明,真正的難點在於找準使用者和場景。

對All in AI的阿里巴巴而言,這既是機遇也是挑戰。一方面,阿里擁有龐大的使用者基礎、豐富的應用場景和強大的技術儲備;但另一方面,在To C戰場上,無論是百度的文心一言、百度文庫,還是位元組的豆包,都已形成了一定的使用者心智。

現在的阿里不僅需要新鮮血液,也需要一場勝仗,透過AI重新定義自己在消費網際網路時代的核心競爭力。

點個“愛心”,再走 吧

熱門資訊
  • 比98吋不止大2吋 百吋電視為什麼能霸榜大屏市場? | 2025-02-02 02:52:38
  • Mol Cell | 楊文/徐穎潔揭示TCAIM特異性調控OGDH並影響線粒體代謝的機制 | 2025-02-02 04:48:57
  • NASA及其合作伙伴批准了公理4號任務機組名單 | 2025-02-02 05:17:41
  • ASML將發貨最新EUV光刻機 支援後2nm工藝時代! | 2025-02-02 05:17:45
  • 突破70多年來的傳統認知 他們發現距地球16萬公里的“太空合聲” | 2025-02-02 05:38:01
  • 中國又一重磅技術突破,美國看完氣暈了,這還讓我怎麼追? | 2025-02-02 05:48:27
  • 傳NVIDIA GeForce RTX 5060和RTX 5060 Ti將於今年3月釋出 | 2025-02-02 05:58:28
  • Meta首席科學家楊立昆痛批矽谷“常見病”:一種錯誤的優越感 | 2025-02-02 06:08:06
  • 美國三大巨頭宣佈接入DeepSeek!NASA卻下禁令 | 2025-02-02 06:35:03
  • 我問#中國電信如何保持領先#,Deepseek這麼回答—— | 2025-02-02 06:42:30
  • 斯諾登就 GeForce RTX 50 的定價和價值怒斥英偉達 | 2025-02-02 06:59:08
  • NAR | 高珊團隊揭示了6mA甲基化酶AMT1的自調控和轉錄調控機制 | 2025-02-02 08:09:46
  • 賣掉北京2套房,4小時拍板落戶江陰!這個中科院女博士回鄉幹出了全球第一 | 假期閱讀 | 2025-02-02 08:09:48
  • 東南大學李全院士團隊Angew: 基於機械基團誘導自由基聚合的力可訓練型液晶彈性體 | 2025-02-02 08:43:14
  • 上海科技大學劉巍AFM:纖維增強超薄固體聚合物電解質實現高能量密度固態鋰金屬電池 | 2025-02-02 09:04:39
  • 小米交付超2萬輛,小鵬再破3萬輛超越理想 | 2025-02-02 09:14:22
  • LeCun痛批矽谷傲慢病!圈內爆火長文 | 2025-02-02 09:17:28
  • 雷諾抬價,日產本田合併生變 | 2025-02-02 09:17:30
  • “木頭姐”談DeepSeek啟示:在AI領域成功不用那麼燒錢 | 2025-02-02 09:17:36
  • 全球首次!沃達豐使用普通智慧手機完成衛星視訊通話,理論上支援任何4G/5G手機【附衛星網際網路行業發展現狀】 | 2025-02-02 09:23:30
  • 羅技將釋出微型雷達感測器Spot 可讓管理員看到房間是否有人 | 2025-02-02 09:38:13
  • 為什麼民科根本沒有資格研究“統一場論”? | 2025-02-02 10:19:12
  • 2025年度國家自然科學基金形式審查明細表(PDF下載) | 2025-02-02 10:19:13
  • 天宮“智慧大腦”揭秘:有效載荷運控中心 | 2025-02-02 10:49:43
  • 英偉達 RTX 5060 Ti 和 RTX 5060 顯示卡被曝 3 月釋出 | 2025-02-02 11:00:32
  • 神舟十九號在軌超3月!女航天員王浩澤還能出艙嗎?神二十待命中 | 2025-02-02 11:08:34
  • 南京大學陸延青教授/孔德聖教授AFM:基於液態金屬/離子導體複合透明電極的高效能可拉伸電致發光畫素顯示屏 | 2025-02-02 11:47:05
  • 最新論文顯示,在臨床醫學決策中,ChatGPT-o1略勝一籌,但DeepSeek-R1更靈活可用 | 2025-02-02 11:47:07
  • 訊息稱 AMD 將在 3 月推出銳龍 9 9000X3D 處理器和 RX 9070 顯示卡 | 2025-02-02 11:52:36
  • 車鑰匙尺寸超小滑鼠:日企推出 CapacMouse Pro,僅重 30g | 2025-02-02 12:26:07
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們