時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁

中文AI牛逼,對英文AI構成降維打擊,原因無法反駁

2025-01-31 07:07:12

大語言模型背後的認知是這樣,人類的一部分思考,可以用語言的方式來體現。

最早期的大語言模型的概念,是把思考看做一種基於統計規律的序列變換,舉個簡單的例子,中國學生聽到 How are you?就會回答 Fine thank you。在計算機裡面管這個叫做對序列進行自動補齊,初代人工智慧就是這麼搞的。

GPT的突破在於意識到一段話裡面有一些“關鍵詞”比其他的更值得關注,也就是所謂“注意力模型”,它產生的效果給人的感覺是更能“抓住重點”,因此更“像”說人話。

在之後科學家又開始模擬“反思”,“推理”等思考過程。

到了比較近的時期,科學家們發現訓練所用的語言和訓練的結果有相當大的關係。比如你用貼吧上辯經的素材訓練,和用維基百科訓練,效果顯然是完全不同的。

一部分人開始意識到中國科研人員比美國科研人員有個幾乎是“與生俱來”的優勢,就是語言。

中國所有的科研人員的英語水平放在美國都是拔尖的,因為我們這邊也是用英語寫論文的,所以理解英語沒障礙。

就是說如果說英語在訓練AI上有什麼優勢,那麼兩邊是對等的,沒有區別的。

但美國的中文水平那是有目共睹的。你覺得在美國公司裡面開個會討論中文的特點能開起來嗎?

這就意味著,如果中文有什麼獨特的優勢,那就是中國特有的競爭優勢。

然後大家發現,中文不僅有優勢,還挺大。

中文的“字”是有含義的,可用於建立詞之間的天然聯絡

中英文都有“詞”的概念,但中文有“字”的概念,而英文的“詞”除了特定情況,一般來說無法拆解成仍然有含義的相當於‘字’的東西。

導致的後果就是,英文詞的關聯性未必能被AI把握。

舉幾個例子說明。

中文有一個字叫做“火”,用火的表達很多,比如火焰,野火,這人火了。

如果對應到英文,它們依次是 flame,wildfire,popular

讓計算機分析這些語料的時候,如果看的是中文,它有機會分析火焰、野火、這人火了幾個表達為什麼都出現同一個火字,理論上說,如果這個模型設計足夠好,計算機就能把握住“火”的具體含義和抽象含義,它的理解就更接近人類。

但是當計算機看到flame,wildfire,popular,它會認為這幾個概念完全沒關係。你說它有什麼理由認為幾個不搭噶的詞有關係?

用形式上不類似的字表達含義上相關的概念,也就是形式和內容不對應,這個坑我們的祖宗走過。

漢語也走過造字太多的彎路

今天英語還在朝這個坑裡面走,就是隨著概念的增加一味地造單詞,現在基本上每個專業方向的英文詞都是上萬甚至好幾萬的規模,設想哪天英文要是突破一百萬單詞了,他們自己咋學~

形式和內容不對應,在人工智慧時代就表現為AI無法透過形式上的相似性理解內容上的相關性,也就阻礙了AI認知語言的本質內在聯絡。

歷史悠久的好處在於老祖宗走了太多的彎路,讓我們可以透過學習歷史少走彎路。

現代漢語的發展方向是原則上不造字,用現有的字組合新的詞

其實中文不是“生下來”就是現在這樣子,我們也是幾千年無數的嘗試和失敗,最後演變成現代中文今天的樣子。

大冷天說個冷知識,其實中國遠古時期就設計過不止一套表音文字型系,最後都是種種原因被淘汰了。

很多人看英文體系現在發展的挺好,你要懂得,對於語言歷史這種動輒週期以‘千年’為單位計算的東西,英文體系還沒走完第一個週期,遠沒到可以下結論的時候。

英文體系確實克服了表音文字的挺多大坑,比如因為方言造成語言分化,取得的成就挺大,這咱都不否認,但是他們面前就有個詞彙量爆炸的坑等著,咱只能說,祝福他們好運。

中文演變成以幾千個常用字為基礎構造龐大數量的詞的這套表達體系,不是我們喜歡,而是別的方法在華夏漫長文明史中全都淘汰了。

所謂的人工智慧,就語言模型這部分而言,本質就是幫助計算機理解人類語言,那麼很顯然你用一套漫長曆史中最能經受考驗的語言最可能取得成功。

下一步中文的優勢會具體如何體現呢?

最近看到廣大人民群眾各種調教DeepSeek,這是個好的開端,未來中國人民會用各種非常有創意的中文表達來“餵養”中國的AI模型,相信以14億中國人民的創造力,一定能讓AI模型把這幾千個漢字整的明明白白的。

AI早期是PK算力,DeepSeek這一輪是PK模型的設計水平,但終極比拼的是人民群眾創造語料的數量和品質。

AI最終是一場人民戰爭

到了2024年,矽谷的大語言模型演進明顯有放緩的趨勢,他們總結的表面原因是基本上耗盡了網際網路的語料素材。為什麼我說這是表面原因呢?

因為深層次的原因是,英文缺乏“字”這一級別的構造,人民群眾難以靈活創造新概念,因而難以給AI餵養新的“精神食糧”。

美國的算力儲備是佔優勢的,美國也可以透過抄襲DeepSeek迅速拉齊設計水平,但英語表意能力的侷限是無法克服的,除非美國放棄英語全民學中文。

我相信看到這裡,很多噴子就已經躍躍欲試了,我提醒各位噴子,爾等在評論區貼的文字,也會成為餵養中文AI模型的食糧,爾等越努力,就越有機會證明作者的正確。

如果這段話把爾等的CPU乾燒了,那爾等就滾蛋吧,你們連當噴子的料都不夠。

對於認可作者的同志們,作者要提醒各位,推動中國AI模型,不只是靠科學家,也是靠你們。

算力和模型只是決定了這個AI“胃口好”,但精神食糧是靠億萬網民創造的。大家多說一些構思巧妙的話,就會提升中國AI模型的思維能力。

世界是你們的,也是我們的,但是歸根結底是你們的。

歷史是人民群眾創造的,要證明中文是智慧時代最好的語言,就用一起創造高質量語料的方式,協助科學家們打贏AI戰爭。

證明自己正確最有效的方式不是辯論,而是消滅對手。

掛牆上的對手,才是最好的對手。

(完)

熱門資訊
  • 2024醫院網際網路口碑排行榜釋出!來自9000萬人的看病經驗 | 2024-11-28 14:54:07
  • 兩年6次冠脈造影開通堵塞的右冠狀動脈,值不值? | 2024-11-28 14:54:08
  • 考試成績不理想,如何緩解焦慮 | 2024-11-28 15:33:49
  • 耗時八年的抗癌新藥終止研發,中藥企業轉型之路機遇與挑戰並存 | 2024-11-28 15:41:25
  • 河南省兒童醫院口呼吸聯合門診開診,掛一次號接受兩個科室診療 | 2024-11-28 15:52:23
  • 臨床藥師如何成功申請國自然?秘訣看這裡! | 2024-11-28 16:06:05
  • 提升臨床科研能力,湖南省人民醫院開啟“加速度” | 2024-11-28 16:06:06
  • 團結協作挽狂瀾 救死扶傷顯擔當——北京世紀壇醫院消化內科ERCP團隊成功搶救高齡重症患者 | 2024-11-28 16:10:55
  • 挑戰與展望:非小細胞肺癌治療方式與進展 | 2024-11-28 16:10:57
  • 男子心衰入院,半夜胡言亂語,差點被誤診 | 2024-11-28 16:10:59
  • 別不信!用了這個藥物寶典,工作效率翻倍!文末獎勵待領取 | 2024-11-28 16:11:00
  • 中日醫院實現出入院自助,手術等待時間縮短至1周 | 2024-11-28 16:16:53
  • “它”,是癌症“新剋星”?如何降低復發轉移率? | 2024-11-28 16:37:52
  • 【動態】首兒所新生兒外科一次微創手術根治雙側隔離肺 | 2024-11-28 16:45:18
  • 國家醫保局:醫療機構不得以任何理由影響醫保藥品入院 | 2024-11-28 16:45:21
  • 不要忽視這種維生素,足量攝入能預防“老年痴呆”! | 2024-11-28 17:01:01
  • 圖集|2024醫保目錄談判結果公佈!直擊國家醫保局釋出會現場 | 2024-11-28 17:20:39
  • 2024年醫保談判:創新藥談判成功數量和比率均創歷年新高 | 2024-11-28 17:20:40
  • AL型澱粉樣變性患者普遍診斷延遲,要關注早期診斷和MBT治療 | 2024-11-28 17:20:42
  • “支援真創新,真支援創新”,醫保創新藥10個月銷量新增6倍 | 2024-11-28 17:20:43
  • 從無法治癒到慢病化,多發性骨髓瘤做好全生命週期管理 | 2024-11-28 17:20:44
  • 國家醫保局答人民日報健康客戶端:每次目錄調整都會進行科學測算 | 2024-11-28 17:27:10
  • 得了癌症,不能吃鴿子肉?提醒:5種“發物”確實要少吃 | 2024-11-28 17:39:22
  • 第十六屆健康中國論壇·腫瘤全生命週期管理主題單元舉辦 | 2024-11-28 17:39:24
  • 為了參與一項臨床試驗,這位波蘭患者願舉家遷居中國 | 2024-11-28 17:39:25
  • 強調全鏈條可追溯!國家藥監局公開徵求中藥生產監管意見 | 2024-11-28 17:39:27
  • 生存率實現突破!精準化治療讓部分肺癌亞型變為慢性病 | 2024-11-28 17:39:28
  • 孕媽媽不敢做胃鏡,專家用一杯“米糊”解決兩難 | 2024-11-28 17:39:29
  • 奧亞故事丨紙短情長,筆尖下的暖流,繪就冬日裡的溫情畫卷【合肥】 | 2024-11-28 18:52:29
  • 跨學科合作助力糖尿病心腎共管:心腎代謝綜合徵的全面干預 | 2024-11-28 20:11:47
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們