時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁

中文AI牛逼,對英文AI構成降維打擊,原因無法反駁

2025-01-31 07:07:12

大語言模型背後的認知是這樣,人類的一部分思考,可以用語言的方式來體現。

最早期的大語言模型的概念,是把思考看做一種基於統計規律的序列變換,舉個簡單的例子,中國學生聽到 How are you?就會回答 Fine thank you。在計算機裡面管這個叫做對序列進行自動補齊,初代人工智慧就是這麼搞的。

GPT的突破在於意識到一段話裡面有一些“關鍵詞”比其他的更值得關注,也就是所謂“注意力模型”,它產生的效果給人的感覺是更能“抓住重點”,因此更“像”說人話。

在之後科學家又開始模擬“反思”,“推理”等思考過程。

到了比較近的時期,科學家們發現訓練所用的語言和訓練的結果有相當大的關係。比如你用貼吧上辯經的素材訓練,和用維基百科訓練,效果顯然是完全不同的。

一部分人開始意識到中國科研人員比美國科研人員有個幾乎是“與生俱來”的優勢,就是語言。

中國所有的科研人員的英語水平放在美國都是拔尖的,因為我們這邊也是用英語寫論文的,所以理解英語沒障礙。

就是說如果說英語在訓練AI上有什麼優勢,那麼兩邊是對等的,沒有區別的。

但美國的中文水平那是有目共睹的。你覺得在美國公司裡面開個會討論中文的特點能開起來嗎?

這就意味著,如果中文有什麼獨特的優勢,那就是中國特有的競爭優勢。

然後大家發現,中文不僅有優勢,還挺大。

中文的“字”是有含義的,可用於建立詞之間的天然聯絡

中英文都有“詞”的概念,但中文有“字”的概念,而英文的“詞”除了特定情況,一般來說無法拆解成仍然有含義的相當於‘字’的東西。

導致的後果就是,英文詞的關聯性未必能被AI把握。

舉幾個例子說明。

中文有一個字叫做“火”,用火的表達很多,比如火焰,野火,這人火了。

如果對應到英文,它們依次是 flame,wildfire,popular

讓計算機分析這些語料的時候,如果看的是中文,它有機會分析火焰、野火、這人火了幾個表達為什麼都出現同一個火字,理論上說,如果這個模型設計足夠好,計算機就能把握住“火”的具體含義和抽象含義,它的理解就更接近人類。

但是當計算機看到flame,wildfire,popular,它會認為這幾個概念完全沒關係。你說它有什麼理由認為幾個不搭噶的詞有關係?

用形式上不類似的字表達含義上相關的概念,也就是形式和內容不對應,這個坑我們的祖宗走過。

漢語也走過造字太多的彎路

今天英語還在朝這個坑裡面走,就是隨著概念的增加一味地造單詞,現在基本上每個專業方向的英文詞都是上萬甚至好幾萬的規模,設想哪天英文要是突破一百萬單詞了,他們自己咋學~

形式和內容不對應,在人工智慧時代就表現為AI無法透過形式上的相似性理解內容上的相關性,也就阻礙了AI認知語言的本質內在聯絡。

歷史悠久的好處在於老祖宗走了太多的彎路,讓我們可以透過學習歷史少走彎路。

現代漢語的發展方向是原則上不造字,用現有的字組合新的詞

其實中文不是“生下來”就是現在這樣子,我們也是幾千年無數的嘗試和失敗,最後演變成現代中文今天的樣子。

大冷天說個冷知識,其實中國遠古時期就設計過不止一套表音文字型系,最後都是種種原因被淘汰了。

很多人看英文體系現在發展的挺好,你要懂得,對於語言歷史這種動輒週期以‘千年’為單位計算的東西,英文體系還沒走完第一個週期,遠沒到可以下結論的時候。

英文體系確實克服了表音文字的挺多大坑,比如因為方言造成語言分化,取得的成就挺大,這咱都不否認,但是他們面前就有個詞彙量爆炸的坑等著,咱只能說,祝福他們好運。

中文演變成以幾千個常用字為基礎構造龐大數量的詞的這套表達體系,不是我們喜歡,而是別的方法在華夏漫長文明史中全都淘汰了。

所謂的人工智慧,就語言模型這部分而言,本質就是幫助計算機理解人類語言,那麼很顯然你用一套漫長曆史中最能經受考驗的語言最可能取得成功。

下一步中文的優勢會具體如何體現呢?

最近看到廣大人民群眾各種調教DeepSeek,這是個好的開端,未來中國人民會用各種非常有創意的中文表達來“餵養”中國的AI模型,相信以14億中國人民的創造力,一定能讓AI模型把這幾千個漢字整的明明白白的。

AI早期是PK算力,DeepSeek這一輪是PK模型的設計水平,但終極比拼的是人民群眾創造語料的數量和品質。

AI最終是一場人民戰爭

到了2024年,矽谷的大語言模型演進明顯有放緩的趨勢,他們總結的表面原因是基本上耗盡了網際網路的語料素材。為什麼我說這是表面原因呢?

因為深層次的原因是,英文缺乏“字”這一級別的構造,人民群眾難以靈活創造新概念,因而難以給AI餵養新的“精神食糧”。

美國的算力儲備是佔優勢的,美國也可以透過抄襲DeepSeek迅速拉齊設計水平,但英語表意能力的侷限是無法克服的,除非美國放棄英語全民學中文。

我相信看到這裡,很多噴子就已經躍躍欲試了,我提醒各位噴子,爾等在評論區貼的文字,也會成為餵養中文AI模型的食糧,爾等越努力,就越有機會證明作者的正確。

如果這段話把爾等的CPU乾燒了,那爾等就滾蛋吧,你們連當噴子的料都不夠。

對於認可作者的同志們,作者要提醒各位,推動中國AI模型,不只是靠科學家,也是靠你們。

算力和模型只是決定了這個AI“胃口好”,但精神食糧是靠億萬網民創造的。大家多說一些構思巧妙的話,就會提升中國AI模型的思維能力。

世界是你們的,也是我們的,但是歸根結底是你們的。

歷史是人民群眾創造的,要證明中文是智慧時代最好的語言,就用一起創造高質量語料的方式,協助科學家們打贏AI戰爭。

證明自己正確最有效的方式不是辯論,而是消滅對手。

掛牆上的對手,才是最好的對手。

(完)

熱門資訊
  • 催眠的本質,是“喚醒”(9元0基礎入門催眠) | 2024-12-14 12:16:19
  • “虹膜寫真”火了,醫生:眼病患者不建議拍攝 | 2024-12-14 12:18:35
  • 在廢棄的書頁中,尋找血吸蟲病防治專家的一生 | 2024-12-14 12:18:45
  • 24省份已將職工醫保家庭共濟範圍擴大至“近親屬” | 2024-12-14 12:23:30
  • 花椒貼肚臍能養生?專家:適合體質偏寒的人 | 2024-12-14 12:24:22
  • 黃芪泡水喝,有點浪費了,如果和這三類藥材搭配,藥效或會更充分 | 2024-12-14 13:01:26
  • 息肉反覆發作?不想總被“割”,中醫防治息肉復發有方法 | 2024-12-14 13:01:27
  • 剛果(金)出現不明疾病已致近百人死亡,呼吸道感染性疾病可能性大 | 2024-12-14 13:03:36
  • 老年人家中應配備適老設施,近4成跌倒發生在家中 | 2024-12-14 13:04:15
  • 學術書架|《醫美審美實用原則圖鑑》出版 | 2024-12-14 13:04:25
  • 腦梗容易在這個時間段發作!冬季做好8點降低腦梗風險! | 2024-12-14 13:08:52
  • 腦溢血很可怕,瞭解腦溢血的8個前兆訊號,早知道或許可保命 | 2024-12-14 13:13:01
  • 這1個羞恥但健康的動作,每個女生都該偷偷練 | 2024-12-14 13:37:59
  • 晚安酒竟是睡眠的“隱形殺手”?你真的喝對了嗎! | 2024-12-14 13:53:20
  • 幾乎所有腳麻的病因,都在這裡了 | 2024-12-14 14:26:19
  • 男人老不老,低頭看下半身,如果沒有4個衰老訊號,恭喜你! | 2024-12-14 14:32:04
  • 日本女星中山美惠浴缸中死亡,死因並非熱休克 | 2024-12-14 14:32:09
  • 空心菜是“萬毒之王”,重金屬超標?真相來了,趕緊來看看 | 2024-12-14 14:34:59
  • 焦雅輝:最佳化護士編制管理,加強薪酬待遇保障 | 2024-12-14 14:42:11
  • 急性呼吸道傳染病持續上升,0至14歲人群發病病例有所增加 | 2024-12-14 14:42:44
  • 這種藥食同源常見藥被譽為“金不換”,尤其適合這幾類人群! | 2024-12-14 14:43:41
  • 怎麼判斷你患的是痔瘡還是息肉?醫生是這樣說的,趕緊來看看 | 2024-12-14 14:53:42
  • 常吃核桃有哪些好處?核桃真的是血管的“清道夫”嗎? | 2024-12-14 14:53:43
  • 漫改真人版《工作細胞》來了!帶孩子一起看這書,真過癮! | 2024-12-14 14:57:14
  • 得了腎病後,你如何看待人生?聽聽病友們的看法 | 2024-12-14 15:13:55
  • 吃普利/沙坦後,尿蛋白降了,但血肌酐也漲了,到底是好是壞? | 2024-12-14 15:13:56
  • 本週醫藥健康領域9起投融資,4起融資超億元 | 2024-12-14 16:06:32
  • “我們的初心,本就是救死扶傷”,00後醫生決定捐髓救人 | 2024-12-14 16:06:34
  • 中疾控:流感病毒陽性率上升趨勢明顯 | 2024-12-14 16:06:35
  • 在芬芳中重拾記憶,這家醫院用芳香療法改善老人認知障礙 | 2024-12-14 16:06:37
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們