大模型基本上消除了幻覺、超級應用還沒有出現、智慧體是AI應用的最主流形態即將迎來爆發點……在11月12日舉辦的世界2024大會,李彥宏對於AI的諸多最新研判出爐。
大模型基本消除幻覺
“過去24個月,AI行業的最大變化是什麼?是大模型基本消除了幻覺。”11月12日,李彥宏在百度世界2024大會上表示。
“幻覺”是AI大模型的專用語言,幻覺問題是大模型廣泛應用的最大限制之一。此前不少AIGC產品喜歡“一本正經的胡說八道”,導致AI輸出可信度不高。
截至11月初,百度文心大模型的日均呼叫量超15億,相較5月披露的2億,增長7.5倍,相較一年前首次披露的5000萬次,更是增長約30倍。李彥宏表示“這個增速超出預期”,說明AI是真需求。他感慨,這條陡峭的增長曲線,代表著過去兩年中國大模型應用的爆發。
在AI應用的發展趨勢上,李彥宏表示,智慧體是AI應用的最主流形態,即將迎來爆發點。他依次講解了公司、角色、工具和行業四大類智慧體,將做智慧體類比為PC時代做網站、或是移動時代做自媒體賬號,“不同之處是智慧體更像人、更智慧,更像你的銷售、客服和助理。智慧體可能會變成AI原生時代,內容、資訊和服務的新載體。”
釋出兩大AI技術
會上,百度釋出文心iRAG和無程式碼“秒噠”兩大AI技術。文心iRAG用於解決大模型在圖片生成上的幻覺問題,極大提升實用性;無程式碼技術“秒噠”讓每個人都擁有程式設計師的能力,將打造數百萬“超級有用”的應用。
解決文字生成幻覺問題背後的技術就是RAG,即檢索增強。目前,文字層面的RAG已經做得很好,基本讓大模型消除了幻覺;但在影象等多模態方面,和RAG的結合還不夠,這也是百度希望重點突破的方向。
目前,基於大語言模型的文生圖還有比較嚴重的幻覺,尤其是針對長城、東方明珠、金字塔、愛因斯坦、貝多芬等特定地點、物品和人物,常常會出現張冠李戴的幻覺問題,讓生成的圖片“一眼假”,影響了AI的實用性。
針對上述問題,百度開發了檢索增強的文生圖技術iRAG(image based RAG),將百度搜索的億級圖片資源跟強大的基礎模型能力相結合,可以生成各種超真實的圖片,“整體效果遠遠超過文生圖原生系統,去除了機器味兒”。
李彥宏現場展示了一幅由文心大模型生成的大眾攬巡汽車飛躍長城的圖片。透過文心iRAG技術,無論是這款特定型號汽車的車型車標、還是作為背景的長城,均未出現錯誤或變形的幻覺問題。同時展示的“愛因斯坦環遊世界”圖片中,愛因斯坦和各個背景景點的結合也與真實世界高度相似,質感接近照片。
消除大模型的幻覺,也是AI應用爆發的基礎。在李彥宏看來,今天,基礎大模型能力就緒,即將迎來AI應用的群星閃耀時刻。
此外,無程式碼工具“秒噠”是一款不需要寫程式碼就能實現任意想法的軟體,涵蓋無程式碼程式設計、多智慧體協作以及多工具呼叫等特點,只需說說話,就能構建出各種應用。它可以幫助更多人、更多企業打造出數百萬“超級有用”的應用。李彥宏總結說,這意味著每個人自己就能指揮多個智慧體來協同完成任務,“只要有想法,你就可以心想事成,我們將迎來一個前所未有的,只靠想法就能賺錢的時代。”
智慧體是下一個應用爆發點
“今天,全球所有頂尖科技公司都在關注智慧體,但像百度這樣把智慧體作為最重要戰略方向的公司並不多。”李彥宏表示,就像PC時代的網站、移動時代的自媒體賬號,在AI原生時代,智慧體將成為內容、服務和資訊的新載體。
他以公司類智慧體舉例,在傳統的PC官網模式下,企業只能靜態地展示公司介紹、產品引數,但缺失主動推薦、及時響應和一對一服務能力;而公司智慧體則可以根據顧客的需求推薦相應產品,在服務方面,也能更直接、快速地響應需求,能大幅地提升互動營銷的效率。比亞迪的官方智慧體上線後,銷售轉化率提升119%,聯想AIPC智慧體的9月互動率提升89%。
此外,李彥宏展示了角色、工具和行業等多類智慧體的特色功能及使用場景。例如百度文庫和百度網盤聯合打造的工具類智慧體“自由畫布”,讓使用者可以在一塊類似“畫布”的介面上自由拖拽文件、音影片等富媒體素材,迅速生成多模態內容。
“智慧體是AI應用的最主流形態,即將迎來它的爆發點。”在李彥宏看來,智慧體的門檻低、天花板高,既能讓人人都上手,又能做出複雜強大的應用。當天,他展示了文心智慧體平臺的TOP100智慧體,既有農民院士智慧體等角色類,也有工具、行業、職場、情感、娛樂等各類場景的智慧體。
責編:彭勃
校對:楊舒欣