如今科技圈最火熱的話題,莫過於生成式 AI。它的出現以及普及,正在逐漸改變我們工作、生活以及娛樂的方式。這一點,IT之家也有深刻的體會,比如過去小編撰寫稿件需要配圖,在網上檢索圖片是一件很頭疼的事,要考慮版權、清晰度、內容契合度等,經常找一張滿意的圖就要花好久。
但是,在有了可以文生圖的生成式 AI 大模型後,一切就簡單多了,只需要輸入一段文字,就能很快得到一張比較滿意的圖片,工作效率提升了太多。
這不禁讓小編感嘆,AIGC,真的會是顛覆我們生產力的超強神器。如此強大的技術,必須和我們常用的生產工具深度融合,這樣才能讓它的價值充分釋放。而說到生產工具,現階段最重要的自然還是 PC。
也就是說,PC,應該成為 AIGC 釋放生產力變革能量的主要戰場。
好訊息是,作為半導體和 PC 行業引領者的,已經在積極將生成式 AI 落地到 PC 終端上,並取得了非常突出的進展。
通常談到 AIGC,談到大語言模型,大家可能首先想到各種大型專業 GPU。那是因為很多 AIGC 大模型服務是部署在雲端的,需要大型 GPU 提供超大的算力。即便是這樣,在高峰服務時段,還是會出現生成緩慢甚至失敗的情況,所以相信很多同學都有這樣的需求:能不能讓 AIGC 大模型在 PC 本地執行,甚至在我們日常外出辦公常用的輕薄本上執行?
英特爾的回答是 YSE。
目前,以第 12 代、第 13 代英特爾酷睿處理器和英特爾銳炫 A 系列顯示卡為代表的英特爾多款客戶端晶片均能提供強勁效能,以滿足生成式 AI 對於高算力的需求。而在軟體層面,英特爾則透過軟體生態的構建和模型最佳化,進一步推動新興的生成式 AI 場景在個人電腦的落地,廣泛覆蓋輕薄本、全能本、遊戲本等。
比如針對通用的大語言模型,英特爾透過第 13 代英特爾酷睿處理器 XPU 的加速、low-bit 量化以及其它軟體層面的最佳化,讓最高達 160 億引數的大語言模型,透過 BigDL-LLM 框架執行在 16GB 及以上記憶體容量的個人電腦上。
這裡,IT之家用實際測試讓大家感受一下大語言模型在英特爾輕薄本上執行的效果。小編選擇了一臺透過英特爾 Evo 平臺認證的輕薄本:華碩破曉 Air,這款輕薄本搭載英特爾 13 代酷睿 i7-1355U 處理器,16GB LPDDR5 記憶體。
接著小編在華碩破曉 Air 上裝好英特爾推出的大語言模型 Demo。這個 Demo 集成了三個大語言模型,包括 ChatGLM2、LLaMA2 和 StarCoder。它們均透過英特爾的語料庫進行了最佳化,主要的最佳化方式是對這些大語言模型進行量化操作,以減輕他們對本地硬體資源的需求。
測試時,小編將筆記本的網路斷開,就在本地執行。
首先在聊天助手功能下問一個比較常見的人情問題,比如“朋友向我借一萬塊錢,但是我最近手頭也比較緊,如何婉言拒絕?”這款大模型很快給出了回答,first latency 為 1490.1.ms,實際等待的時間大約只有三五秒。再看回答的內容,除了第二個建議有點問題,整體還是比較得體的。
接著小編又考驗了一下它的文案創作能力,切換到“故事創作”模式,然後問“公司的迎新晚會需要我做主持人,請幫我寫一段 500 字左右的開場白。”它果然也很快就把開場白寫了出來,而且文案讀起來也很順口、適當。如果是自己思考、編輯,得花很久,在 PC 上使用 AI 大模型,分分鐘就搞定了。
在英特爾大語言模型寫文案的時候,小編看了一下華碩破曉 Air 效能資源的排程情況,英特爾 13 代酷睿 i7-1355U 處理器佔用率達到了 100%,記憶體佔用達到了 9.6GB(62%),Xe 核顯佔用也達到了 12%。看來這個運算過程確實是在本地進行的。在英特爾不斷的最佳化和 13 代酷睿處理器算力的提升下,確實能夠在輕薄本上實現 AIGC 的落地。
下面小編又結合很多打工人經常遇到的場景做了測試,就是給活動或者專案寫大綱。比如公司需要在中山公園舉辦一場小型產品溝通會,經費為 15000 元,需要邀請 50 名使用者到場,包括產品體驗、交流互動等環節,讓大模型幫忙出一份流程大綱。
對於這個非常實際的問題,大語言模型 Demo 也給出了一份較為詳細的大綱,小編看了一下,具體可行性也還不錯,根據實際情況改一改,就可以使用了。要知道,這個過程都是在華碩破曉 Air 這款輕薄本端側本地執行的,不受聯網條件的限制,隨時隨地都能用,而且也比網上搜各種模板高效多了,就好像是 PC 天然就具備的功能一樣,這就是生產力實實在在的提升。
除了這種通用的大語言模型,就像小編開頭所說的,日常工作中我們還經常有作圖的需求,對於一些文生圖模型,這款華碩破曉 Air 也能輕鬆執行。
比如廣為人知的開源影象生成模型 Stable Diffusion,英特爾就啟用了 OpenVINO 的加速,他們開發了一套 AI 框架,透過一行程式碼的安裝,就可以加速 PyTorch 模型的執行。透過 Stable Diffusion 的 WebUI,可以在銳炬整合顯示卡和 Arc 獨立顯示卡上執行 Stable Diffusion Automatic1111。
透過實際測試,可以看到在華碩破曉 Air 輕薄本上,Stable Diffusion 在整合顯示卡上的表現效果。96EU 版本的英特爾銳炬 Xe 顯示卡強大的算力,可以支援 Stable Diffusion 軟體上執行 FP16 精度的模型,快速生成高質量圖片。小編讓它生成一張“正在打電話的男人”,在華碩破曉 Air 上,只用了 25.1 秒就“順利出片”了。
而在生成過程中,IT之家也透過效能資源管理器看到,GPU 的佔用到了 100%,同時 CPU 也有 15% 的佔用,可見這張圖片確實是在本地利用 GPU 進行渲染的。
如果放在過去,我們很難想象輕薄本可以擁有這樣的效能,但隨著 13 代酷睿處理器在效能、功耗比方面的進步,以及銳炬 Xe Graphics (96EU) 在 FP16、FP32 浮點效能的大幅提升,同時加入了 INT8 整數計算能力,這些都大大增強了 GPU 整體的 AI 圖形計算能力。這也就是華碩破曉 Air 這樣的輕薄本也能在本地側很好地執行 Stable Diffusion 的重要因素。
值得一提的是,在英特爾下一代酷睿處理器 Meteor Lake 中,GPU 核顯效能還會得到進一步提升,將擁有 8 個 Xe GPU 核心 128 個渲染引擎,更增加了 8 個硬體的光追單元,還會引入 Arc 顯示卡的非同步複製,亂序取樣等功能,也對 DX12U 做了最佳化。
不僅如此,英特爾還在 Meteor Lake 中加入了整合式 NPU 單元,實現更高效能的 AI 計算,它包含了 2 個神經計算引擎,能夠更好地支援包括生成式 AI、計算機視覺、影象增強和協作 AI 方面的內容。
同時除了 NPU,CPU 和 GPU 也都可以進行 AI 運算,不同場景下會用不同的 AI 單元去應對,彼此協調,如此一來,其整體能耗比相比前代最多可以提升 8 倍之多。因此,未來搭載 Meteor Lake 處理器的輕薄本在本地 AIGC 創作方面的表現會更加令人期待。
透過上面的介紹和測試,相信大家對於在筆記本上執行 AIGC 這件事有了新的認識,同時,也會對 PC 筆記本的生產力有新的認知。在 AIGC 賦能之下,未來的 PC 的性質甚至也將發生進化,將不僅侷限在生產“工具”的屬性,更具備像人類意識一樣的智慧力和創作力。從這一點來看,英特爾在 AI PC 這條路上所做的努力,無疑更加具有意義。