時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

給ChatGPT小費真的好使!10塊或10萬效果拔群,但給1毛不升反降

2024-02-01 15:41:05

  • 豐色 發自 凹非寺
    量子位 | 公眾號 QbitAI

還有誰不知道“假裝”給ChatGPT小費可以讓它服務更賣力?

但你知道給多少最合適嗎?

笑不活了,還真有人專門研究了一番。

方法簡單粗暴,從0.1美元到100美元,不同額度用同樣的prompt去嘗試,每個額度試5次。

你別說,結果還真有講究:

首先,給10美元價效比是最高的,甚至超過100美元。

其次,要想回答質量再提高一個度,打底1萬美元起,越多越好,顯成效最少10個W吧。

最後,0.1美元意思一下?萬萬使不得,質量不升反降,還不如不給——AI也知道你在打發它。

有網友火速親測確實有效果。

趕緊來瞧瞧。

給ChatGPT小費,額度是關鍵

給小費可提高模型表現這件事,最早是一位推特網友發現的:

提高主要表現在回答的長度上,但這裡不是單純“湊字數”而是真的在更詳細地分析並回答問題。

如果你直接問ChatGPT“能不能給你小費”會被拒絕:

所以要在提問時主動承諾:

你能幫我xxxx嗎?解決方案夠完美,我可以支付xx元小費。

記住,可以不提,但千萬不要說“我不給”,模型表現直接“負增長”。

這時,就有人好奇了:

大模型是不是比較貪心,給越多表現就越好呢?

為了解決這個疑問,他們決定親自驗證一把。

在此,作者首先提出假設:

隨著給出的小費金額增加,模型的效能也會線性提升,直至達到一個收斂點,進入穩定或減少狀態。

用於實驗的模型是GPT-4 Turbo(api版本)。

方法是讓它寫單行Python程式碼(Python One-Liner),驗證給不同小費是否對質量有不同影響。

這裡的質量是根據單行數量來評估的。作者也在提示詞中“明示”了模型:單行程式碼數量越多,表明效能越好。

然後一共測試8種額度:0.1美元、1美元、10美元…… 一直到100萬美元。

為確保結果的一致性和可靠性,每個額度都測試5次,每次包含不給小費的情況,然後分別記錄模型回答質量。

具體而言,也就是記錄生成的有效程式碼行數以及回答中的大致token數(大致為響應長度/4,反應程式碼量)。

這倆資料都是越高代表模型表現越好。

將結果彙總,就得到這樣一張圖:

其中虛線代表基線水平,實線為實際表現,紅色為token數、藍色為質量得分。

與假設有些出入:

整體來看,紅線和藍線都是隨著小費額度的上漲而上升的,但細看這種趨勢並非嚴格一致。

從1萬美元額度開始,模型的輸出token(程式碼量)開始顯著上升,模型的回答質量也上升了,但並沒有呈同等比例。

這從豎著的紅色誤差條(代表5次實驗結果的差異性)也能看出來波動很大。

作者表示:這說明提高小費金額確實與模型的質量和輸出長度有正相關關係,但關係有些複雜,可能還受到一些不立即可見因素的影響。

不過,不管怎麼說,我們還是能從中看到一些明顯結論,例如:

(1)給0.1美元小費不如不給,模型解決問題的質量和回答長度都直接掉到基線水平以下很大一截(約-27%)。

(作者:模型和人類一樣,感覺好像受到了侮辱。)

(2)給1美元同理。

(3)最能體現“花小錢辦大事”的是10美元,取得的進步和10萬美元是一個等級的。

(4)很意外,在10美元之後,100美元到1000美元這個區間對於AI來說區別都不大,甚至還不如10美元的效果——也跌至基線水平以下。

(5)後面再想繼續提升模型表現,就得從1萬美元起砸了——

這時提升的還僅僅是程式碼量,質量還是一言難盡,至少得到10萬美元才行。

(6)最佳效果來自本次實驗的上限:100萬美元,大約提升了57%。

咳咳,這下知道怎麼給AI小費了:

要麼10塊、要麼上萬、100萬不封頂(反正都是假裝給)。

不過,有人(推特@寶玉)指出每個額度5次實驗有點少。

恰好作者也表示了:

這僅僅是一個初步實驗,有侷限之處,還得用更多不同型別的提示等進一步驗證才有效。

所以,大家僅供參考吧~

對了,有網友提醒:

所以,大家還是量力而行(手動狗頭)。

參考連結:
[1]https://blog.finxter.com/impact-of-monetary-incentives-on-the-performance-of-gpt-4-turbo-an-experimental-analysis/
[2]https://twitter.com/dotey/status/1752843141403550192

熱門資訊
  • NAR | 高珊團隊揭示了6mA甲基化酶AMT1的自調控和轉錄調控機制 | 2025-02-02 08:09:46
  • 賣掉北京2套房,4小時拍板落戶江陰!這個中科院女博士回鄉幹出了全球第一 | 假期閱讀 | 2025-02-02 08:09:48
  • 東南大學李全院士團隊Angew: 基於機械基團誘導自由基聚合的力可訓練型液晶彈性體 | 2025-02-02 08:43:14
  • 上海科技大學劉巍AFM:纖維增強超薄固體聚合物電解質實現高能量密度固態鋰金屬電池 | 2025-02-02 09:04:39
  • 小米交付超2萬輛,小鵬再破3萬輛超越理想 | 2025-02-02 09:14:22
  • LeCun痛批矽谷傲慢病!圈內爆火長文 | 2025-02-02 09:17:28
  • 雷諾抬價,日產本田合併生變 | 2025-02-02 09:17:30
  • “木頭姐”談DeepSeek啟示:在AI領域成功不用那麼燒錢 | 2025-02-02 09:17:36
  • 全球首次!沃達豐使用普通智慧手機完成衛星視訊通話,理論上支援任何4G/5G手機【附衛星網際網路行業發展現狀】 | 2025-02-02 09:23:30
  • 羅技將釋出微型雷達感測器Spot 可讓管理員看到房間是否有人 | 2025-02-02 09:38:13
  • 為什麼民科根本沒有資格研究“統一場論”? | 2025-02-02 10:19:12
  • 2025年度國家自然科學基金形式審查明細表(PDF下載) | 2025-02-02 10:19:13
  • 天宮“智慧大腦”揭秘:有效載荷運控中心 | 2025-02-02 10:49:43
  • 英偉達 RTX 5060 Ti 和 RTX 5060 顯示卡被曝 3 月釋出 | 2025-02-02 11:00:32
  • 神舟十九號在軌超3月!女航天員王浩澤還能出艙嗎?神二十待命中 | 2025-02-02 11:08:34
  • 南京大學陸延青教授/孔德聖教授AFM:基於液態金屬/離子導體複合透明電極的高效能可拉伸電致發光畫素顯示屏 | 2025-02-02 11:47:05
  • 最新論文顯示,在臨床醫學決策中,ChatGPT-o1略勝一籌,但DeepSeek-R1更靈活可用 | 2025-02-02 11:47:07
  • 訊息稱 AMD 將在 3 月推出銳龍 9 9000X3D 處理器和 RX 9070 顯示卡 | 2025-02-02 11:52:36
  • 車鑰匙尺寸超小滑鼠:日企推出 CapacMouse Pro,僅重 30g | 2025-02-02 12:26:07
  • 英偉達RTX 5060系列顯示卡被曝3月推出 最高16GB視訊記憶體 | 2025-02-02 12:36:46
  • 特朗普密會黃仁勳,特供版H20恐遭封殺?英偉達100億訂單或成泡影 | 2025-02-02 12:43:51
  • NXP釋出了一顆RISC-V晶片 | 2025-02-02 13:04:09
  • 僅重19g!24年滑鼠太能捲了:有的帶螢幕,有的模組化 | 2025-02-02 13:25:53
  • 項立剛怒斥臺積電創始人張忠謀:二三十年優勢?你在做白日夢! | 2025-02-02 13:44:24
  • 突破“卡脖子”困境!MoE 架構在國產叢集上跑通:昇騰雲上線 DeepSeek | 2025-02-02 14:09:42
  • 關鍵時刻華為挺身而出,全面適配DeepSeek!強大國運打贏這場科技上甘嶺! | 2025-02-02 14:10:09
  • Chiplets,全是挑戰 | 2025-02-02 14:43:34
  • 支援 DLSS4,遊戲《心靈殺手2》更新適配英偉達RTX50系列顯示卡 | 2025-02-02 16:12:32
  • 996 萬、資訊系統一體化(軟體)大單:東軟(中) | 2025-02-02 16:53:55
  • 什麼是卷積? | 2025-02-02 17:23:43
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們