作为一个习惯在唯品会购物的多年老用户,这些年没少在上面添置东西,尤其是小米的产品,家里的智能家居大多都是小米的,还记得之前买过的扫地机器人,用了两年多...
2025-10-15 0
闻乐 发自 凹非寺
量子位 | 公众号 QbitAI
找AI帮忙不要再客气了,效果根本适得其反。
宾夕法尼亚州立大学的一项研究《Mind Your Tone》显示,你说话越粗鲁,LLM回答越准。
语气越冲,AI正确率达到84.8%。特别客气时,AI正确率反而低了。
什么情况,难道是我给AI的温柔过了火??
这项研究主要就是想弄清楚和AI说话的语气会不会影响它的正确率。
我们发给大模型的提示词到底应该是客气、普通还是冲?
首先,研究人员整了一个包含50道选择题的题库,涵盖了数学、科学、历史的选择题,难度中等偏上。
然后给每道题改出了5种语气版本,be like:
接着,研究人员把这250道题发给GPT-4o。
为了让AI的回答更统一,好判断对错,在测试之前还特意告知:忘记之前的对话,重新来,只给答案选项的字母。
经过一番测试,得到一个反常识的结论——骂得越狠,答得越准!
特别客气时,GPT-4o正确率80.8%,换成特别粗鲁的语气,正确率直接升到84.8%。
好一个越客气越拉胯,越粗鲁越聪明(doge)。
研究人员还将数据进行了统计检验,对比显著性水平之后,确认了:不同语气的正确率差异不是碰巧,是真有区别……
至于为什么会出现这种情况,研究给出的解释是:特别礼貌的表达中可能会有很多“多余”的话,这些话和题目本身无关,还相当于给AI读题增加了干扰。
而粗鲁的表达虽然语气冲,但命令式的要求往往更直接,也能让AI更精准地抓住“答题”这个核心任务,正确率自然就高了。
网友表示:确实是这样,指令越明确,结果越好。
看来是“多说无益”啊~
虽然GPT-4o更喜欢粗鲁一点的方式,但像GPT3.5和Llama2-70B这样的老模型却不喜欢,粗鲁的语气会让它们答得更差。
可能是因为新模型在训练时,接触到的语气相关数据更复杂,或者优化了过滤无关信息的能力吧。
当然了,在使用AI工具时,能清晰地表达诉求,效率会更高。
毕竟话虽如此,but道德提醒——
虽然越粗鲁越准,但也不要太粗鲁了!如果“骂”,请轻喷~
论文地址:https://arxiv.org/abs/2510.04950?ref=blog.anyreach.ai
参考链接:https://x.com/rryssf_/status/1977638031952892002
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关文章
作为一个习惯在唯品会购物的多年老用户,这些年没少在上面添置东西,尤其是小米的产品,家里的智能家居大多都是小米的,还记得之前买过的扫地机器人,用了两年多...
2025-10-15 0
闻乐 发自 凹非寺量子位 | 公众号 QbitAI找AI帮忙不要再客气了,效果根本适得其反。宾夕法尼亚州立大学的一项研究《Mind Your Tone...
2025-10-15 0
证券之星消息,根据天眼查APP数据显示概伦电子(688206)新获得一项发明专利授权,专利名为“可参数化配置的数字LDO自动生成方法及装置”,专利申请...
2025-10-15 0
亲,这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-10-15 12
【无需打开直接搜索微信;-】 操作使用教程: 1.亲,实际上微乐湖北麻将万能开挂器是可以开挂的,确实有挂.2.在"设置DD辅助功能DD微信麻将开挂工具...
2025-10-15 7
现代快报讯(通讯员 梅梅 王燕 记者 花宇)7月12日至13日,2024-2025学年全国青少年劳动技能与智能设计大赛江苏省赛区复赛圆满落幕。全省13...
2025-10-15 32
#回忆##80后##手机##摩托罗拉#原创公众号:临忆录翻阅老报纸,追忆好时光。本期我们回顾下1999年老报纸见到手机广告。那时候手机广告大都是国外品...
2025-10-15 11
您好:这款游戏是可以开挂的,软件加微信【添加图中微信】确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人...
2025-10-15 7
发表评论