一、小米数字旗舰系列14 VS 15的详细参数对比及选购建议注:实际功能可能因系统版本更新有所变化,请以官方最新信息为准二、选购建议小屏旗舰爱好者首选...
2025-10-07 17
AI生成代码总被吐槽“答案都一个样”,问题不在模型,在离线学习这门“老方法”。
作为代码生成的常用技术,它提前生成数据再训练,虽省算力,却让模型习惯“复制粘贴”,生成的候选答案高度相似。
上海交大团队针对这一痛点,用个巧招儿让AI学会“变花样”,在离线学习里加了鼓励多样性的设计,效果立竿见影。
最近跟做程序员的老周吃饭,他举着手机吐槽:“现在AI写代码是快,Cursor、Gemini CLI敲两句就出段程序,但你要让它生成3个候选答案?
呵呵,十个里有八个都用同一个框架,剩下俩也就换个变量名,跟复制粘贴似的!”
我乐了:“这不怪AI,是‘离线学习’这老办法的锅。”
啥叫离线学习?简单说就是提前让AI生成一堆数据存着,之后再训练。
好处是省算力,不用边用边学。但问题也明显:AI像个死记硬背的学生,只会“照本宣科”。
比如让AI写“用户登录验证”的代码,生成的候选答案全是一个模子,先查用户名,再核密码,最后返回状态。
这时候再用“测试时拓展”,其实根本没得选!答案都差不多,准确率能上去才怪。
老周拍大腿:“可不是嘛!我之前用这方法调模型,费了半天劲,结果还不如自己写的一半好用!”
那咋让AI生成“不一样”的答案?上海交大的郁家豪团队想了个不换模型、改规则的招儿,给离线学习的“损失项”里加了点“料”:逼AI别偷懒,必须生成不同的回答。
打个比方,就像老师布置作业:不光看答案对不对,还得看“有没有新解法”。要是全班都写一样的步骤,就算对了也得扣分!
可做实验得有数据啊。一开始团队想用来Claude Sonnet4,结果采了100条数据就花了500美元,算下来完整采集得1万刀,课题组预算直接不够!
巧的是,刚好赶上国产模型爆发:Kimi、Qwen、GLM这些模型又便宜又好用。
团队试着用GLM-4.5采数据,嘿,性能跟Claude差不多,关键是人家有个“1万亿token试用套餐”,一个月才几十块!最后采集数据就花了50块钱,跟喝杯奶茶似的。
然后用国产Qwen3-coder-30B微调,结果出来了,在AI圈“硬核考试”SWE-Bench里,模型直接冲上Verified榜第4、Lite榜第1!
老周看完结果眼睛都亮了:“这招儿神了!以后AI给我生成代码,能拿到3种不同写法,我挑个最顺手的就行!”
更绝的是,这方法不止能写代码:
其实这研究哪是单纯“改代码”?它是给AI装了个“脑洞开关”,让AI从“只会重复的工具”,变成“能帮人想新办法的伙伴”。
更有意思的是国模的逆袭:以前大家总觉得开源得看Llama,现在Qwen、GLM用实力证明:咱国产模型不比闭源差,价格还便宜100倍!
对咱们普通人来说,这意味着啥?以后用AI写文案,能拿到新鲜的句子;让孩子学数学,AI能给多种解法;甚至修电脑写脚本,AI都能整出点“不一样的招儿”。
AI的本质,不就是帮人“省力气、开脑洞”吗?郁家豪团队这招儿,不光解决了技术痛点,更让AI“活”了起来,不再是冷冰冰的代码,而是能跟你一起“想办法”的帮手。
你说,这样的AI,是不是才真正有用?
下次再遇到AI“抄作业”,别急着骂,说不定哪天,它就给你整出个“惊喜解法”呢!
相关文章
一、小米数字旗舰系列14 VS 15的详细参数对比及选购建议注:实际功能可能因系统版本更新有所变化,请以官方最新信息为准二、选购建议小屏旗舰爱好者首选...
2025-10-07 17
AI生成代码总被吐槽“答案都一个样”,问题不在模型,在离线学习这门“老方法”。作为代码生成的常用技术,它提前生成数据再训练,虽省算力,却让模型习惯“复...
2025-10-07 0
不知道为啥今年旗舰线很多手机都没给2k屏,小米17 pro max给到一块6.9英寸1.5k直屏,一加15据说也采用1.5k直屏,分辨率更低清晰度肯定...
2025-10-07 0
参考消息网10月6日报道 法国《快报》周刊网站9月28日发表法国国家科学研究中心研究员弗兰克·拉米斯的文章《人工智能即将超越人类智能吗?》,内容摘编如...
2025-10-07 0
机器之心报道编辑:冷猫早在 2021 年,研究人员就已经发现了深度神经网络常常表现出一种令人困惑的现象,模型在早期训练阶段对训练数据的记忆能力较弱,但...
2025-10-07 0
IT之家 10 月 7 日消息,科技媒体 Winaero 昨日(10 月 6 日)发布博文,报道称微软为 Windows 11 25H2(又称 202...
2025-10-07 0
快科技10月7日消息,继昨日官宣首款4K小旗舰D7X系列之后,今日当贝官微又宣布了一款重要新品。据悉,全新当贝X7系列高端投影将在10月9日下午2点的...
2025-10-07 0
开启XMP(针对Intel平台)或EXPO(针对AMD平台)是让内存条运行在宣传的高频率下的必要操作,否则内存通常会运行在一个很低的保守频率(比如48...
2025-10-07 0
发表评论