首页 排行榜文章正文

MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

排行榜 2025年08月21日 22:43 0 admin

本周二,英伟达股价下跌 3.5%,“AI 军工第一股”Palantir 下跌 9.4%,芯片设计公司 Arm 也下跌5%。不少华尔街交易员认为,部分 AI 概念股下跌源于美国麻省理工学院于周一发布的一份报告。这份题为《生成式 AI 的鸿沟:2025 年商业 AI 的现状》的报告显示,尽管企业在生成 AI 上已花费了 300 至 400 亿美元,但 95% 的公司迄今并未能获得商业回报。报告出品方的权威,报告结论与当下 AI “大杀四方”形成的强烈对比,可能都是此次 AI 概念股股价下跌的原因之一。


据了解,本次报告针对企业利益相关者开展了 52 次结构化访谈,对 300 余个公开的 AI 项目及公告进行了系统性分析,并对 153 位领导者进行了调研。成功的定义为:项目部署超越试点阶段且具备可量化的关键绩效指标,投资回报率影响在试点结束后 6 个月进行衡量,并根据部门规模进行调整。在适用情况下,使用自助重采样法计算置信区间。


可以说,生成式 AI 陷入了高采用率、低转化率的困境。一边是 00 后创办 AI 企业并融资上亿元,一边是仅有 5% 的商业回报率;一边是 AI 专家警告 AI 或将接管人类,一边是企业高管对于 AI 供应商的销售邮件爱答不理。AI 的世界为何如此割裂?本次报告或能带来一定的答案。



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

95% 的组织未获得任何回报


尽管企业在生成式 AI 领域投入了 300 亿至 400 亿美元,但本报告揭示了一个惊人的结果:95% 的组织未获得任何回报。这种成果差异在买方(企业、中型市场企业、中小型企业)和构建方(初创公司、供应商、咨询机构)中表现得极为显著,本次报告将其称为“生成式 AI 鸿沟”。仅有 5% 的集成式 AI 试点项目实现了数百万美元的价值提取,而绝大多数项目仍停滞不前,没有对损益产生可衡量的影响。这种鸿沟并非由模型质量或监管因素导致,而是似乎取决于实施方法。


ChatGPT 和 Copilot 等工具已得到广泛采用。超过 80% 的组织已对其进行探索或试点,近 40% 的组织报告已完成部署。但这些工具主要提升的是个人生产力,而非损益表现。与此同时,企业级系统(无论是定制化还是供应商销售的版本)正被悄然弃用。60% 的组织对这类工具进行了评估,但仅有 20% 进入试点阶段,最终仅 5% 投入实际生产。多数项目失败的原因在于工作流程僵化、缺乏情境化学习能力,以及与日常运营脱节。


通过访谈、调研以及对 300 项公开实施案例的分析,本次报告发现了四个造成生成式 AI 鸿沟的典型模式:


  • 有限的颠覆性影响:8 大主要行业中仅 2 个呈现显著的结构性变革。
  • 企业悖论:大型企业在试点数量上领先,却在规模化推广上滞后。
  • 投资偏向:预算倾向于可见的前端职能部门,而非高投资回报率的后台部门 。
  • 实施优势:借助外部合作伙伴的实施成功率比内部自行开发高出两倍。


报告指出,规模化应用的核心障碍并非基础设施、法规或人才,而是学习能力。大多数生成式 AI 系统无法沉淀反馈、适应上下文,也无法随时间推移不断进行改进。


一小部分供应商和采购方通过直接应对这些局限性,正在取得更快进展。那些成功的采购方要求针对具体业务流程进行定制化开发,并基于业务成效(而非软件基准测试)来评估工具,他们期望系统能与现有流程无缝集成,并能随着时间不断改进。而那些能够满足这些期望的供应商,往往能在几个月内就拿下数百万美元规模的部署订单。


尽管大多数生成式 AI 应用并未直接带来人员编制缩减,但那些已经跨越生成式 AI 鸿沟的组织,开始在客户服务、软件开发以及行政职能等领域观察到局部的人员结构变化。此外,一些表现最优异的企业表示,通过减少对业务流程外包和外部机构的依赖(特别是在后台运营上),已经实现了可量化的成本节约。还有一些企业提到,通过自动外联和智能跟进系统,客户留存率和销售转化率均有所提升。这些早期成果表明,具备学习能力的系统,假如能够聚焦于特定业务流程,那么即使不进行大规模组织架构调整,也能创造实实在在的价值。



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

生成式 AI 鸿沟的困境:高采用率,低转化率


大多数组织处于生成式 AI 鸿沟的不利一侧:采用率高,但是颠覆性影响低。报告指出,在九个行业中,有七个行业几乎未出现结构性变革。企业虽在试点生成式AI工具,但是极少能够推进至部署阶段。ChatGPT 等通用工具得到了广泛应用,而定制化解决方案却因集成复杂性及与现有工作流程不匹配而陷入停滞。


生成式 AI 鸿沟在行业级转型模式中最为显著。尽管存在高调的投资和广泛的试点活动,但仅有少数组织能够超越实验阶段,实现实质性的业务转型。


鸿沟背后的颠覆性现实


尽管生成式 AI 备受关注,但生成式 AI 鸿沟在行业层面表现得尤为明显。目前,仅科技与媒体这两大行业显现出结构性变革的清晰迹象,而其他七个行业仍处于转型的滞后一侧。


尽管有大量的高调投资,但是行业层面的整体转型依然有限。生成式 AI 虽已广泛用于支持服务、内容创作与分析场景,但鲜有行业展现出与过去通用技术(如催生新市场领导者、颠覆传统商业模式或带来客户行为的显著变化)相类似的深层结构性变革。


为了更精准地量化颠覆性影响的现状,本次报告构建了一个综合的 AI 市场颠覆指数。每个行业依据五项可观测指标获得 0 至 5 分的评分。这些分数代表了五个维度的标准化平均值,数据通过公开指标与访谈评估交叉验证得出。本次报告还测试了不同的权重分配方案,以便确保行业排名的一致性。 这五个维度分别是:


  • 头部现有企业的市场份额波动性(2022 年至 2025 年)。
  • 2020 年后成立的原生 AI 企业的收入增长情况。
  • AI 驱动的新型商业模式的涌现。
  • 归因于生成式 AI 的用户行为变化。
  • 归因于 AI 工具的管理层组织架构调整频率。


MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

图 | 生成式 AI 的颠覆性影响因行业而异(来源:资料图)



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

图 | 生成式 AI 颠覆性影响说明(来源:资料图)


在敏感性分析上,本次报告针对五项颠覆性影响指标测试了不同的权重分配方案。在所有合理的权重设置下,科技行业与媒体和电信行业始终保持领先排名,而医疗健康行业和能源行业则始终排名靠后。专业服务行业对权重变化的敏感度最高,其得分区间为 1.2 至 2.1,具体数值取决于对效率提升与结构性变革的侧重程度。


在九个主要行业中,有七个行业展现出大量试点活动,但几乎未出现结构性变革。这种投资与颠覆性影响之间的落差,直接体现了规模化层面的生成式 AI 鸿沟——即广泛的实验活动并未带来转型成果。


受访者们的评价直言不讳。一位中型制造企业的首席运营官(COO,Chief Operating Officer)如此概括了人们的普遍看法: “领英上的炒作言论称一切都已改变,但在我们的实际运营中,根本层面毫无变化。我们只是能更快地处理一些合同,仅此而已。 ”


AI 应用从试点到生产的落地鸿沟


生成式 AI 鸿沟在部署率方面体现得最为明显,仅有 5% 的企业定制化 AI 工具能够投入生产使用。聊天机器人之所以能得到应用,是因为它们易于试用且灵活性高,但由于缺乏记忆功能和定制化能力,在关键工作流程中往往难以发挥作用。这一根本性差距解释了为什么大多数企业仍停留在鸿沟的“落后一侧”。


本次报告发现,从对生成式 AI 工具与试点的探索,到实际落地实施之间,存在着显著的断崖式下降。其中,通用解决方案与定制化方案之间存在明显差异。


不过研究局限性在于,这些数据基于个人访谈得出,虽然方向上准确,但并非来自企业官方报告。不同类别的样本量存在差异,而且各个组织对“成功”的定义可能有所不同。



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

图 | 任务特定型生成式 AI 工具从试点到生产的大幅落差揭示了生成式 AI 的鸿沟 (来源:资料图)


需要说明的是,对于任务特定型的生成式 AI 工具,本次报告将“成功落地”定义为用户或管理层认为其对生产力和/或损益产生了显著且持续影响的工具。


企业 AI 解决方案高达 95% 的失败率,正是生成式 AI 鸿沟最清晰的体现。滞留在鸿沟“落后一侧”的组织,仍在持续投资那些无法适配其业务流程的静态工具;而成功跨越鸿沟的组织,则聚焦于具备学习能力的系统。


通用大模型在试点到落地阶段的转化率看似较高(约 83%)。然而,这一数据掩盖了其在实际感知价值上的深层差异,也揭示了为何大多数企业仍深陷于生成式 AI 鸿沟的落后一侧。


在企业用户的访谈中,他们对 ChatGPT 和 Copilot 等消费级工具普遍给出了积极评价。这些系统因其灵活性、易用性以及立竿见影的实用性而备受称赞。然而,同样是这些用户,却对定制化 AI 工具或供应商推销的 AI 系统普遍持怀疑态度,认为它们过于僵化、设计过度复杂,或与实际业务流程脱节。


正如一位首席信息官(CIO,Chief Information Officer)所言:“今年我们看了几十场演示,可能只有一两个真正有用,其余要么是套个壳子,要么就是科研项目。”


尽管热情和预算通常足以启动试点项目,但将其转化为具有持续价值的工作流集成系统却依然罕见,这一模式正是处于生成式 AI 鸿沟不利一侧的组织所面临的典型困境。


需要说明的是,本次报告所定义的“企业”指年收入超过 1 亿美元的公司,这类企业在试点项目数量上处于领先地位,且为 AI 相关举措投入了更多人力。然而,这种投入强度并未转化为成功,这些组织的试点项目规模化转化率在所有类别中最低。


相比之下,中型市场企业行动更为迅速且决策果断。那些表现优异的中型企业报告称,从试点到全面落地平均仅需 90 天;而相比之下,大型企业则平均耗时九个月甚至更久。


基于此,本次报告指出了企业使用生成式 AI 的五大误区:


误区一:人们认为 AI 将在未来几年取代大多数工作岗位。


事实上,研究发现,生成式 AI 导致的裁员情况有限,且仅发生在已受 AI 显著影响的行业中。对于未来 3-5 年的招聘规模,高管们尚未达成共识。


误区二:生成式 AI 正在改变商业。


事实上,应用率虽高,但转型却非常罕见。仅有 5%的企业已将 AI 工具大规模集成到工作流程中,且 9 个行业中有 7 个未出现真正的结构性变革。


误区三:企业在采用新技术方面行动迟缓。


事实上,企业对采用 AI 的意愿极高,90%的企业已认真考虑购买 AI 解决方案。


误区四:阻碍 AI 发展的最大因素是模型质量、法律、数据和风险问题。


事实上,真正阻碍其发展的是,大多数 AI 工具既不具备学习能力,也无法很好地融入工作流程。


误区五:最优秀的企业都在自主开发工具。


事实上,内部开发的失败率是其他方式的两倍。


“影子 AI 经济”:跨越生成式 AI 鸿沟的桥梁


尽管企业官方发起的 AI 计划仍被困在生成式 AI 鸿沟的不利一侧,但员工已通过个人 AI 工具跨越了这一鸿沟。这种“影子AI”往往能比正式计划带来更高的投资回报率,也揭示了真正能有效跨越鸿沟的方法。


企业部署数据不尽如人意的背后,隐藏着一个令人意外的现实:AI 其实已在改变工作方式,只是并非通过官方渠道。本次报告发现了一个蓬勃发展的“影子 AI 经济”——员工们利用个人的 ChatGPT 账户、Claude 订阅服务及其他消费级工具,将工作中的大量内容实现自动化,而这往往无需具备 IT 知识,同时也未获得企业官方批准。


然而,其规模令人瞩目。尽管仅有 40% 的公司表示购买了官方的大模型订阅服务,但在本次报告调查的公司中,超过 90% 的员工报告称会定期使用个人 AI 工具处理工作任务。事实上,几乎每个人都会以某种形式在工作中使用大模型。



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

图 | “影子 AI 经济”,员工使用率远超官方采用率(来源:资料图)


在许多情况下,使用“影子 AI”的员工表示,他们每周的工作日中几乎每天都会多次通过个人工具使用大模型,而他们所在企业的官方 AI 项目却仍停滞在试点阶段。


这一“影子 AI 经济”的现象表明,只要能为员工提供灵活、响应迅速的工具,个人完全有能力成功跨越生成式 AI 鸿沟。而那些能够洞察这一趋势并加以利用的企业,正是未来企业级 AI 应用普及的方向所在。


具有前瞻性思维的组织正开始弥合这一差距:它们从“影子 AI”的使用情况中学习经验,先分析哪些个人工具能产生价值,再采购对应的企业级替代方案。


投资模式反映鸿沟差异


报告指出,投资分配揭示了生成式 AI 鸿沟的真实表现,尽管 50% 的生成式 AI 预算流向了销售与市场部门,但后台自动化往往能带来更高的投资回报率。这种偏向反映的只是指标归因更简单,而非实际价值更高,结果导致企业持续聚焦于错误的优先事项。


在功能侧重点方面,生成式 AI 工具的投资呈现高度集中的特点。由于各个组织尚未对生成式 AI 支出进行正式量化,因此本次报告让高管们将一笔假设性的 100 美元分配到不同功能领域。在本次报告的调查中,销售和营销功能占据了各家组织 AI 预算分配的大约 70%。



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

图 | 按功能划分的生成式 AI 投资分布(来源:资料图)


尽管在高管访谈中,生成式 AI 投资的总体功能分配(例如约 50% 流向销售与市场部门)相对一致,但细分领域以及具体用例的划分,至多可被视为方向性参考。这些细分项是基于综合访谈记录与案例模式归纳得出的,而非精确的财务核算结果。企业类型对投资分布有着显著影响:例如,制造商和医疗健康机构通常对销售与市场部门的投入极少,而更倾向于将资金重点投向运营领域;科技与媒体公司则往往优先考虑营销、内容创作及开发者效率工具;专业服务机构则更偏向于文档自动化及法律合规类工具。


销售与市场部门之所以占据主导地位,不仅因为其成果更显眼可见,更因为其成效更容易衡量。诸如产品演示数量或邮件响应时间等指标,能直接与董事会层面的关键绩效指标挂钩。


相比之下,法律、采购和财务领域带来的效率提升则更为隐蔽。这些提升包括合规违规情况减少、工作流程简化、月末结算流程提速等,这些成果虽至关重要,却难以在高管会议或投资者更新报告中清晰体现。


一家《财富》1000 强制药企业负责采购的副总裁清晰地表达了这一挑战:“如果我购买一款工具来帮助团队提升工作效率,该如何量化这种影响?当它无法直接拉动收入或降低可衡量的成本时,我又该如何向 CEO 证明这笔支出的合理性?我或许可以说它能帮助我们公司的科学家更快获得所需工具,但这与最终的利润影响之间还隔着好几层关联。”


这种投资上的偏向加剧了生成式 AI 鸿沟的存在,资源被投向那些关注度高但变革性往往较弱的用例,而后台职能中具有最高投资回报率的机会却仍面临资金不足的问题。


除了衡量难题之外,信任与社会认同仍然是采购决策中的关键因素。一家大型消费品公司的采购负责人道出了许多采购决策者面临的共同困境:“我每天都会收到无数封邮件,声称能提供最优质的生成式 AI 解决方案。有些方案的演示效果令人印象深刻,但建立信任才是真正的难题。面对收件箱中泛滥的各类选择,我们在很大程度上依赖同行的推荐和人脉网络的介绍。”


这凸显了一个更普遍的现象:仅靠产品质量往往远远不够。在企业采用决策中,推荐介绍、既往合作关系以及风投引荐,比产品功能或特性组合更能决定最终结果。



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

AI 试点为何停滞:技术鸿沟背后的认知断层


导致组织停留在生成式 AI 鸿沟不利一侧的主要因素是学习差距、工具无法学习、集成性差,或与工作流程不匹配。用户会倾向于使用 ChatGPT 处理简单任务,但在关键工作中却会放弃它,原因在于其缺乏记忆功能。目前缺失的是具备自适应、记忆和进化能力的系统,而这些能力正是区分鸿沟两侧的关键所在。


困住组织的重重障碍


最主要的障碍反映出定义生成式 AI 鸿沟的根本性学习差距,用户会抵制那些无法自适应的工具,模型的输出质量在没有上下文时就会变差,而当系统不具备记忆能力时,用户体验也会大打折扣。即便是热衷于使用 ChatGPT 的用户,对于那些无法达到其期望的内部生成式 AI 工具也往往心存疑虑。


为了弄清楚为何如此多的生成式 AI 试点项目停留在实验阶段而无法推进,本次报告对 52 家组织的高管发起者和一线用户均进行了调查。参与者需对常见的规模化障碍按发生频率从 1 到 10 分进行评分,其中 10 分代表最常遇到的障碍。


结果显示,一个可预见的主要障碍是:对采用新工具的抗拒。然而,排名第二的障碍其影响程度远超预期。



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

(来源:资料图)


需要说明的是,这些分数反映的是本次报告中的障碍发生频率,而非对障碍影响程度的客观衡量,而且可能因行业和组织规模的不同而存在显著差异。


报告指出,随着 ChatGPT 及类似工具的消费端采用率的激增,超过 40% 的知识工作者已经在个人化层面使用 AI 工具,但正是这些将 AI 融入个人工作流的用户,在企业系统中遭遇同类工具时却认为其不可靠。这种悖论揭示了生成式 AI 在用户层面的应用鸿沟。


这一偏好揭示了一个根本性的矛盾:那些日常在个人工作中频繁使用 ChatGPT 的专业人士,在企业场景中却要求 AI 具备学习和记忆能力。大量员工已经在私下使用 AI 工具,并报告称其提升了工作效率,而企业内部的正式 AI 项目却进展缓慢。这种“影子使用”行为形成了一个反馈循环。员工已经体验过优质 AI 带来的便利,因此对僵化不变的企业级工具容忍度更低。


为何通用工具既占优势也存短板


如前所述,生成式 AI 鸿沟也体现在了用户偏好上,即便 ChatGPT 与企业工具使用的模型相似,前者仍凭借更优质、更快捷、更易上手的特点胜过企业工具。但这种偏好也揭示了为何组织会被困在鸿沟的不利一侧。


本次报告的后续访谈揭示了一个显著的矛盾:那些对企业 AI 工具持怀疑态度的专业人士,往往却是消费级大模型的重度使用者。当被要求对比两种使用体验时,三个一致的主题浮现出来。



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

图 | 用户偏好驱动因素:通用大模型 vs. 集成工具 (来源:资料图)


一家中型律所的公司法务就体现了这种情况。她所在的机构斥资 5 万美元购买了一款专业的合同分析工具,但她在起草工作中却始终默认使用 ChatGPT,其表示: “我们购买的 AI 工具生成的摘要刻板生硬,定制化选项也十分有限。而使用 ChatGPT 时,我可以引导对话并反复调整,直到得到完全符合需求的结果。两者在质量上的根本差异显而易见。尽管供应商声称使用的是相同的底层技术,但 ChatGPT 生成的输出内容始终更优质。”


这种现象表明,一款每月 20 美元的通用工具往往比成本高出几个数量级的定制化企业系统表现更优,至少在即时可用性和用户满意度方面是如此。这一矛盾恰恰解释了为何大多数组织仍停留在生成式 AI 鸿沟的不利一侧。


定义鸿沟的学习差距


ChatGPT 自身的局限性恰恰揭示了生成式 AI 鸿沟背后的核心问题,它无法记住上下文、不会学习,也无法自我进化。在关键任务型工作中,90% 的用户仍更倾向于选择人工处理。这一差距是结构性的:即生成式 AI 缺乏记忆能力和适应能力。


基于用户对消费级大模型的偏好,本次报告深入探究了阻碍关键任务工作广泛采用该技术的核心因素。研究发现,这些障碍截然不同于一般的可用性问题,也直接揭示了造成生成式 AI 鸿沟能力断层的原因所在。



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

图 | 核心工作流程集成的障碍(来源:资料图)



那位偏爱使用 ChatGPT 进行初稿起草的律师,在涉及敏感合同时划下了明确界限: “它在头脑风暴和初稿起草方面表现出色,但无法记住客户的偏好,也不能从之前的修改中学习。它会重复同样的错误,而且每次使用都需要输入大量背景信息。对于处理高风险工作来说,我需要一个能够积累知识并不断改进的系统。”


这一反馈揭示了导致企业停留在生成式 AI 鸿沟落后一侧的根本性学习差距:用户虽然欣赏消费级大模型的灵活性和响应速度,但更需要当前工具所无法提供的持久记忆能力与上下文感知能力。


当本次报告让企业用户对高风险工作的不同工具选项进行评分时,偏好层级变得清晰起来。



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

图 | 高风险工作的适用性感知:“你会将这项任务交给 AI 还是初级同事?”(来源:资料图)


结果显示,AI 已能在简单工作的竞争中胜出:70% 的受访者更倾向于用 AI 起草邮件,65% 更倾向于用其进行基础分析。但对于任何复杂或长期的工作,人类以 9:1 的压倒性优势占据主导地位。两者的分界线并非智力,而是记忆、适应性和学习能力,这些也正是划分生成式 AI 鸿沟两侧的核心特征。


智能体 AI(Agentic AI)是一类通过设计嵌入持久记忆与迭代学习能力的系统,它直接填补了定义生成式 AI 鸿沟的学习差距。与当前每次使用都需要完整上下文的系统不同,智能体系统能够保持持久记忆、从交互中学习,并且可以自主协调复杂的工作流程。企业在多个领域的早期实验已证明,自主性与记忆能力可以填补企业面临的核心差距:例如能够端到端处理完整咨询服务的客户服务智能体、监控并审批常规交易的财务处理智能体,以及跨渠道追踪客户互动的销售线索智能体。


MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

图 | 按定制化程度和学习能力对生成式 AI 工具进行定位(来源:资料图)



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

跨越生成式 AI 鸿沟:顶尖实践者如何成功突围


处于生成式 AI 鸿沟正确一侧的企业,都秉持着一种共同的策略:它们构建的是能够自适应、深度嵌入业务流程,并能从用户反馈中不断学习的系统。而那些成功跨越鸿沟的优秀初创企业,往往聚焦于细分但高价值的特定应用场景,深度融入用户工作流,并通过持续学习实现扩展,而非依赖大而全的功能堆砌。在这些成功案例中,领域专业度与工作流融合能力,远比华而不实的用户界面更重要。


在本次报告的访谈中,报告作者们观察到生成式 AI 初创企业之间的差距正日益扩大。一些企业仍固守过时的软件即服务(SaaS,Software as a Service)运营模式,困在鸿沟的不利一侧;而另一些企业则通过深度定制化服务以及与实际业务痛点的精准对接,成功吸引了企业客户的关注。


市场对生成式 AI 工具的需求依然旺盛。多家初创企业报告称,它们在短短数日内便签下试点项目,随后很快实现了七位数的营收运行率(即年收入达百万美元级别)。表现最为突出的企业,并非那些开发通用型工具的公司,而是那些能够深度嵌入业务流程、根据具体场景灵活适配,并从细分但高价值的切入点实现规模化扩张的团队。


本次报告也用数据揭示了一个清晰的模式:取得成功的组织和供应商,都是那些积极解决学习、记忆和工作流程适配问题的主体;而遭遇失败的,则要么是在开发通用工具,要么是试图在内部自行开发相关能力。


成功的初创企业所构建的系统能够从反馈中学习(66% 的高管有此需求)、保留上下文信息(63% 的高管要求具备这一功能),并能深度定制以适配特定工作流程。它们从工作流程的边缘环节入手,进行大量定制化开发,随后再逐步拓展至核心流程。


企业真正想要的是什么:跨越鸿沟的桥梁


最成功的供应商深知,要想跨越生成式 AI 鸿沟,关键在于构建高管们反复强调的那种系统:这种 AI 系统不仅能生成内容,还能在其所处环境中不断学习和改进。在评估 AI 工具时,采购方始终强调一系列特定的优先考量因素。本次报告对访谈中的这些主题进行了编码,以便量化它们在采购决策中出现的频率:


MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

图 | 高管如何选择生成式 AI 供应商,基于访谈内容并按类别编码(来源:资料图)




MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

图 | 高管选择生成式 AI 供应商的直接引述,基于访谈内容并按类别编码(来源:资料图)


本次报告指出,人们对于员工队伍影响的担忧远低于预期。大多数用户对自动化持欢迎态度,尤其是针对繁琐的手工任务,前提是数据安全有保障且成果可衡量。


尽管传统观念认为企业会抵制训练 AI 系统,但在本次报告的访谈中,大多数团队表示愿意这样做,前提是能明确看到收益且有相应的保障措施。


尽管企业对 AI 抱有兴趣,但却对新兴供应商存在明显的疑虑,尤其是在高信任度或受监管的工作流程中。许多采购负责人告诉本次报告的作者们,他们会忽略大多数初创企业的推销,无论其创新程度如何。


某全球消费品集团采购负责人表示:“我们每天都会收到数十份关于 AI 驱动的采购工具的推销,但我们长期合作的业务流程外包合作伙伴已经熟知我们的政策和流程。相比转向未知供应商,我们更有可能等待前者推出 AI 增强版本。”


跨越鸿沟的成功策略指南


成功跨越生成式 AI 鸿沟的初创企业,往往先在细分工作流中取得小型但可见的成果,再逐步扩展。那些部署门槛低、价值实现速度快的工具,其表现优于传统重型企业级解决方案。而渠道推荐与同行信任,是跨越这一鸿沟的关键增长杠杆。那些最成功的初创企业通过实施两项策略,既满足了企业对学习型系统的需求,又化解了其对新工具的疑虑。


一方面,要为特定工作流程定制化开发。先将工具嵌入非核心或相邻流程并进行深度定制,通过展现明确价值后再逐步扩展至核心业务流程。那些取得成功的工具都具备两大共性:配置简便、价值立现。与之形成鲜明对比的是,那些需要企业进行大量定制的 AI 工具,往往止步于试点阶段。


本次报告的样本中的成功类别包括:用于通话总结与转接的语音 AI、用于合同和表单的文档自动化、用于重复性工程任务的代码生成。而表现不佳的类别往往涉及复杂的内部逻辑、不透明的决策支持,或基于专有启发法的优化。由于企业内部需求的高度特异性,这些工具常常在推广应用时遭遇阻力。


一些初创企业通过主导规模虽小但至关重要的工作流程(尤其在销售和营销领域)脱颖而出,随后逐步拓展业务。排名前 25% 的生成式 AI 初创企业在产品推出后的 6 至 12 个月内,年化收入便能达到 120 万美元。


MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

(来源:资料图)


另一方面,要利用推荐人脉网络。为了克服信任壁垒,成功的初创企业通常会与系统集成商建立渠道合作伙伴关系,借助董事会成员或顾问的采购推荐,以及通过企业熟悉的市场进行分销。



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

图 | 高管们如何发现生成式 AI 解决方案(来源:资料图)


跨越鸿沟的窗口期正在收窄


本次报告指出,跨越生成式 AI 鸿沟的时间窗口正在迅速收窄。企业正加速锁定具备学习能力的工具。具备自主智能(Agentic AI)与记忆框架的解决方案,将决定哪些供应商能够帮助组织成功跨越鸿沟,而哪些会让企业继续困在落后一侧。


企业对能够随时间推移不断适应的系统需求日益增长。微软 365 Copilot 和 Dynamics 365 正整合持久记忆功能和反馈循环。OpenAI 的 ChatGPT 记忆测试版也表明,通用型工具领域存在类似的需求预期。


能够迅速采取行动填补这一差距的初创企业,通过构建能从反馈、使用情况和结果中学习的自适应智能体,可以凭借数据积累和深度集成建立持久的产品护城河。而实现这一点的窗口期十分狭窄。在许多垂直领域,相关试点项目已在推进当中。


支持这一转型的基础设施正通过模型上下文协议(MCP,Model Context Protocol)、智能体间协议(A2A,Agent-to-Agent)和网络化智能体与去中心化架构(NANDA,Networked Agents And Decentralized Architecture)等框架逐步形成,这些框架实现了智能体的互操作性与协同能力。通过允许专用智能体协同工作而非依赖单体系统,这些协议促进了市场竞争并提升了成本效益。同时,这些框架构成了新兴的“智能体网络(Agentic Web)”的基础,因为这是一个由可互操作的智能体和协议组成的网络,它用动态协同层取代了单体应用程序。


未来几个季度,一些企业将锁定与供应商的合作关系,而这些合作关系此后几乎无法轻易解除。18 个月的时间窗口,是本次报告的作者们访谈了 17 位采购与 IT 资源采购负责人后达成的共识,并得到了公开采购信息披露的分析支持。数据显示,企业从发出需求建议书到实际落地实施的周期通常为 2 至 18 个月。那些投资于能够从自身数据、工作流程和反馈中学习的 AI 系统的组织,其切换成本正在以月为单位不断累积。


某 50 亿美元规模金融服务公司的 CIO 表示:“我们目前正在评估五种不同的生成式 AI 解决方案,但最终能赢得我们业务的,将是最能学习并适应我们特定流程的系统。一旦我们投入时间培训某个系统来理解我们的工作流程,转换成本就会高到令人望而却步。”



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

跨越生成式 AI 鸿沟:卓越采购者如何取得成功


成功跨越生成式 AI 鸿沟的组织,其 AI 采购方式也是截然不同的:它们表现得像业务流程外包客户,而非软件即服务(SaaS,Software as a Service)消费者。这些组织要求深度定制化服务,从一线推动技术采用,并让供应商对业务指标负责。最成功的采购者明白,跨越这一鸿沟需要的是合作关系,而非仅仅是采购行为。


在本次报告的访谈中,一个观点十分明确:最高效的 AI 采购组织不再等待完美的用例或集中式审批。相反,它们通过分布式实验、供应商合作以及明确的问责机制推动技术采用。这些采购者不仅更为积极主动,而且在战略上更具适应性。


在本次报告的样本中,与具备学习能力的定制化工具开展外部合作时,部署成功率约为 67%,而内部自建工具的部署成功率约为 33%。尽管这些数据基于自我报告的结果,可能未涵盖所有混杂变量,但这种差异程度在受访者中表现一致。


这种差距解释了为何 ChatGPT 在临时任务中占据主导地位,却在关键工作流程中表现不佳;也解释了为何通用型企业工具会同时输给消费级大模型和深度定制化的替代方案。


跨越鸿沟的组织设计


本次报告指出,合适的组织结构是跨越生成式 AI 鸿沟的关键。战略性合作的成功率是内部自建的两倍。成功的关键不在于资源多寡,而在于通过明确的权责划分实现权力下放。


跨越生成式 AI 鸿沟的主要障碍并非技术整合或预算问题,而是组织设计。本次报告的数据显示,企业成功的关键在于将实施权力下放的同时,保留明确的问责机制。


与此同时,本次报告观察到三种主要的生成式 AI 实施团队结构,其结果存在显著差异,而这些差异也反映了不同组织在跨越鸿沟进程中的不同站位。



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

(来源:资料图)


这些百分比数据基于本次报告对 52 家组织的访谈样本,可能无法代表更广泛的市场模式。因为不同组织对“成功”的定义存在差异,且本次报告的观察期可能无法捕捉长期实施之后的趋势。


这些成功率差异可能不仅反映实施方法的不同,还与组织能力相关。选择外部合作的组织与选择内部自建的组织相比,可能在风险承受能力、采购成熟度或内部技术能力方面存在差异。外部合作与成功之间的相关性并不一定意味着因果关系。


已有研究发现,战略性合作的成功部署比例显著高于内部开发。尽管在本次报告的样本中,自研举措的数量远多于外采举措(更多组织在探索内部开发),但外部合作的成功率更高。虽然本次报告缺乏关于项目总数量的精确数据,但这一模式表明,尽管内部开发尝试更为普遍,但其成功率明显更低。


尽管组织通常会结合多种方式,但通过战略性合作开展的试点项目成功实现全面部署的可能性是内部自建项目的 2 倍。更值得注意的是,外部开发工具的员工使用率几乎是内部工具的两倍。


这类合作往往能带来更快的价值实现速度、更低的总成本,以及与业务流程更好的适配性。企业无需承担从零开始构建的额外成本,同时仍能获得定制化解决方案。因此,理解这一模式的组织能更有效地跨越生成式 AI 的鸿沟。


跨越鸿沟的采购者实践


在访谈中,成功跨越生成式 AI 鸿沟的组织呈现出一个一致的模式:卓越的采购者不再将 AI 初创企业仅仅视为软件供应商,而是更多地当作业务服务提供商,并用更接近咨询公司或业务流程外包服务商的标准对其进行考核。这些组织具体表现为:


  • 要求根据内部流程和数据进行深度定制。
  • 以运营成果而非模型基准作为工具的考核标准。
  • 在早期试错中开展合作,将部署视为共同演进的过程。
  • 从一线管理者而非中央实验室获取 AI 需求。


在最后一种模式中,一线执行者和团队管理者往往发挥着关键作用。许多最成功的企业级部署都始于“超级用户”,即那些早已尝试使用 ChatGPT 或 Claude 等工具提升个人生产力 的员工。这些“产消者”凭着直觉去理解 AI 的能力与局限,并成为内部认可解决方案的早期倡导者。成功的组织并非依赖集中式 AI 部门来识别用例,而是允许预算负责人和业务领域管理者提出问题、审核工具并主导推广。这种自下而上的需求来源,再加上高管层面的问责机制,在加速技术采用的同时,也确保了与业务运营的适配性。


真正的投资回报率所在:跨越鸿沟之后


那些成功跨越生成式 AI 鸿沟的企业发现,投资回报率往往在那些被忽视的职能部门(如运营和财务)中最高。真正的收益并非来自裁员,而是通过取代业务流程外包和外部机构来实现。前台工具固然备受关注,但后台工具才是降本增效的主力军。


尽管据高管们估算,约 50% 的 AI 预算流向了销售与市场营销(理论预估),但本次报告记录到的一些最显著的降本成效实际上来自后台自动化。虽然前台工具带来的效益显而易见、也更受董事会青睐,但后台部署往往具有更快的投资回收期和更清晰的成本节约效果。


值得注意的是,这些收益的实现并未伴随大规模裁员。工具提升了工作效率,但并未改变团队架构或预算配置。投资回报主要来源于外部支出的减少,包括取消业务流程外包合同、削减机构服务费用,以及用 AI 驱动的内部能力替代昂贵的外部顾问。


这一规律表明:尽管销售与市场营销吸引了大部分关注与投资,但对于那些愿意跳出常规应用场景、真正跨越生成式 AI 鸿沟的企业而言,后台自动化反而可能带来更显著、更可持续的回报。


跨越生成式 AI 鸿沟:顶尖采购者如何成功


生成式 AI 已经开始对劳动力产生影响,这种影响主要体现为对先前外包职能的选择性替代以及招聘模式的受限,而非大规模裁员。那些成功跨越生成式 AI 鸿沟的组织,在实现可量化的外部成本降低的同时,内部员工数量略有减少。


就替代模式与组织战略而言,本次报告指出生成式 AI 驱动的劳动力缩减主要集中在传统上被视为非核心业务活动的职能领域:客户支持运营、行政处理以及标准化开发任务。由于这些岗位此前处于外包状态且流程标准化程度高,在 AI 应用之前就已显现出脆弱性。高管们不愿透露因 AI 导致的裁员规模,但在这些公司中客户支持运营和行政处理岗位的裁员比例在 5% 至 20% 之间。特定行业的招聘预期与生成式 AI 的影响模式存在明显关联。在 AI 引发结构性破坏较小的行业(如医疗健康、能源、高端制造业),大多数高管表示目前及未来五年内均无裁员计划。少数高管提到可能会减少招聘,但也承认目前尚未建立相应系统,无法准确预测裁员的时间和领域。例如,医疗健康行业的高管明确表示,不会减少对医生或临床医护人员的招聘。相反,在生成式 AI 已展现出可量化影响的科技和媒体行业,超过 80% 的高管预计将在 24 个月内减少招聘量。这种动态变化仍集中在先进的 AI 采用者中,且仅存在于当前正经历生成式 AI 显著冲击的科技行业和媒体行业。


本次报告还发现了不断演变的招聘标准与技能要求。生成式 AI 的采用导致各组织形成了差异化的招聘策略。尽管高管们在入门级岗位或一般性招聘规模上尚未达成共识,但他们一致强调,AI 素养已成为一项基本能力要求。这反映出组织层面的共识:AI 应用能力是工作流程优化中的一项竞争优势。 某中型制造企业运营副总裁表示:“我们的招聘策略优先考虑具备 AI 工具应用能力的候选人。在这一能力上,应届毕业生往往超过资深职场人士。”


就未来劳动力影响预测而言,麻省理工学院“冰山计划”(Project Iceberg)的分析为潜在的自动化风险暴露程度提供了量化依据。首先,当前的自动化潜力占美国劳动力价值的2.27%;其次,潜在自动化风险已经暴露,大约涉及 2.3 万亿美元的劳动力价值,影响 3900 万个岗位。随着 AI 系统逐步具备持久记忆、持续学习和自主工具集成能力,这些正是跨越生成式 AI 鸿沟的核心特征,这种潜在的自动化风险暴露将转化为实际可操作的现实。 可以说,劳动力转型将逐步发生,而非通过离散的替代事件实现。在 AI 系统具备情境适应能力和自主运行能力之前,组织层面受到的影响将主要体现为外部成本优化,而非内部结构重组。


超越智能体:智能体网络(Agentic Web)


超越单个 AI 智能体的下一个演进阶段是智能体网络(Agentic Web)。在这一网络中,自主系统能够在整个互联网基础设施中实现发现、协商与协同,从根本上改变业务流程的运作方式。


推动这一转型的基础设施基础已开始通过模型上下文协议(MCP,Model Context Protocol)、智能体到智能体(A2A,Agent-to-Agent)以及 NANDA 等协议逐步显现。这些协议不仅支持智能体的互操作性,还能实现自主网络导航。在智能体网络中,系统将自主发现最优供应商并评估解决方案,无需人工调研;实时建立动态 API 集成,无需预先构建连接器;通过区块链支持的智能合约执行无需信任中介的交易;并开发跨多个平台和组织边界实现自我优化的新兴工作流。


早期实验显示,采购智能体能够独立识别新供应商并协商条款,客户服务系统可跨平台无缝协同,内容创作工作流能整合多个服务提供商并实现自动化质量保障与支付。这标志着从如今人工介导的业务流程向自主系统的根本性转变,这些自主系统将在整个互联网生态中运行,远远超越当前的生成式 AI 鸿沟,从而能够重塑组织在网络经济中发现、整合与交易的方式。



MIT报告揭生成式AI残酷现实:95%企业无回报,低转化率亟需破局

跨越生成式 AI 鸿沟


本次报告指出,那些成功跨越生成式 AI 鸿沟的企业在三个关键点上采取了不同的做法:它们选择采购而非自主开发,赋能一线管理者而非仅依赖中央实验室,同时选用那些能够深度集成且能随时间不断适应的工具。最具前瞻思维的企业,已经开始尝试使用具备自主能力的智能系统,这些系统能在明确边界内自主学习、记忆并采取行动。


这一转变不仅意味着工具的更迭,更预示着“智能体网络”(Agentic Web)的崛起——这是一个持久存在、相互关联的学习系统层,能够在不同供应商、领域与界面之间实现协同。当今的企业技术栈由各自孤立的 SaaS 工具和静态工作流构成,而智能体网络则将其取而代之,代之以能够协商任务、共享上下文并协调跨企业行动的动态智能体。


正如最初的万维网实现了出版与商业的去中心化,智能体网络(Agentic Web)则推动行动的去中心化——从依赖提示词转向基于自主协议的协同机制。诸如 NANDA、MCP 和 A2A 等系统,正是这一网络的早期基础设施,它们让企业能够不再依赖代码,而是通过智能体的能力与交互来编排工作流。随着企业从 2026 年起逐步锁定供应商关系与反馈闭环,生成式 AI 鸿沟的跨越窗口正迅速收窄。下一波技术采纳浪潮的赢家,将不再是那些最炫目的模型,而是那些具备学习与记忆能力的系统,或是为特定流程量身定制的解决方案。


从自主开发转向采购的趋势,加上专业消费者应用的兴起以及智能体能力的出现,为那些能够提供具备学习能力、深度集成的 AI 系统的供应商创造了前所未有的机遇。那些能够识别这些趋势并顺势而为的组织与供应商,将在“后试点”AI 经济中确立主导地位,成功站上生成式 AI 鸿沟的正确一侧。


对于目前仍被困在鸿沟错误一侧的组织而言,前进的道路已然清晰:停止投资那些需要持续人工指令的静态工具,开始与提供定制化系统的供应商合作,并将重点放在工作流集成上,而非追求花哨的演示效果。生成式 AI 鸿沟并非永恒存在,但跨越它需要在技术、合作伙伴关系和组织设计方面做出根本性的不同选择。


参考资料:

报告PDF:https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf

https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/

https://www.reddit.com/r/singularity/comments/1mtvswh/mit_report_95_of_generative_ai_pilots_at/

https://futurism.com/ai-industry-nvidia-stock

https://futurism.com/ai-agents-failing-companies

https://www.tomshardware.com/tech-industry/artificial-intelligence/95-percent-of-generative-ai-implementations-in-enterprise-have-no-measurable-impact-on-p-and-l-says-mit-flawed-integration-key-reason-why-ai-projects-underperform

https://thehill.com/policy/technology/5460663-generative-ai-zero-returns-businesses-mit-report/

https://gizmodo.com/the-ai-report-thats-spooking-wall-street-2000645518


运营/排版:何晨龙

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap