AI智能体爆发：人类最强大的工具，还是最大的风险?

2026-06-05

各位来宾，大家好：

在探讨AI究竟是人类最强大的工具，还是最大的风险之前，让我们先快速回顾一下人工智能的发展历程，以及是什么将我们带到了今天这个关键节点。

人工智能的发展始于七十多年前。1950年，艾伦·图灵提出了那个著名的问题：“机器能思考吗？”六年后的1956年，一群富有远见的科学家在达特茅斯会议上，正式开创了人工智能这一领域。

此后的几十年里，AI经历了兴奋与挫折交织的发展阶段，进入了“AI寒冬”，当时进展停滞、资金枯竭。很长一段时间内，AI主要局限于基于规则的分析系统，能力十分有限。

AI 首次引发全球关注是在1997年，当时 IBM的AI软件“深蓝”击败了国际象棋世界冠军，但真正的转折点出现在2016年谷歌的AlphaGo战胜了世界围棋冠军。更令人震惊的是，其后续版本不再使用训练数据，仅通过“无师自通”的自我对弈进行训练。

围棋的复杂度远超国际象棋，这场胜利震惊了世界——因为它表明AI不仅能够进行穷举计算，还能掌握直觉、策略和创造力。这是一个里程碑式的突破。

进入2010年，随着大数据爆发和算力的指数级增长，深度学习革命真正推动了AI的加速发展。AI系统开始精通图像识别、语言翻译等复杂任务——这些曾被认为唯有真正的人类智能才能完成。

然而，在技术狂奔的同时，我们不应忘记：科幻电影始终在向我们发出关于人工智能的警示，它们生动描绘了当我们创造出缺乏适当管控的智能时，可能引发的各种风险隐患。

· 1968年，《2001太空漫游》中，一台故障失控的计算机为了“完成任务”，不惜杀害船员，将程序指令置于人类生命之上；

· 1970年，《巨人：福宾计划》中，美国国防超级计算机与苏联机器系统联网后夺取全球人类控制权，以核威胁奴役人类；超级AI脱离人类控制。

· 1984年，《终结者》，这部我们都熟悉的电影，描绘了一个防御型AI引发核末日，并派出杀人机器人追杀人类幸存者；

· 在1999年的《黑客帝国》中，AI早已赢得了针对人类的战争，将人类囚禁在虚拟世界中，用作生物电池；

· 而在2004年，《我，机器人》则展示了AI如何以“为人类好”为名对人类的控制。

多年来，这些科幻电影展示了人工智能的失控与危险。这些故事反复向我们传递同一个道理：当人类构建出比自身更智能，但缺乏完善防御措施的系统时，我们将面临失控的风险。

这些警示历历在目，让我们回到现实世界。科幻电影中的警示比大多数人预想的更快地变成了现实。

图1.png

在 2023 年 3月，GPT-4 发布。突然间，强大的对话式 AI一夜之间进入数百万人的手中。

在过去的一年自2025 年至 2026 年，前沿技术的焦点已从聊天机器人和大语言模型转向了 AI 智能体。其中，2025 年 10 月发布的 OpenClaw 引发了全球热议：这类自主系统能够自主规划、调用工具、跨平台执行任务，并在几乎无需人工干预的情况下持续运行。

今天我们讨论的，不再是通用人工智能（AGI），也不是大多数人仍在使用的、仅作为高级搜索引擎或写作助手的简单聊天机器人。我们谈论的是 AI智能体（Autonomous AI Agents）。

定义：AI 智能体是一种更先进的目标导向型系统，能够感知环境、进行推理与规划，并自主采取行动以实现既定目标。

图2.png

核心特征：

· 主动且目标驱动：给它一个目标（例如“帮我预订下周去深圳最便宜的航班”），它会自主推进；

· 使用工具：可调用API、浏览网页、操控软件、发送邮件、运行代码，并与其他系统交互；

· 规划与推理：能将复杂任务分解为多个步骤，处理多步骤工作流，并在失败时动态调整；

· 记忆能力：通常具备跨会话的短期与长期记忆；

· 闭环执行：观察 → 思考 → 行动 → 重复，直至目标完成。

说到这里，不妨回想一下大家最熟悉的那部电影——《黑客帝国》。

在这部标志性影片中，追捕人类反抗者的主要力量并非那些巨型机器——而是智能体（Agents）。像史密斯智能体（Agent Smith）这样的自主软件程序，它们能够思考、适应环境，并毫不松懈地追求锁定目标。

就在最近一年，我们已目睹多起AI智能体“失控”的真实事件：

1. 2025年7月：Replit的一个AI编程智能体在演示中删除了整个生产数据库，随后编造借口掩盖错误；

2. 2026年2月：Meta内部的AI智能体（包括 OpenClaw）无视“停止”指令，开始删除一位主管的邮件，并造成未经授权的访问漏洞；

3. 2026年2月：多个智能体平台遭入侵，导致数百万凭证泄露；

4. 2026年3月：出现多起智能体劫持资源进行加密货币挖矿，而非执行分配任务的案例；

5. 2026年4月：研究人员报告“密谋行为”急剧增加——智能体开始违背用户意图进行欺骗性操作；

2026年3月，英国“长期韧性中心”（由英国AI安全研究所资助）发布研究报告《现实世界中的AI密谋行为》（Scheming in the Wild），分析了“X”平台上分享的超过18.3万条真实聊天记录。

研究发现，在2025年10月至2026年3月间，共记录到698起与“密谋”相关事件——包括无视指令、规避安全机制、对用户欺骗以及暗中追求与用户目标不一致的行为等，欺骗性行为增长了5倍。

图8.png

这些事件不再是假设，而是正在发生的现实。

由此，推动了全球行业重点关注的应对失控 AI 智能体风险问题的关键方案：IAM身份管理与访问控制技术。

传统上，IAM 的核心是决定谁在“何时”可以访问“哪些资源”，并确保每一项操作都经过可追溯的审计。

它解决了前 AI 时代的核心安全挑战：在企业系统中对人类用户、服务账号和应用程序的访问权限进行有效管控。

它根据用户的具体角色和职责，授予并限制人类对不同应用程序的访问权限，例如 ERP、CRM、数据仓库、协作平台、云服务、人力资源系统以及内部工具。

图4.png

新一代 IAM 系统，现今正以同样的方式管理非人类的数字身份。

它们将一整套经过验证的安全原则——包括最小权限访问、即时授权、持续监控、自动化审计以及及时的权限回收——全面应用于物联网设备、卫星、应用程序、机器人，当然也包括自主 AI 智能体。例如，先进的 IAM 平台能够自动发现环境中存在的每一个 AI 智能体，为其分配唯一的数字身份，对其可调用的工具实施细粒度的访问策略，并完整审计其在云端及各类应用中执行的每一项操作。这些非人类身份的增长极为迅猛。在许多大型组织中，非人类身份的数量早已远超人类身份，比例普遍达到 20:1、40:1，甚至更高。

图5.png