五眼联盟警告：可推翻政府的AI模型数月内或将问世

五眼联盟（美国、英国、加拿大、澳大利亚和新西兰）发布联合警告，称具备颠覆政府能力的AI模型可能在数月内出现。该报告特别点名Anthropic的Claude模型，指出前沿人工智能系统的危险性正快速上升，可能被用于网络攻击、信息战和关键基础设施破坏，对国家安全构成前所未有的威胁。

背景速读

- Anthropic 是一家人工智能初创公司，由前 OpenAI 员工创立，其旗舰模型 Claude 以注重安全性和"有用、诚实、无害"原则著称。 - "Five Eyes"（五眼联盟）是由美国、英国、加拿大、澳大利亚和新西兰组成的情报共享联盟，其安全警告具有很高的政策影响力。 - 这篇报道的核心信息：五眼联盟情报机构警告，最先进的 AI 模型（如未来版本的 Claude）可能在数月内具备协助策划生物攻击、网络攻击或社会操控的能力，足以威胁国家稳定甚至"颠覆政府"。 - 这标志着 AI 安全讨论从理论风险转向紧迫的政策议题：政府开始严肃考虑对前沿模型实施监管、测试和出口控制，尤其是针对"通用"能力（AI 模型不限于聊天，还能推理、规划和调用工具）。