Claude Mythos : Anthropic推出的最新AI模型

AI工具2小时前发布 FuturX-Editor
5 0

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

主要介绍

Claude Mythos是Anthropic于2026年4月7日正式发布的新一代AI模型,作为Project Glasswing项目的核心,该模型专为防御性网络安全工作流设计,定位高于现有旗舰Opus系列。其内部代号为“Capybara”,是Anthropic产品线中首个独立于Opus、Sonnet、Haiku的新模型层级,旨在实现推理、编码与网络安全任务的性能跃迁。Claude Mythos : Anthropic推出的最新AI模型

功能特点

  • 漏洞挖掘能力:Claude Mythos在真实生产代码中发现数千个此前未知的高危漏洞,覆盖所有主流操作系统和Web浏览器。例如,在OpenBSD中发现存在27年的漏洞,在FFmpeg中发现存在16年的漏洞。
  • 编程能力:在衡量软件工程任务的SWE-bench Verified测试中,Claude Mythos得分93.9%,显著高于Claude Opus 4.6的80.8%。
  • 学术推理能力:展现出更强的多步逻辑推导与跨领域知识整合能力,例如在研究生水平科学问答基准GPQA Diamond上得分94.6%,高于Opus 4.6的91.3%。
  • 网络安全能力:在网络安全基准CyberGym上,Claude Mythos得分83.1%,远超Opus 4.6的66.6%。在Firefox JS shell环境下,成功生成完整可利用exploit(漏洞利用代码)的比例高达72.4%,而Opus 4.6的成功率不足1%。

优缺点

优点

  • 性能卓越:在多项基准测试中显著超越前代模型,尤其在网络安全漏洞复现和编程能力方面表现突出。
  • 专用化定位:专为防御性网络安全设计,能够高效识别并修复高危漏洞,提升系统安全性。
  • 强大的推理能力:支持多步逻辑推导与跨领域知识整合,适用于复杂任务场景。

缺点

  • 潜在风险:因其强大的漏洞挖掘能力,若被恶意行为者利用,可能带来严重的安全威胁。
  • 访问限制:目前仅面向经审核的安全研究机构开放,普通用户无法直接使用。
  • 成本较高:定价为每百万tokens输入25美元、输出125美元,使用成本较高。

如何使用

  • 申请访问权限:通过Anthropic官方网站或Project Glasswing项目页面了解申请条件,提交访问申请。准入条件聚焦于管理关键软件基础设施的机构,优先考虑安全研究和防御性应用场景。
  • 使用API或兼容平台:获得访问权限后,可通过Claude API、Amazon Bedrock、Google Vertex AI和Microsoft Foundry等平台调用Claude Mythos模型。
  • 遵循使用规范:在使用过程中,需严格遵守Anthropic制定的使用规范和安全准则,确保模型输出的合法性和安全性。

框架技术原理

Claude Mythos采用统一Transformer架构,通过40层Transformer同时处理文本、视频、音频三种模态的token。其核心设计包括:

  • 单流无交叉注意力:摒弃多流架构的复杂设计,所有模态信息在统一序列中联合去噪。
  • 三明治参数布局:头4层和尾4层采用模态专属投影层,中间32层共享参数以实现高效跨模态推理。
  • 动态梯度门控:每个注意力头配备可学习标量门控,稳定多模态联合训练时的梯度反传。
  • DMD-2蒸馏技术:将去噪步数从25-50步压缩至8步,结合全图编译运行时加速,显著提升推理效率。

创新点

  • 专用化模型层级:构建独立于Opus、Sonnet、Haiku的新模型层级,实现推理、编码与网络安全任务的性能跃迁。
  • 强大的漏洞挖掘能力:能够自主建模未知零日漏洞并推演利用路径,生成对抗性检测规则,支持实时分析大规模网络流量日志。
  • 严格的安全管控机制:通过数字证书、溯源哈希及动态调用限制等手段,确保模型输出的合法性和安全性。

评估标准

  • 漏洞复现能力:在网络安全基准CyberGym上,衡量模型能否根据漏洞描述重现已知安全缺陷的能力。
  • 编程能力:通过SWE-bench Verified等测试,评估模型在软件工程任务中的表现。
  • 学术推理能力:在研究生水平科学问答基准GPQA Diamond等测试中,评估模型的多步逻辑推导与跨领域知识整合能力。
  • 自主搜索与计算机操作能力:在Terminal-Bench 2.0等任务中,评估模型的电脑操作类Agent能力。

应用领域

  • 网络安全防御:用于提前对抗“AI加速的攻防”,提升系统安全性。
  • 软件编程与审查:支持高效生成无语法错误、逻辑自洽且含结构化注释的生产级代码,提升软件工程效率。
  • 学术研究与推理:适用于需要多步逻辑推导与跨领域知识整合的复杂任务场景。
  • 红队演练与渗透测试:自动构建红蓝对抗演练场景,并根据防守方响应持续迭代攻击策略模板。

项目地址

目前,Claude Mythos没有公开的自助注册渠道,访问路径为:

  • 已获授权机构:12家创始合作方及40余家受邀机构已获访问权限。
  • 申请渠道:通过anthropic.com/glasswing了解计划详情并申请参与。
© 版权声明

相关文章

暂无评论

暂无评论...