Ring-1T-preview : 蚂蚁百灵开源的万亿参数推理大模型

AI工具3小时前发布 FuturX-Editor
5 0

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

主要介绍

Ring-1T-preview是蚂蚁集团于2025年9月30日开源的全球首个万亿参数自然语言推理大模型,隶属于蚂蚁百灵团队研发的Ling2.0家族。作为万亿参数推理大模型Ring-1T的预览版,它采用Ling-2.0 MoE架构,基于20T高质量语料预训练,并通过自研强化学习系统ASystem进行推理能力优化。该模型在AIME25、CodeForces等权威测试中表现卓越,超越已知开源模型及Gemini 2.5 Pro,接近GPT-5水平,标志着国产大模型在复杂推理能力上的重大突破。

Ring-1T-preview : 蚂蚁百灵开源的万亿参数推理大模型

功能特点

  1. 卓越的自然语言推理能力:在AIME25测试中获92.6分,接近GPT-5的94.6分;在IMO2025测试中一次性解出第三题,其他题目给出部分正确答案。
  2. 强大的代码生成能力:在CodeForces测试中以94.69分超越GPT-5,LiveCodeBench及ARC-AGI-v1榜单中位列开源模型首位。
  3. 多领域竞争力:在HMMT2025、LiveCodeBench v6等任务中表现突出,适用于金融风控、智能客服、内容生成等场景。
  4. 开源协作模式:代码与权重完全开源,发布于Hugging Face平台,便于社区探索与反馈,加速模型迭代。

优缺点

  • 优点
    • 推理能力国际领先,接近GPT-5水平。
    • 代码生成能力突出,超越GPT-5。
    • 开源模式降低技术门槛,促进全球开发者协作。
  • 缺点
    • 预览版存在语种混杂、推理重复、身份认知错误等问题。
    • 工具调用依赖外部资源,可能受限于第三方服务稳定性。

如何使用

  1. 学术研究:研究者和开发者可基于Hugging Face平台下载模型,进行推理任务测试与优化。
  2. 行业应用:企业可通过模型接入金融风控、智能客服等系统,提升效率与准确性。
  3. 社区反馈:开发者可参与模型优化,通过开源社区提交问题与改进建议,共同完善功能。

框架技术原理

  1. Ling-2.0 MoE架构:采用混合专家模型,结合万亿参数规模,提升表达能力和计算效率。
  2. 预训练语料:基于20T高质量语料训练,确保模型学习丰富语言知识和模式。
  3. 强化学习训练:通过自研ASystem系统进行RLVR训练,优化推理与决策能力。
  4. 多智能体框架接入:接入AWorld框架,支持复杂推理任务测试与探索。

创新点

  1. 全球首个开源万亿参数推理大模型:填补开源领域空白,推动大模型生态透明化与协作创新。
  2. 推理能力国际领先:在AIME25、CodeForces等测试中表现卓越,接近GPT-5水平。
  3. 开源协作模式:通过完全开源协议,吸引全球开发者参与,加速技术迭代与应用落地。

评估标准

  1. 推理能力:在AIME25、IMO2025等测试中的得分与解题表现。
  2. 代码生成能力:在CodeForces、LiveCodeBench等任务中的准确性与效率。
  3. 多领域适应性:在HMMT2025、ARC-AGI-v1等任务中的竞争力。
  4. 开源社区反馈:开发者参与度、问题提交量与改进建议质量。

应用领域

  1. 金融风控:通过推理能力识别潜在风险,提升决策准确性。
  2. 智能客服:理解用户问题,提供精准解答与建议。
  3. 内容生成:辅助写作、翻译等任务,提升效率与质量。
  4. 科研教育:支持数学竞赛、代码生成等教学与研究场景。

项目地址

© 版权声明

相关文章

暂无评论

暂无评论...