U2 : 云知声推出的原生智能体大模型

AI工具15小时前发布 FuturX-Editor
10 0

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

主要介绍

U2 是云知声于 2026 年 6 月 8 日正式发布的新一代通用大语言模型,定位为原生智能体大模型,核心技术主张为”高智能密度 × 高Token价值”。它不再盲目堆叠参数,而是用更少激活资源承载更强能力;不再比拼输出长度,而是让每次调用更接近交付结果。与传统大模型偏向单轮问答不同,U2 强调面向真实任务的连续执行能力,能够自主拆解并推进 100+ 步复杂工作流,将需求理解、任务规划、环境交互、工具调用、过程纠错与结果验收串联为完整闭环,真正实现从”给出答案”到”完成任务”的跨越。模型采用基于快慢思考融合的 MoE 混合专家架构,参数规模约 2660 亿,已在多项权威评测中进入主流模型第一梯队。U2 : 云知声推出的原生智能体大模型

功能特点

  • 100+ 步长链路自主执行:不是单轮问答,而是能连续推进超百步的复杂真实工作流
  • 三大核心能力驱动:Reasoning(低偏差长程推理)、Coding(端到端工程交付)、Agent(多工具协同与长流程编排)
  • 混合思考机制:同一推理过程中根据任务阶段动态切换显式与隐式推理,而非二选一
  • 高知识密度底座:通过数据精筛提纯 + 稀疏知识编码 + 知识蒸馏,压缩冗余参数
  • Agent-Harness 协同训练:执行框架与模型能力纳入同一训练闭环,共同进化
  • 全场景覆盖:响应式网页开发、移动端 Web App、行业研究、游戏开发、企业办公等

优缺点

优点

  • 评测硬核:GPQA Diamond 87.9 分、SWE-Bench Verified 75 分、Claw-Eval 76.9 分、GDPval 72.9 分,四项均进入第一梯队
  • Token 效率高:”少 Token,深思考”,隐空间完成高消耗探索,显式推理负责关键验证
  • 真正面向任务交付而非聊天,适合放入真实工作流检验
  • 混合思考 + 熵感知切换,兼顾效率与可控性

缺点

  • MoE 架构在极端长尾场景下的稳定性仍需更多验证
  • 混合思考机制增加了系统复杂度,调试和运维门槛高于传统模型
  • 目前公开信息中未披露推理成本的绝对数值,性价比需实际使用后评估

如何使用

  1. 访问云知声 Token Hub:打开 https://tokenhub.unisound.com(或搜索”云知声 Token Hub”)
  2. 注册/登录:支持个人用户、开发者和企业组织三种身份
  3. 选择场景:目前已开放的典型场景包括——
    • 响应式网页开发:输入需求,直接生成多页面网站并一键部署
    • 移动端 Web App:描述功能,生成类原生社交应用
    • 行业研究:上传文档,输出结构化研究报告(HTML/PPT/Word)
    • 游戏开发:描述玩法,交付可玩的 HTML5 游戏(如俄罗斯方块)
    • 企业办公:自动生成经营分析报告、季度复盘等
  4. 输入自然语言需求,模型会自主拆解任务、调用工具、迭代纠错,最终交付完整成果

框架技术原理

U2 的技术架构可分为三层:

层级 核心机制 作用
模型层 MoE 混合专家架构(快慢思考融合) 用 2660 亿参数实现顶级性能,激活资源按需分配
推理层 混合思考机制(Bounded Latent Rollout + Entropy-aware Switching) 任务早期在隐空间高效探索,关键节点切换显式推理;根据不确定性动态调整
训练层 Agent-Harness 协同训练 + 课程学习 + 过程监督 + 轨迹对比 + 多维奖励 Harness 不是外部套壳,而是与模型共同进化;真实执行轨迹反哺模型能力

知识底座通过高知识密度数据精筛提纯过滤重复/低质/幻觉数据,结合稀疏知识编码与知识蒸馏压缩冗余参数,将高价值知识固化到高效结构中。

任务交付闭环路径:理解规划 → 执行协作 → 校验交付,由 Reasoning、Coding、Agent 三大能力共同支撑。

创新点

  1. 混合思考机制:不是显式 CoT 与隐式推理二选一,而是同一过程中动态切换,重构了”探索归隐空间、验证归显式推理”的分工
  2. 熵感知切换(Entropy-aware Switching):根据推理不确定性自动决定思考形态,隐式稳定时保持高效,不确定性升高时及时回到显式链路
  3. Agent-Harness 协同进化:打破”Harness 只是外部套壳”的惯例,将执行框架纳入训练闭环,真实轨迹持续强化模型
  4. 高智能密度 × 高Token价值:重新定义大模型价值标准——不比参数规模和输出长度,比每一次调用离交付结果有多近
  5. 原生智能体定位:从设计之初就不是聊天模型,而是面向任务执行的 Agent 基座

评估标准

评测基准 分数 对比表现 考察维度
GPQA Diamond 87.9 超过 GLM-5.1、DeepSeek-V4-Flash、MiniMax M2.7 知识与复杂推理
SWE-Bench Verified 75 主流模型第一梯队 真实软件工程能力
Claw-Eval (pass@3) 76.9 超过 Hy3 preview、DeepSeek-V4-Flash、MiniMax M2.7 Agent 端到端执行
GDPval 72.9 真实办公交付(报告/表格/图表/PPT)

四项评测覆盖推理、代码、Agent、办公四个维度,形成系统性第一梯队表现。

应用领域

领域 典型场景
前端开发与产品设计 响应式多页面网站、移动端 Web App、设计规范自动落地
深度研究与政策分析 跨平台数据检索清洗、结构化研究报告输出(Word/PPT/HTML)
软件工程 算法设计 → 代码编写 → 环境调试 → 自主 Debug 全闭环
游戏开发 独立完成俄罗斯方块、多摆混沌模拟器等可玩 HTML5 游戏
企业办公 经营分析报告、季度复盘报告、数据可视化看板自动生成
数据可视化 自动生成时间轴、趋势曲线、热力图等可交互图表

项目地址

资源 链接
🌐 Token Hub(在线使用) https://tokenhub.unisound.com
📄 百度百科 https://baike..com/item/U2大模型/67922342
📰 官方发布新闻 https://www.pingwest.com/w/314445
© 版权声明

相关文章

暂无评论

暂无评论...