U2 ：云知声推出的原生智能体大模型

184 0 0

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

主要介绍

U2 是云知声于 2026 年 6 月 8 日正式发布的新一代通用大语言模型，定位为原生智能体大模型，核心技术主张为”高智能密度 × 高Token价值”。它不再盲目堆叠参数，而是用更少激活资源承载更强能力；不再比拼输出长度，而是让每次调用更接近交付结果。与传统大模型偏向单轮问答不同，U2 强调面向真实任务的连续执行能力，能够自主拆解并推进 100+ 步复杂工作流，将需求理解、任务规划、环境交互、工具调用、过程纠错与结果验收串联为完整闭环，真正实现从”给出答案”到”完成任务”的跨越。模型采用基于快慢思考融合的 MoE 混合专家架构，参数规模约 2660 亿，已在多项权威评测中进入主流模型第一梯队。 U2 ：云知声推出的原生智能体大模型

功能特点

100+ 步长链路自主执行：不是单轮问答，而是能连续推进超百步的复杂真实工作流
三大核心能力驱动：Reasoning（低偏差长程推理）、Coding（端到端工程交付）、Agent（多工具协同与长流程编排）
混合思考机制：同一推理过程中根据任务阶段动态切换显式与隐式推理，而非二选一
高知识密度底座：通过数据精筛提纯 + 稀疏知识编码 + 知识蒸馏，压缩冗余参数
Agent-Harness 协同训练：执行框架与模型能力纳入同一训练闭环，共同进化
全场景覆盖：响应式网页开发、移动端 Web App、行业研究、游戏开发、企业办公等

优缺点

优点：

评测硬核：GPQA Diamond 87.9 分、SWE-Bench Verified 75 分、Claw-Eval 76.9 分、GDPval 72.9 分，四项均进入第一梯队
Token 效率高：”少 Token，深思考”，隐空间完成高消耗探索，显式推理负责关键验证
真正面向任务交付而非聊天，适合放入真实工作流检验
混合思考 + 熵感知切换，兼顾效率与可控性

缺点：

MoE 架构在极端长尾场景下的稳定性仍需更多验证
混合思考机制增加了系统复杂度，调试和运维门槛高于传统模型
目前公开信息中未披露推理成本的绝对数值，性价比需实际使用后评估

如何使用

访问云知声 Token Hub：打开 https://tokenhub.unisound.com（或搜索”云知声 Token Hub”）
注册/登录：支持个人用户、开发者和企业组织三种身份
选择场景：目前已开放的典型场景包括——
- 响应式网页开发：输入需求，直接生成多页面网站并一键部署
- 移动端 Web App：描述功能，生成类原生社交应用
- 行业研究：上传文档，输出结构化研究报告（HTML/PPT/Word）
- 游戏开发：描述玩法，交付可玩的 HTML5 游戏（如俄罗斯方块）
- 企业办公：自动生成经营分析报告、季度复盘等
输入自然语言需求，模型会自主拆解任务、调用工具、迭代纠错，最终交付完整成果

框架技术原理

U2 的技术架构可分为三层：

层级	核心机制	作用
模型层	MoE 混合专家架构（快慢思考融合）	用 2660 亿参数实现顶级性能，激活资源按需分配
推理层	混合思考机制（Bounded Latent Rollout + Entropy-aware Switching）	任务早期在隐空间高效探索，关键节点切换显式推理；根据不确定性动态调整
训练层	Agent-Harness 协同训练 + 课程学习 + 过程监督 + 轨迹对比 + 多维奖励	Harness 不是外部套壳，而是与模型共同进化；真实执行轨迹反哺模型能力

知识底座通过高知识密度数据精筛提纯过滤重复/低质/幻觉数据，结合稀疏知识编码与知识蒸馏压缩冗余参数，将高价值知识固化到高效结构中。

任务交付闭环路径：理解规划 → 执行协作 → 校验交付，由 Reasoning、Coding、Agent 三大能力共同支撑。

创新点

混合思考机制：不是显式 CoT 与隐式推理二选一，而是同一过程中动态切换，重构了”探索归隐空间、验证归显式推理”的分工
熵感知切换（Entropy-aware Switching）：根据推理不确定性自动决定思考形态，隐式稳定时保持高效，不确定性升高时及时回到显式链路
Agent-Harness 协同进化：打破”Harness 只是外部套壳”的惯例，将执行框架纳入训练闭环，真实轨迹持续强化模型
高智能密度 × 高Token价值：重新定义大模型价值标准——不比参数规模和输出长度，比每一次调用离交付结果有多近
原生智能体定位：从设计之初就不是聊天模型，而是面向任务执行的 Agent 基座

评估标准

评测基准	分数	对比表现	考察维度
GPQA Diamond	87.9	超过 GLM-5.1、DeepSeek-V4-Flash、MiniMax M2.7	知识与复杂推理
SWE-Bench Verified	75	主流模型第一梯队	真实软件工程能力
Claw-Eval (pass@3)	76.9	超过 Hy3 preview、DeepSeek-V4-Flash、MiniMax M2.7	Agent 端到端执行
GDPval	72.9	—	真实办公交付（报告/表格/图表/PPT）

四项评测覆盖推理、代码、Agent、办公四个维度，形成系统性第一梯队表现。

应用领域

领域	典型场景
前端开发与产品设计	响应式多页面网站、移动端 Web App、设计规范自动落地
深度研究与政策分析	跨平台数据检索清洗、结构化研究报告输出（Word/PPT/HTML）
软件工程	算法设计 → 代码编写 → 环境调试 → 自主 Debug 全闭环
游戏开发	独立完成俄罗斯方块、多摆混沌模拟器等可玩 HTML5 游戏
企业办公	经营分析报告、季度复盘报告、数据可视化看板自动生成
数据可视化	自动生成时间轴、趋势曲线、热力图等可交互图表

项目地址

资源	链接
🌐 Token Hub（在线使用）	https://tokenhub.unisound.com
📄 百度百科	https://baike..com/item/U2大模型/67922342
📰 官方发布新闻	https://www.pingwest.com/w/314445