10月30日·智源发布悟界·Emu3.5，开启多模态世界大模型新纪元

169 0 0

10月30日·周四 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

智源发布悟界·Emu3.5，开启多模态世界大模型新纪元

北京智源人工智能研究院发布了悟界·Emu3.5，这是一款多模态世界大模型，具备原生世界建模能力。Emu3.5在超过10万亿多模态Token上进行端到端预训练，学习了现实物理世界的动态规律，展现出长时程视觉指导、复杂图像编辑等高级功能。其创新的离散扩散自适应（DiDA）技术将图像推理速度提升近20倍，性能与顶级闭源扩散模型相当。此外，Emu3.5首次揭示了“多模态Scaling范式”，为人工智能发展开辟了新方向。智源研究院计划后续开源该模型，以支持社区研究。来源：微信公众号【机器之心】

Cursor 2.0携自研模型Composer发布，打破AI编程工具瓶颈

Cursor 2.0正式发布，其核心亮点是自研编码模型Composer和全新的多智能体界面。Composer是一款混合专家（MoE）模型，生成速度达到每秒250个Token，是同类前沿系统的四倍，同时在编码智能上达到前沿水平。该模型专为低延迟交互式编码设计，支持长上下文生成与理解，并通过强化学习优化软件工程任务。Cursor 2.0的新界面以“智能体”为中心，可并行运行多个智能体，互不干扰，显著提升开发效率。来源：微信公众号【机器之心】

快手EMER框架重构短视频推荐排序，实现智能进化

快手策略算法团队提出了端到端多目标融合排序EMER框架，彻底替代了传统人工设计公式的推荐排序模式。EMER通过让模型学会“比较”视频之间的相对好坏，而非单独打分，解决了个性化不足、非线性能力弱和多目标平衡难的问题。该框架引入Transformer架构捕捉视频间关联，并采用“相对满意度”和“多维满意度代理指标”定义用户满意度。其优势评估器（AE）模块可自动调整目标权重，实现模型的“自我进化”。EMER已在快手主App和极速版落地，显著提升了核心业务指标。来源：微信公众号【量子位】

SciencePedia打造知识基座，重塑知识传播与学习方式

深势科技联合多方推出了SciencePedia，一个具备“生命体征”的知识基座。与传统知识平台不同，SciencePedia基于长思维链、逆思维链搜索和人机协同进化三大核心思路，构建了动态进化的科学知识图谱。它通过还原科学发现过程、实现跨学科知识关联和人机协同更新知识，为用户提供深度、系统化的知识获取体验。SciencePedia还通过个性化学习路径、思维链可视化和实践闭环设计，重塑了教育的基本逻辑，推动了知识传播与学习方式的变革。来源：微信公众号【量子位】

字节发布通用游戏智能体Game-TARS，超越GPT-5

字节seed团队发布了通用型游戏智能体Game-TARS，该智能体通过模拟人类使用键盘和鼠标的方式玩游戏，实现了与人类用户物理交互方式的直接对齐。Game-TARS基于超过5000亿token的多模态训练数据，结合稀疏推理和衰减持续损失技术，大幅提升了智能体的可扩展性和泛化性。在FPS、开放世界、WEB游戏等任务中，Game-TARS的表现超越了GPT-5等知名模型。其训练过程包括持续预训练和后训练，重点强化了指令遵循、稀疏思维能力和长期记忆等核心能力。来源：微信公众号【量子位】