10月30日·智源发布悟界·Emu3.5,开启多模态世界大模型新纪元
10月30日·周四 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
智源发布悟界·Emu3.5,开启多模态世界大模型新纪元
北京智源人工智能研究院发布了悟界·Emu3.5,这是一款多模态世界大模型,具备原生世界建模能力。Emu3.5在超过10万亿多模态Token上进行端到端预训练,学习了现实物理世界的动态规律,展现出长时程视觉指导、复杂图像编辑等高级功能。其创新的离散扩散自适应(DiDA)技术将图像推理速度提升近20倍,性能与顶级闭源扩散模型相当。此外,Emu3.5首次揭示了“多模态Scaling范式”,为人工智能发展开辟了新方向。智源研究院计划后续开源该模型,以支持社区研究。来源:微信公众号【机器之心】
Cursor 2.0携自研模型Composer发布,打破AI编程工具瓶颈
Cursor 2.0正式发布,其核心亮点是自研编码模型Composer和全新的多智能体界面。Composer是一款混合专家(MoE)模型,生成速度达到每秒250个Token,是同类前沿系统的四倍,同时在编码智能上达到前沿水平。该模型专为低延迟交互式编码设计,支持长上下文生成与理解,并通过强化学习优化软件工程任务。Cursor 2.0的新界面以“智能体”为中心,可并行运行多个智能体,互不干扰,显著提升开发效率。来源:微信公众号【机器之心】
快手EMER框架重构短视频推荐排序,实现智能进化
快手策略算法团队提出了端到端多目标融合排序EMER框架,彻底替代了传统人工设计公式的推荐排序模式。EMER通过让模型学会“比较”视频之间的相对好坏,而非单独打分,解决了个性化不足、非线性能力弱和多目标平衡难的问题。该框架引入Transformer架构捕捉视频间关联,并采用“相对满意度”和“多维满意度代理指标”定义用户满意度。其优势评估器(AE)模块可自动调整目标权重,实现模型的“自我进化”。EMER已在快手主App和极速版落地,显著提升了核心业务指标。来源:微信公众号【量子位】
SciencePedia打造知识基座,重塑知识传播与学习方式
深势科技联合多方推出了SciencePedia,一个具备“生命体征”的知识基座。与传统知识平台不同,SciencePedia基于长思维链、逆思维链搜索和人机协同进化三大核心思路,构建了动态进化的科学知识图谱。它通过还原科学发现过程、实现跨学科知识关联和人机协同更新知识,为用户提供深度、系统化的知识获取体验。SciencePedia还通过个性化学习路径、思维链可视化和实践闭环设计,重塑了教育的基本逻辑,推动了知识传播与学习方式的变革。来源:微信公众号【量子位】
字节发布通用游戏智能体Game-TARS,超越GPT-5
字节seed团队发布了通用型游戏智能体Game-TARS,该智能体通过模拟人类使用键盘和鼠标的方式玩游戏,实现了与人类用户物理交互方式的直接对齐。Game-TARS基于超过5000亿token的多模态训练数据,结合稀疏推理和衰减持续损失技术,大幅提升了智能体的可扩展性和泛化性。在FPS、开放世界、WEB游戏等任务中,Game-TARS的表现超越了GPT-5等知名模型。其训练过程包括持续预训练和后训练,重点强化了指令遵循、稀疏思维能力和长期记忆等核心能力。来源:微信公众号【量子位】