11月18日·马斯克xAI发布Grok 4.1，通用能力大幅提升

514 0 0

11月18日·周二 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

马斯克xAI发布Grok 4.1，通用能力大幅提升

近日，马斯克的人工智能公司xAI低调发布了最新模型Grok 4.1，并向所有用户开放。该模型在真实世界可用性方面显著提升，尤其在创造力、情感互动和协作交互方面表现出色，对细微意图的感知能力更强，人格更连贯。xAI通过优化模型的风格、个性等，并开发新方法利用智能体式推理模型作为奖励模型，实现大规模自主评估与迭代。在LMArena的Text Arena排行榜上，Grok 4.1的推理模式位居首位，非推理模式位居第二，大幅超越前代及其他模型。此外，在EQ-Bench3测试中，其情感智能表现优异；在创意写作基准测试中，位居前列；后训练过程中还显著降低了信息查询类提示的事实幻觉。来源：微信公众号【机器之心】

斑马口语攻克四大技术难关，推动AI Agent产业化落地

2025年，AI产业迎来关键转折，斑马推出业内首个真正实现AI外教一对一的产品「斑马口语」，在垂直行业落地AI Agent。该产品针对6 – 12岁儿童英语口语场景深度定制，攻克了四大技术难关：一是实时交互，通过全链路流式处理架构及智能调度策略等，将端到端延迟控制在1.5到2.5秒，达到真人对话自然度；二是语音识别，采用智能VAD判停策略和上下文感知，结合多种优化手段，提高发音评测精准度和抗干扰能力；三是内容输出适龄，建立多层防护体系，从模型训练到功能上线验证再到运行时监控，确保内容安全、准确；四是多模态呈现稳定，设计统一时序编排引擎，实现多种元素精确配合、自适应性能降级。斑马口语的成功为中国AI Agent产业化落地提供了范本，推动了教育赛道竞争规则的重构。来源：微信公众号【机器之心】

具身智能新突破，PI发布最强VLA模型π*0.6

美国具身智能创业公司Physical Intelligence（简称PI）发布了最新机器人基础模型π0.6。PI强调「视觉 – 语言 – 动作」（VLA）模型，通过大规模机器人感知与动作数据训练，使机器人能在未知环境中灵活执行任务。此次发布的π0.6模型，采用Recap（基于优势条件策略的经验与纠错强化学习）方法进行训练，包括模仿学习、纠正式指导和强化学习三个步骤，解决了以往仅靠模仿学习难以持续成功的问题。该模型在制作意式咖啡、折叠衣物和组装纸箱等真实世界任务中表现出色，成功率和吞吐量大幅提升，例如制作意式咖啡的成功率和吞吐量提升了两倍以上，且能连续稳定运行完成任务，为具身智能的发展带来了新的突破。来源：微信公众号【机器之心】

AI视频创作迎来“加速度”时代，拍我AI推出V5 Fast与Modify功能

AI视频创作领域迎来了重大变革，拍我AI（PixVerse）重磅上线了升级版V5 Fast，视频生成速度提升超30%，不到一分钟就能产出一条5秒的高清视频。同时，推出了「Modify」精修功能，支持端到端视频编辑，生成完还能接着改。Modify功能实现了单帧修改到全片重新理解和一致化处理的跨越，具备元素替换、局部修改和人物编辑等多种能力，如可实现实物级别的物品替换、背景替换，对风格、材质、光影等进行精确修改，还能对人物进行年龄、服装、气质等调整，让视频创作更加自由可控。V5 Fast的提速和Modify功能的推出，降低了AI视频创作门槛，提升了创作自由度，使视频生成不再慢且难以修改，让灵感得以快速实现，满足了专业团队、商用制作和普通用户的多样化需求。来源：微信公众号【量子位】

字节Seed新研究，单Transformer实现任意视图3D重建

字节Seed康炳易团队带来了最新研究成果Depth Anything 3（简称DA3），获谢赛宁盛赞。DA3仅用一个普通的视觉Transformer作为基础，通过预测深度和光线两个核心目标，实现了从一张图、一组多视角照片或一段视频中精准计算物体深度、还原相机位置，并能拼出完整3D场景，还能生成未拍摄的新视角图像。其架构简单，但性能出色，在全新打造的视觉几何基准上，相机定位精度平均提升35.7%，几何重建准确率涨了23.6%，单目深度估计超越前代DA2。DA3采用师生蒸馏策略训练，降低了对高精度标注数据的依赖。该模型在多种任务中表现出色，如能精准估计视频每帧的相机参数、生成高质量3D点云、通过散图补全视角等，在虚拟漫游、数字孪生等领域具有巨大潜力。来源：微信公众号【量子位】

# AI资讯速递