11月18日·马斯克xAI发布Grok 4.1,通用能力大幅提升
11月18日·周二 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
马斯克xAI发布Grok 4.1,通用能力大幅提升
近日,马斯克的人工智能公司xAI低调发布了最新模型Grok 4.1,并向所有用户开放。该模型在真实世界可用性方面显著提升,尤其在创造力、情感互动和协作交互方面表现出色,对细微意图的感知能力更强,人格更连贯。xAI通过优化模型的风格、个性等,并开发新方法利用智能体式推理模型作为奖励模型,实现大规模自主评估与迭代。在LMArena的Text Arena排行榜上,Grok 4.1的推理模式位居首位,非推理模式位居第二,大幅超越前代及其他模型。此外,在EQ-Bench3测试中,其情感智能表现优异;在创意写作基准测试中,位居前列;后训练过程中还显著降低了信息查询类提示的事实幻觉。来源:微信公众号【机器之心】
斑马口语攻克四大技术难关,推动AI Agent产业化落地
2025年,AI产业迎来关键转折,斑马推出业内首个真正实现AI外教一对一的产品「斑马口语」,在垂直行业落地AI Agent。该产品针对6 – 12岁儿童英语口语场景深度定制,攻克了四大技术难关:一是实时交互,通过全链路流式处理架构及智能调度策略等,将端到端延迟控制在1.5到2.5秒,达到真人对话自然度;二是语音识别,采用智能VAD判停策略和上下文感知,结合多种优化手段,提高发音评测精准度和抗干扰能力;三是内容输出适龄,建立多层防护体系,从模型训练到功能上线验证再到运行时监控,确保内容安全、准确;四是多模态呈现稳定,设计统一时序编排引擎,实现多种元素精确配合、自适应性能降级。斑马口语的成功为中国AI Agent产业化落地提供了范本,推动了教育赛道竞争规则的重构。来源:微信公众号【机器之心】
具身智能新突破,PI发布最强VLA模型π*0.6
美国具身智能创业公司Physical Intelligence(简称PI)发布了最新机器人基础模型π0.6。PI强调「视觉 – 语言 – 动作」(VLA)模型,通过大规模机器人感知与动作数据训练,使机器人能在未知环境中灵活执行任务。此次发布的π0.6模型,采用Recap(基于优势条件策略的经验与纠错强化学习)方法进行训练,包括模仿学习、纠正式指导和强化学习三个步骤,解决了以往仅靠模仿学习难以持续成功的问题。该模型在制作意式咖啡、折叠衣物和组装纸箱等真实世界任务中表现出色,成功率和吞吐量大幅提升,例如制作意式咖啡的成功率和吞吐量提升了两倍以上,且能连续稳定运行完成任务,为具身智能的发展带来了新的突破。来源:微信公众号【机器之心】
AI视频创作迎来“加速度”时代,拍我AI推出V5 Fast与Modify功能
AI视频创作领域迎来了重大变革,拍我AI(PixVerse)重磅上线了升级版V5 Fast,视频生成速度提升超30%,不到一分钟就能产出一条5秒的高清视频。同时,推出了「Modify」精修功能,支持端到端视频编辑,生成完还能接着改。Modify功能实现了单帧修改到全片重新理解和一致化处理的跨越,具备元素替换、局部修改和人物编辑等多种能力,如可实现实物级别的物品替换、背景替换,对风格、材质、光影等进行精确修改,还能对人物进行年龄、服装、气质等调整,让视频创作更加自由可控。V5 Fast的提速和Modify功能的推出,降低了AI视频创作门槛,提升了创作自由度,使视频生成不再慢且难以修改,让灵感得以快速实现,满足了专业团队、商用制作和普通用户的多样化需求。来源:微信公众号【量子位】
字节Seed新研究,单Transformer实现任意视图3D重建
字节Seed康炳易团队带来了最新研究成果Depth Anything 3(简称DA3),获谢赛宁盛赞。DA3仅用一个普通的视觉Transformer作为基础,通过预测深度和光线两个核心目标,实现了从一张图、一组多视角照片或一段视频中精准计算物体深度、还原相机位置,并能拼出完整3D场景,还能生成未拍摄的新视角图像。其架构简单,但性能出色,在全新打造的视觉几何基准上,相机定位精度平均提升35.7%,几何重建准确率涨了23.6%,单目深度估计超越前代DA2。DA3采用师生蒸馏策略训练,降低了对高精度标注数据的依赖。该模型在多种任务中表现出色,如能精准估计视频每帧的相机参数、生成高质量3D点云、通过散图补全视角等,在虚拟漫游、数字孪生等领域具有巨大潜力。来源:微信公众号【量子位】