11月19日·PyTorch之父加入TML，开启新旅程

543 0 0

11月19日·周三 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

PyTorch之父加入TML，开启新旅程

PyTorch之父 Soumith Chintala于11月17日离开Meta后，仅过一天便加入了估值500亿美元的独角兽公司Thinking Machines Lab（TML）。他在个人推文中盛赞TML的团队，并更新个人介绍，表示正在TML「创造新东西」。此前，Chintala曾表示不想一辈子做PyTorch，希望做一些小而未知的事，而TML正是他眼中值得从头开始的「未知之地」。他的加入也引发了AI社区的广泛关注，其职业生涯堪称逆袭史，从曾被多次拒之门外到如今成为行业领军人物。PyTorch在他带领下已发展为AI领域的基础设施，而他离开后，PyTorch团队也已具备韧性，不再依赖他个人解决问题。来源：微信公众号【机器之心】

Gemini 3发布，多模态推理能力再突破

谷歌的Gemini 3模型正式发布，其在多模态理解能力、交互深度等方面均表现出色，被定义为「通往AGI的重要一步」。Gemini 3 Pro在多项基准测试中超越前代及主要竞品，如在LMArena Leaderboard上以1501 Elo的高分登顶，还刷新了多模态推理的上限，在解析复杂图表和动态视频流等方面游刃有余。其Deep Think模式进一步拓展了智能边界，提升了推理和多模态理解能力。此外，Gemini 3还结合了多种模态信息，助力用户学习、开发和规划，为开发者提供了强大的工具支持，如在WebDev Arena排行榜上名列榜首。目前，Gemini 3已全面开放，普通用户和开发者可通过多种渠道使用，未来几周内深度思考模式也将上线。来源：微信公众号【机器之心】

如视发布空间大模型Argus 1.0，推动空间智能发展

如视（Realsee）于11月13日发布了空间大模型Argus 1.0，这是全球首个支持全景图输入、推测空间深度的大模型，其目标是还原真实世界，而非虚构。该模型基于如视积累的海量高质数据和Transformer架构构建，实现了兼容性、实时性与生成质量的突破。Argus 1.0是业界首个支持全景图输入的推测大模型，可将AI生成的全景图转换成点云，还广泛兼容其他图片类型。其推理效率达毫秒级，可实现全流程无感知响应。该模型的高生成质量得益于如视独有的高精度、带尺度、像素级对齐的真实数据库，使其在面对传统重建难题时表现稳定。Argus 1.0的发布是如视「空间智能」版图中的关键一步，未来版本将进一步赋能更多应用场景，如实时渲染的3DGS模型等。同时，如视计划开放大规模空间三维数据集，推动行业发展。来源：微信公众号【机器之心】

通义实验室开源AgentEvolver，助力模型自进化

阿里巴巴通义实验室开源了智能体自进化系统AgentEvolver，该系统通过自我提问、自我导航、自我归因三个模块，使模型能够在开放环境中自主演化出行为能力。在14B模型上，AgentEvolver将平均完成率从29.8%大幅提高到57.6%，在7B模型上也有显著提升，且强化后的14B模型在特定任务上表现超越更大参数量的模型。AgentEvolver还具备极速收敛的学习效率，训练步数大幅减少，其自进化能力具有极强的跨域泛化性。该系统由Master节点统一调度，实现了数据-探索-反馈的自动化闭环，通过自我提问机制主动合成训练任务，自我导航机制避免盲目试错，自我归因机制提升策略优化效率。目前，AgentEvolver已在GitHub上线，技术报告也同步发布。来源：微信公众号【量子位】

百度「文档翻译」功能强大，翻译体验佳

百度翻译中的「文档翻译」功能表现出色，在翻译准确性和排版还原度等方面均优于Google和DeepL。其支持200+种语言翻译，且能高度还原文章排版。在通用场景能力实测中，百度「文档翻译」的「AI论文精翻」功能表现突出，学术术语翻译准确，支持图片翻译和表格翻译，还能一键翻译arXiv链接。在AI辅助能力实测中，百度「文档翻译」的AI聊天框可提供快速回答、专业回答、深度思考三种模式，能总结论文重点、解释专业术语、润色文本。在文字排版能力实测中，百度「文档翻译」的排版还原度最高，支持多种文档格式导入导出。此外，其「AI译后编辑」功能可进行个性化编辑修改，提供表格视图模式，方便用户审阅和编辑。该功能为用户提供了从翻译到理解、润色、修改的一站式服务，极大地提升了翻译体验。来源：微信公众号【量子位】