11月19日·PyTorch之父加入TML,开启新旅程
11月19日·周三 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
PyTorch之父加入TML,开启新旅程
PyTorch之父Soumith Chintala于11月17日离开Meta后,仅过一天便加入了估值500亿美元的独角兽公司Thinking Machines Lab(TML)。他在个人推文中盛赞TML的团队,并更新个人介绍,表示正在TML「创造新东西」。此前,Chintala曾表示不想一辈子做PyTorch,希望做一些小而未知的事,而TML正是他眼中值得从头开始的「未知之地」。他的加入也引发了AI社区的广泛关注,其职业生涯堪称逆袭史,从曾被多次拒之门外到如今成为行业领军人物。PyTorch在他带领下已发展为AI领域的基础设施,而他离开后,PyTorch团队也已具备韧性,不再依赖他个人解决问题。来源:微信公众号【机器之心】
Gemini 3发布,多模态推理能力再突破
谷歌的Gemini 3模型正式发布,其在多模态理解能力、交互深度等方面均表现出色,被定义为「通往AGI的重要一步」。Gemini 3 Pro在多项基准测试中超越前代及主要竞品,如在LMArena Leaderboard上以1501 Elo的高分登顶,还刷新了多模态推理的上限,在解析复杂图表和动态视频流等方面游刃有余。其Deep Think模式进一步拓展了智能边界,提升了推理和多模态理解能力。此外,Gemini 3还结合了多种模态信息,助力用户学习、开发和规划,为开发者提供了强大的工具支持,如在WebDev Arena排行榜上名列榜首。目前,Gemini 3已全面开放,普通用户和开发者可通过多种渠道使用,未来几周内深度思考模式也将上线。来源:微信公众号【机器之心】
如视发布空间大模型Argus 1.0,推动空间智能发展
如视(Realsee)于11月13日发布了空间大模型Argus 1.0,这是全球首个支持全景图输入、推测空间深度的大模型,其目标是还原真实世界,而非虚构。该模型基于如视积累的海量高质数据和Transformer架构构建,实现了兼容性、实时性与生成质量的突破。Argus 1.0是业界首个支持全景图输入的推测大模型,可将AI生成的全景图转换成点云,还广泛兼容其他图片类型。其推理效率达毫秒级,可实现全流程无感知响应。该模型的高生成质量得益于如视独有的高精度、带尺度、像素级对齐的真实数据库,使其在面对传统重建难题时表现稳定。Argus 1.0的发布是如视「空间智能」版图中的关键一步,未来版本将进一步赋能更多应用场景,如实时渲染的3DGS模型等。同时,如视计划开放大规模空间三维数据集,推动行业发展。来源:微信公众号【机器之心】
通义实验室开源AgentEvolver,助力模型自进化
阿里巴巴通义实验室开源了智能体自进化系统AgentEvolver,该系统通过自我提问、自我导航、自我归因三个模块,使模型能够在开放环境中自主演化出行为能力。在14B模型上,AgentEvolver将平均完成率从29.8%大幅提高到57.6%,在7B模型上也有显著提升,且强化后的14B模型在特定任务上表现超越更大参数量的模型。AgentEvolver还具备极速收敛的学习效率,训练步数大幅减少,其自进化能力具有极强的跨域泛化性。该系统由Master节点统一调度,实现了数据-探索-反馈的自动化闭环,通过自我提问机制主动合成训练任务,自我导航机制避免盲目试错,自我归因机制提升策略优化效率。目前,AgentEvolver已在GitHub上线,技术报告也同步发布。来源:微信公众号【量子位】
百度「文档翻译」功能强大,翻译体验佳
百度翻译中的「文档翻译」功能表现出色,在翻译准确性和排版还原度等方面均优于Google和DeepL。其支持200+种语言翻译,且能高度还原文章排版。在通用场景能力实测中,百度「文档翻译」的「AI论文精翻」功能表现突出,学术术语翻译准确,支持图片翻译和表格翻译,还能一键翻译arXiv链接。在AI辅助能力实测中,百度「文档翻译」的AI聊天框可提供快速回答、专业回答、深度思考三种模式,能总结论文重点、解释专业术语、润色文本。在文字排版能力实测中,百度「文档翻译」的排版还原度最高,支持多种文档格式导入导出。此外,其「AI译后编辑」功能可进行个性化编辑修改,提供表格视图模式,方便用户审阅和编辑。该功能为用户提供了从翻译到理解、润色、修改的一站式服务,极大地提升了翻译体验。来源:微信公众号【量子位】