10月1日·Thinking Machines 推出首款产品 Tinker,简化大模型微调流程
10月1日·周四 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
Thinking Machines 推出首款产品 Tinker,简化大模型微调流程
由OpenAI前CTO Mira Murati创立的Thinking Machines发布了首款产品——Tinker。Tinker是一个用于微调语言模型的API,开发者只需专注于训练数据和算法,而调度、调优、资源管理和可靠性等基础设施相关问题均由Tinker搞定,大大简化了LLM的后训练过程。Tinker支持多种前沿模型,如Qwen-235B-A22B等,并且使用LoRA技术降低成本。此外,Tinker还开源了Tinker Cookbook,包含多种后训练方法的实现。目前,普林斯顿大学、斯坦福大学、加州大学伯克利分校和Redwood Research等团队已使用Tinker取得了显著成果。来源:微信公众号【机器之心】

小红书发布 FireRedChat,首个可私有化部署的全双工语音交互系统
小红书智创音频团队推出了FireRedChat,这是业内首个支持私有化部署的全双工大模型语音交互系统。该系统基于“交互控制器+交互模块+对话管理器”的架构,集成自研流式个性化打断pVAD、语义判停EoT等核心模型,提供级联与半级联两种部署方案,覆盖不同需求。实验结果显示,FireRedChat在多项关键指标上领先其他开源框架,显著提升了实时性、鲁棒性和可控性。此外,该系统还具备情绪感知与情感合成能力,让AI聊天助手更加“知冷暖、能共情、懂表达”。来源:微信公众号【机器之心】

Sora2 展现强大能力,可预测 ChatGPT 输出并渲染 HTML
Sora2再次引发关注,其不仅能够生成高质量的视频,还能预测ChatGPT的输出并渲染HTML代码。在测试中,Sora2模拟了与ChatGPT的交互,生成了符合要求的俳句,并以ChatGPT的机械女声回应。此外,Sora2还能准确渲染HTML代码,甚至在未明确提示的情况下主动体现玻璃折射现象。这些表现让网友惊叹,认为Sora2模糊了视频生成和交互式AI的边界,其背后可能基于LLM训练,展现了强大的信息处理能力。来源:微信公众号【量子位】

银河通用推出 Any2Track,机器人“狂踹不倒”成现实
银河通用发布了Any2Track,这是一个全新的通用动作追踪框架,能够让机器人在复杂干扰下精确模仿人类动作。Any2Track通过二阶段强化学习框架实现精准动作模仿与抗干扰能力,超越了传统方法。该框架包括AnyTracker和AnyAdapter两个阶段,前者负责通用动作追踪,后者实现在线动力学适应性。实验显示,Any2Track在多种干扰条件下均表现出色,稳定性极强。此外,银河通用还推出了“银河太空舱”,将机器人技术推向街头巷尾,实现具身智能的商业化落地。来源:微信公众号【量子位】

英伟达开源多项机器人技术,助力机器人研发
英伟达在机器人学习大会(CoRL)上宣布了一系列开源技术,旨在推动机器人研发。其中最引人注目的是与Google DeepMind和迪士尼研究院合作开发的物理引擎Newton,该引擎基于英伟达的Warp和OpenUSD框架构建,采用GPU加速技术,能够仿真复杂机器人动作,如在雪地或碎石路面行走、操控杯子和水果等细腻动作。此外,英伟达还发布了Isaac GR00T N1.6基础模型,赋予机器人类似人类的推理能力,能够将模糊指令转化为可执行计划。同时,Cosmos世界基础模型能够生成海量训练数据,解决机器人研发中的数据稀缺问题。这些技术的开源,得到了包括Boston Dynamics、Figure AI等顶尖机器人公司以及斯坦福、苏黎世联邦理工等知名高校的关注和使用。来源:微信公众号【量子位】
