1月12日·强化学习云登堂入室,九章云极定义后训练时代算力新标准
1月12日·周一 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
强化学习云登堂入室,九章云极定义后训练时代算力新标准
2026年,大模型训练进入“下半场”,强化学习成为突破Scaling Law瓶颈的新引擎。九章云极率先提出“强化学习云”概念,发布工业级平台Agentic RL,通过Serverless架构与万卡级异构调度,将端到端训练效率提升500%、成本降低60%。其全栈重构的Alaya NeW Cloud,已落地黄山“大位”智算中心,48天建成500PFLOPS算力,支撑“全程AI伴游”等城市场景,实现文旅产业AI闭环。公司主张“独立智算云”,不绑定模型、不与客户争利,推动开源1000专家模型,构建群体智能生态。来源:微信公众号【机器之心】
顶尖AI竟不如3岁宝宝,BabyVision测试引爆多模态视觉危机
UniPat AI联合红杉中国等发布多模态评测集BabyVision,用388道纯视觉题目衡量模型“看懂世界”的能力。结果显示,最强闭源模型Gemini3-Pro仅得49.7%,远低于人类94.1%,多数模型准确率低于3岁儿童。测试覆盖精细辨别、视觉追踪、空间感知与模式识别四大类22子任务,暴露模型在“无法用语言描述”的视觉细节、轨迹追踪、3D想象和图形归纳上的系统性短板。团队同步推出BabyVision-Gen,鼓励模型用“画图”作答,初步验证生成式视觉推理或为破局方向。来源:微信公众号【机器之心】
快手CroPS斩获AAAI 2026 Oral,打破短视频搜索信息茧房
快手搜索团队提出检索数据引擎CroPS,首次引入“跨视角正样本”打破自强化训练怪圈。方案利用用户换Query、推荐流反馈及LLM世界知识三重信号,配合层次化标签分配与H-InfoNCE损失,实现细粒度相关性建模。全量上线后,CTR提升0.869%,长播率增0.483%,换Query率降0.646%。论文已获AAAI 2026 Oral,团队未来将探索生成式检索融合,持续挖掘LLM在搜索全链路的潜力。来源:微信公众号【机器之心】
人人可采、边采边筛,穹彻RoboPocket开启具身数据众包时代
穹彻智能发布手机+夹爪终端RoboPocket,让普通人在任意场景采集具身数据。系统内置“数据价值中枢”,实时评估轨迹有效性、即时提醒纠错,并按模型能力缺口动态下发高优先级任务,实现“采集即筛选”。相比传统UMI,人均有效时长提升200%,专家介入减少60%,模型在复杂光照、遮挡环境下成功率显著提高,双臂协同与长序列操作稳定性增强。RoboPocket标志着具身数据采集从专业产线走向社会化网络,数据闭环进入“边采边筛”新阶段。来源:微信公众号【量子位】
国产开源具身模型首破50%成功率,千寻Spirit v1.5登顶RoboChallenge
千寻智能开源模型Spirit v1.5以66.09总分、50.33%成功率夺得RoboChallenge榜首,终结Pi0.5领跑时代,成为首个成功率破五成的具身模型。其在插花、水果入篮、挂牙刷杯等九项任务夺魁,寻找绿盒任务成功率高达90%。核心秘诀在于“弱控制、高多样”预训练:采集员自由完成目标,不强制固定轨迹,数据覆盖抓取、双臂协作、异常处理等原子技能,微调效率提升40%。模型、代码、权重全开源,可复现、可商用,为社区提供新基准。来源:微信公众号【量子位】