2月5日·CMU与英伟达合作，人形机器人实现高难度动作复刻

AI资讯速递1年前 (2025)发布 FuturX-Editor

586 0 0

2月5日·周三 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

CMU与英伟达合作，人形机器人实现高难度动作复刻

卡内基梅隆大学（CMU）与英伟达的研究团队共同提出了一种名为ASAP（Aligning Simulation and Real Physics）的「real2sim2real」模型，成功让人形机器人复刻了科比、C罗、詹姆斯等名人的招牌动作，甚至完成了侧跳、深蹲、APT舞等高难度动作。该模型通过预训练和后训练两大阶段，利用真实世界数据训练delta动作模型，弥补仿真与现实的动力学差异，最终实现敏捷、稳定的全身控制动作。研究团队还开源了相关代码，助力人形机器人技术的进一步发展。未来，人形机器人有望在更多复杂场景中实现高度灵活的运动。来源：微信公众号【新智元】

Tülu 3横空出世，强化学习助力开源模型突破性能瓶颈

美国艾伦人工智能研究所（Ai2）推出了新一代开源模型 Tülu 3 405B，凭借强化学习技术，在多项基准测试中超越了DeepSeek v3和GPT-4o等先进模型。Tülu 3采用四阶段后训练方法，包括精心策划的提示词微调、监督微调、偏好微调以及独创的可验证奖励强化学习（RLVR），尤其在数学问题求解和指令遵循等任务上表现突出。该模型不仅开源了训练数据、代码和方法，还支持本地部署，为研究人员和开发者提供了强大的工具。尽管在部分任务上仍有提升空间，但Tülu 3的推出标志着开源模型在性能和灵活性上的重要突破，为未来的人工智能研究和应用开辟了新的道路。来源：微信公众号【新智元】

AI编程分级来袭，从代码补全到全流程自动化

AI正在重塑编程领域，从简单的代码补全到复杂的全流程自动化，AI编程工具被划分为L1到L5五个等级。L1级工具如GitHub Copilot，主要提供代码补全功能，帮助开发者简化重复性编码任务。L2级工具如ChatGPT，能够处理任务级自动化，包括开发新功能、修复漏洞等，但需要精心设计提示词。L3级工具如Codegen和Sweep，可实现项目级自动化，通过集成项目管理工具和代码平台，完成从需求到部署的多步骤流程。L4级工具如Devin，标志着AI驱动软件开发的转变，能够实现从需求到生产部署的完全自动化。L5级则是AI开发团队，多个AI代理协作完成项目，未来有望实现高度自动化的软件开发。开发者可根据自身需求选择不同级别的工具，AI正逐步改变软件开发的未来。来源：微信公众号【新智元】

字节跳动OmniHuman，一张图+音频即可生成生动视频

字节跳动数字人团队推出了一项名为OmniHuman的新技术，能够仅用一张图片和一段音频生成高质量的人物视频。该技术基于混合多模态训练策略，支持肖像、半身、全身等多种人物占比和图片尺寸，生成的人物视频自然生动，动作与音频匹配度高，甚至在手势生成和非真人图片（如动漫、3D卡通）输入方面也有出色表现。OmniHuman通过创新的Omni-Conditions Training方法，解决了以往技术中高质量数据稀缺、生成效果自然度低等问题，显著提升了视频生成的多样性和自然度。该技术已落地即梦AI，相关功能即将开启测试，标志着AI在多模态内容生成领域迈出了重要一步。来源：微信公众号【机器之心】

斯坦福新成果s1，仅用1000样本超越o1，AI推理效率大幅提升

斯坦福大学、华盛顿大学等机构的研究人员提出了一种名为s1的新方法，仅用1000个样本训练，就实现了超越OpenAI的o1模型的推理性能。s1通过“预算强制”技术控制测试时间计算，强制模型在思考过程中提前结束或延长思考时间，从而优化推理结果。研究人员构建了包含1000个问题的小型数据集s1K，并基于此对Qwen2.5-32B-Instruct语言模型进行微调，仅用16块H100 GPU在26分钟内完成训练。实验结果表明，s1-32B在竞赛数学问题上的表现比o1-preview高出27%。s1的出现为AI推理效率的提升提供了新思路，证明了在少量样本下也能实现高性能扩展，为未来AI模型的开发和优化提供了重要参考。来源：微信公众号【机器之心】