2月5日·CMU与英伟达合作,人形机器人实现高难度动作复刻
2月5日·周三 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
CMU与英伟达合作,人形机器人实现高难度动作复刻
卡内基梅隆大学(CMU)与英伟达的研究团队共同提出了一种名为ASAP(Aligning Simulation and Real Physics)的「real2sim2real」模型,成功让人形机器人复刻了科比、C罗、詹姆斯等名人的招牌动作,甚至完成了侧跳、深蹲、APT舞等高难度动作。该模型通过预训练和后训练两大阶段,利用真实世界数据训练delta动作模型,弥补仿真与现实的动力学差异,最终实现敏捷、稳定的全身控制动作。研究团队还开源了相关代码,助力人形机器人技术的进一步发展。未来,人形机器人有望在更多复杂场景中实现高度灵活的运动。来源:微信公众号【新智元】

Tülu 3横空出世,强化学习助力开源模型突破性能瓶颈
美国艾伦人工智能研究所(Ai2)推出了新一代开源模型Tülu 3 405B,凭借强化学习技术,在多项基准测试中超越了DeepSeek v3和GPT-4o等先进模型。Tülu 3采用四阶段后训练方法,包括精心策划的提示词微调、监督微调、偏好微调以及独创的可验证奖励强化学习(RLVR),尤其在数学问题求解和指令遵循等任务上表现突出。该模型不仅开源了训练数据、代码和方法,还支持本地部署,为研究人员和开发者提供了强大的工具。尽管在部分任务上仍有提升空间,但Tülu 3的推出标志着开源模型在性能和灵活性上的重要突破,为未来的人工智能研究和应用开辟了新的道路。来源:微信公众号【新智元】

AI正在重塑编程领域,从简单的代码补全到复杂的全流程自动化,AI编程工具被划分为L1到L5五个等级。L1级工具如GitHub Copilot,主要提供代码补全功能,帮助开发者简化重复性编码任务。L2级工具如ChatGPT,能够处理任务级自动化,包括开发新功能、修复漏洞等,但需要精心设计提示词。L3级工具如Codegen和Sweep,可实现项目级自动化,通过集成项目管理工具和代码平台,完成从需求到部署的多步骤流程。L4级工具如Devin,标志着AI驱动软件开发的转变,能够实现从需求到生产部署的完全自动化。L5级则是AI开发团队,多个AI代理协作完成项目,未来有望实现高度自动化的软件开发。开发者可根据自身需求选择不同级别的工具,AI正逐步改变软件开发的未来。来源:微信公众号【新智元】

字节跳动OmniHuman,一张图+音频即可生成生动视频
字节跳动数字人团队推出了一项名为OmniHuman的新技术,能够仅用一张图片和一段音频生成高质量的人物视频。该技术基于混合多模态训练策略,支持肖像、半身、全身等多种人物占比和图片尺寸,生成的人物视频自然生动,动作与音频匹配度高,甚至在手势生成和非真人图片(如动漫、3D卡通)输入方面也有出色表现。OmniHuman通过创新的Omni-Conditions Training方法,解决了以往技术中高质量数据稀缺、生成效果自然度低等问题,显著提升了视频生成的多样性和自然度。该技术已落地即梦AI,相关功能即将开启测试,标志着AI在多模态内容生成领域迈出了重要一步。来源:微信公众号【机器之心】

斯坦福新成果s1,仅用1000样本超越o1,AI推理效率大幅提升
斯坦福大学、华盛顿大学等机构的研究人员提出了一种名为s1的新方法,仅用1000个样本训练,就实现了超越OpenAI的o1模型的推理性能。s1通过“预算强制”技术控制测试时间计算,强制模型在思考过程中提前结束或延长思考时间,从而优化推理结果。研究人员构建了包含1000个问题的小型数据集s1K,并基于此对Qwen2.5-32B-Instruct语言模型进行微调,仅用16块H100 GPU在26分钟内完成训练。实验结果表明,s1-32B在竞赛数学问题上的表现比o1-preview高出27%。s1的出现为AI推理效率的提升提供了新思路,证明了在少量样本下也能实现高性能扩展,为未来AI模型的开发和优化提供了重要参考。来源:微信公众号【机器之心】
