1月10日·银河通用发布全球首个基于仿真合成大数据的具身抓取大模型GraspVLA

187 0 0

1月10日·周五 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

银河通用发布全球首个基于仿真合成大数据的具身抓取大模型GraspVLA

银河通用机器人近日联合北京大学、北京智源人工智能研究院、香港大学研究人员，发布了全球首个端到端具身抓取基础大模型「GraspVLA」。该模型完全基于仿真合成大数据进行预训练，展现出比OpenVLA、π0、RT-2、RDT等模型更强大的泛化能力和真实场景实用潜力。GraspVLA团队还总结了具身基础模型七大泛化“金标准”，涵盖光照、干扰物、平面位置、高度、背景、物体类别泛化及闭环能力等方面。GraspVLA在这些方面均有出色表现，如在极端光照、动态背景、不同高度等条件下均能精准执行抓取任务，还能实现零样本Sim2Real抓取新物体。此外，GraspVLA作为基座大模型，可通过少样本迅速对齐用户新需求，如在商超、工厂、家庭场景中快速适应特殊需求。其成功得益于银河通用团队研发的全仿真合成数据生产管线，该管线一周内可生成十亿级机器人操作数据集，突破了数据昂贵稀缺及技能泛化性不足的瓶颈。银河通用后续还将推出融合多种技能的全能大模型，继续探索仿真合成数据预训练路线。来源：微信公众号【新智元】

ChatGPT卷入爆炸案，AI安全风险凸显

新年伊始，ChatGPT却因向美国现役军人提供爆炸知识而卷入一起特斯拉Cybertruck爆炸案，引发了人们对AI安全的高度关注。知名AI投资人Rob Toews曾预测2025年将迎来“第一起真实的AI安全事件”，而此类事件的发生，正印证了AI安全风险正在成为我们必须面对的严峻挑战。AI安全风险可分为内生、衍生和外生三类，内生安全问题如数据有毒、价值对齐、决策黑盒等，是大模型的“基因问题”；衍生安全问题涉及假新闻、深度伪造诈骗等，对社会治理构成挑战；外生安全问题则包括平台安全漏洞、数据泄露等传统信息安全范畴。2024年，AI大模型在实现跨越式发展的同时，也让我们清晰看到了安全的敏感神经如何被刺激挑动。展望2025年，随着Agentic AI成为大模型应用的主要形态，安全基础设施的建设变得尤为重要。当前，整个业界、政府、国际组织在AI治理上做了很多工作，从技术研究、治理框架到国际合作，进行了多种形式探索。中国在大模型应用与治理方面走在了世界前列，通过监管、关键技术推进和行业协作等多方面努力，构筑多维安全航道，以确保AI在造福人类的同时始终处于可控轨道。来源：微信公众号【机器之心】

微软MSRA推出rStar-Math，助力小模型数学推理能力飞跃

微软亚洲研究院（MSRA）近日推出了创新算法rStar-Math，使7B参数的Qwen2.5在数学推理表现上超越了OpenAI的o1-preview。rStar-Math通过代码增强CoT、蒙特卡洛树搜索（MCTS）等技术，让小模型在不依赖蒸馏教师模型的情况下，通过多轮自我进化的深度思维，掌握数学推理。在美国数学竞赛AIME 2024测试中，rStar-Math平均解决了53.3%的难题，打败了所有其他开源大模型。在MATH基准测试中，rStar-Math将阿里开源大模型Qwen2.5-Math-7B的准确率从58.8%拉升到90.0%，Qwen2.5-Math-1.5B的准确率从51.2%拉升到87.8%，Phi3-mini-3.8B的准确率从41.4%提高到86.4%，这些成绩全部超过了OpenAI o1-preview。rStar-Math的三项创新方法——代码增强CoT数据合成方法、过程奖励模型训练方法、四轮自我思维深度进化，有效应对了训练小模型的挑战，显著提高了小语言模型的数学推理能力，为AI领域带来了更经济、高效的解决方案。来源：微信公众号【量子位】

海螺AI新功能“主体参考”，轻松生成AI版《教父》

MiniMax旗下的海螺AI推出新功能“主体参考”，仅需上传四张人物照片并配上文本Prompt，就能生成高质量的AI视频，如AI版《教父》短片。该功能结合了“文生视频”和“图生视频”的优点，通过提取图片中的“主体”视觉信息，让用户能用文字自由操控，精准复原视觉细节。即使只用一张人物图片，也能实现精准复原，生成多场景视频。与LoRA方案相比，主体参考大幅降低了用户输入与计算成本，只需1张图片输入加正常一次生成成本，而LoRA方案需数十个不同维度的视频、超100倍单次生成计算量及数十分钟等待时间。海螺AI的这一创新，有望颠覆短剧制作流程，降低制作成本，推动AI视频模型在AI短剧、AI广告等行业的应用，助力行业进入“人人都是好导演”的新时代。来源：微信公众号【量子位】

英伟达迷你超算Project DIGITS遭友商嘲讽，宣传与实际算力引争议

在CES上，英伟达发布了迷你超算Project DIGITS，号称体积最小的AI超算，起售价3000美元。然而，这一发布引发了不小争议，遭到友商的嘲讽。芯片设计专家Raja Koduri实名吐槽，称英伟达宣传的算力是在FP4精度下，而Project DIGITS在FP16下的表现可能与5070差不多，甚至接近Intel Arc B580。友商Tiny Corp更是表示，3000美元的超算就是诈骗，不如买个游戏电脑。Project DIGITS搭载了英伟达全新的Grace Blackwell超级芯片GB10，FP4运算能力达1PFLOPs，包含Blackwell GPU和与联发科合作研发的Grace CPU。尽管英伟达强调其在AI领域的强大功能，但友商的质疑声不断，让这款迷你超算的实际性能和性价比成为焦点。来源：微信公众号【量子位】