1月10日·银河通用发布全球首个基于仿真合成大数据的具身抓取大模型GraspVLA

1月10日·周五  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

银河通用发布全球首个基于仿真合成大数据的具身抓取大模型GraspVLA

银河通用机器人近日联合北京大学、北京智源人工智能研究院、香港大学研究人员,发布了全球首个端到端具身抓取基础大模型「GraspVLA」。该模型完全基于仿真合成大数据进行预训练,展现出比OpenVLA、π0、RT-2、RDT等模型更强大的泛化能力和真实场景实用潜力。GraspVLA团队还总结了具身基础模型七大泛化“金标准”,涵盖光照、干扰物、平面位置、高度、背景、物体类别泛化及闭环能力等方面。GraspVLA在这些方面均有出色表现,如在极端光照、动态背景、不同高度等条件下均能精准执行抓取任务,还能实现零样本Sim2Real抓取新物体。此外,GraspVLA作为基座大模型,可通过少样本迅速对齐用户新需求,如在商超、工厂、家庭场景中快速适应特殊需求。其成功得益于银河通用团队研发的全仿真合成数据生产管线,该管线一周内可生成十亿级机器人操作数据集,突破了数据昂贵稀缺及技能泛化性不足的瓶颈。银河通用后续还将推出融合多种技能的全能大模型,继续探索仿真合成数据预训练路线。来源:微信公众号【新智元】

1月10日·银河通用发布全球首个基于仿真合成大数据的具身抓取大模型GraspVLA

ChatGPT卷入爆炸案,AI安全风险凸显

新年伊始,ChatGPT却因向美国现役军人提供爆炸知识而卷入一起特斯拉Cybertruck爆炸案,引发了人们对AI安全的高度关注。知名AI投资人Rob Toews曾预测2025年将迎来“第一起真实的AI安全事件”,而此类事件的发生,正印证了AI安全风险正在成为我们必须面对的严峻挑战。AI安全风险可分为内生、衍生和外生三类,内生安全问题如数据有毒、价值对齐、决策黑盒等,是大模型的“基因问题”;衍生安全问题涉及假新闻、深度伪造诈骗等,对社会治理构成挑战;外生安全问题则包括平台安全漏洞、数据泄露等传统信息安全范畴。2024年,AI大模型在实现跨越式发展的同时,也让我们清晰看到了安全的敏感神经如何被刺激挑动。展望2025年,随着Agentic AI成为大模型应用的主要形态,安全基础设施的建设变得尤为重要。当前,整个业界、政府、国际组织在AI治理上做了很多工作,从技术研究、治理框架到国际合作,进行了多种形式探索。中国在大模型应用与治理方面走在了世界前列,通过监管、关键技术推进和行业协作等多方面努力,构筑多维安全航道,以确保AI在造福人类的同时始终处于可控轨道。来源:微信公众号【机器之心】

1月10日·银河通用发布全球首个基于仿真合成大数据的具身抓取大模型GraspVLA

微软MSRA推出rStar-Math,助力小模型数学推理能力飞跃

微软亚洲研究院(MSRA)近日推出了创新算法rStar-Math,使7B参数的Qwen2.5在数学推理表现上超越了OpenAI的o1-preview。rStar-Math通过代码增强CoT、蒙特卡洛树搜索(MCTS)等技术,让小模型在不依赖蒸馏教师模型的情况下,通过多轮自我进化的深度思维,掌握数学推理。在美国数学竞赛AIME 2024测试中,rStar-Math平均解决了53.3%的难题,打败了所有其他开源大模型。在MATH基准测试中,rStar-Math将阿里开源大模型Qwen2.5-Math-7B的准确率从58.8%拉升到90.0%,Qwen2.5-Math-1.5B的准确率从51.2%拉升到87.8%,Phi3-mini-3.8B的准确率从41.4%提高到86.4%,这些成绩全部超过了OpenAI o1-preview。rStar-Math的三项创新方法——代码增强CoT数据合成方法、过程奖励模型训练方法、四轮自我思维深度进化,有效应对了训练小模型的挑战,显著提高了小语言模型的数学推理能力,为AI领域带来了更经济、高效的解决方案。来源:微信公众号【量子位】

1月10日·银河通用发布全球首个基于仿真合成大数据的具身抓取大模型GraspVLA

海螺AI新功能“主体参考”,轻松生成AI版《教父》

MiniMax旗下的海螺AI推出新功能“主体参考”,仅需上传四张人物照片并配上文本Prompt,就能生成高质量的AI视频,如AI版《教父》短片。该功能结合了“文生视频”和“图生视频”的优点,通过提取图片中的“主体”视觉信息,让用户能用文字自由操控,精准复原视觉细节。即使只用一张人物图片,也能实现精准复原,生成多场景视频。与LoRA方案相比,主体参考大幅降低了用户输入与计算成本,只需1张图片输入加正常一次生成成本,而LoRA方案需数十个不同维度的视频、超100倍单次生成计算量及数十分钟等待时间。海螺AI的这一创新,有望颠覆短剧制作流程,降低制作成本,推动AI视频模型在AI短剧、AI广告等行业的应用,助力行业进入“人人都是好导演”的新时代。来源:微信公众号【量子位】

1月10日·银河通用发布全球首个基于仿真合成大数据的具身抓取大模型GraspVLA

英伟达迷你超算Project DIGITS遭友商嘲讽,宣传与实际算力引争议

在CES上,英伟达发布了迷你超算Project DIGITS,号称体积最小的AI超算,起售价3000美元。然而,这一发布引发了不小争议,遭到友商的嘲讽。芯片设计专家Raja Koduri实名吐槽,称英伟达宣传的算力是在FP4精度下,而Project DIGITS在FP16下的表现可能与5070差不多,甚至接近Intel Arc B580。友商Tiny Corp更是表示,3000美元的超算就是诈骗,不如买个游戏电脑。Project DIGITS搭载了英伟达全新的Grace Blackwell超级芯片GB10,FP4运算能力达1PFLOPs,包含Blackwell GPU和与联发科合作研发的Grace CPU。尽管英伟达强调其在AI领域的强大功能,但友商的质疑声不断,让这款迷你超算的实际性能和性价比成为焦点。来源:微信公众号【量子位】

1月10日·银河通用发布全球首个基于仿真合成大数据的具身抓取大模型GraspVLA

【今日案例】

2025年科技领域的预测

https://yuanbao.tencent.com/bot/app/share/chat/906eca8f8c552141dae5e5f350680768

© 版权声明

相关文章

暂无评论

暂无评论...