11月5日·具身智能新突破:GEN-0模型开启新时代

11月5日·周三  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

具身智能新突破:GEN-0模型开启新时代

AI机器人创业公司Generalist推出新型具身基础模型GEN-0,参数量达10B+,基于27万小时真实物理交互数据训练。该模型具备和谐推理能力,能在感知和行动间建立“和谐”互动,还实现了跨机体适配,适用于不同自由度的机器人。Generalist通过大规模实验发现,模型规模越大,吸收数据能力越强,7B参数模型出现“相变”,10B+模型能快速适应新任务。此外,GEN-0展现出强大的Scaling Law,预训练数据和算力增加可显著提升下游任务性能。其训练数据集规模庞大,每周新增1万小时,涵盖家庭、仓库、工厂等多样化场景。Generalist还构建了强大的基础设施,支持全球数据收集与处理,推动具身智能迈向新时代。来源:微信公众号【机器之心】

11月5日·具身智能新突破:GEN-0模型开启新时代

360 FG-CLIP2:全球最强图文跨模态模型

360推出新一代图文跨模态模型FG-CLIP2,在八大类任务、29项测试中全面超越Google与Meta,成为全球最强模型。它具备像素级理解能力,能精准识别图像细节,如毛发、斑点、色彩等,还擅长处理复杂空间关系和中文语义。FG-CLIP2基于高质量FineHARD数据集训练,包含4000万个目标框及细粒度描述,还引入1000万组难负样本提升辨别力。其训练采用两阶段策略与五维协同优化体系,视觉处理上独创数据自适应分辨率策略。目前,该模型已在360多项业务中落地,并以API+MCP形式全面开放,助力千行百业智能化升级。来源:微信公众号【机器之心】

11月5日·具身智能新突破:GEN-0模型开启新时代

谷歌Project Suncatcher:AI基础设施上天

谷歌宣布Project Suncatcher计划,旨在将TPU送上太空,构建基于太阳能的可扩展AI基础设施。该项目计划于2027年初与Planet公司合作发射两颗原型卫星,探索利用太阳能驱动AI计算的可行性。谷歌研究表明,Trillium代TPU能承受低地球轨道水平的辐射,且太阳能电池板在太空中的效率比地球上高出8倍。该系统面临热管理、高带宽地面通信等挑战,但谷歌认为其具有巨大潜力,可减少对地球资源的影响。未来,吉瓦级卫星星座或成现实,催生新型太空计算架构。来源:微信公众号【量子位】

11月5日·具身智能新突破:GEN-0模型开启新时代

低成本微调大模型:KTransformers与LLaMA-Factory联动

趋境科技联合清华KVCache.AI开源的KTransformers项目,结合LLaMA-Factory平台,实现了仅用2-4张消费级显卡(如4090)即可微调万亿参数模型(如Kimi K2 1TB、DeepSeek 671B)。传统方法微调这些模型需数千GB显存,而KTransformers通过GPU+CPU异构推理,将显存需求大幅降低至90G左右。在微调效果上,模型在垂直领域(如医疗、法律)表现大幅提升,还能实现个性化定制,如打造专属风格写作助手、私有知识库助手等。该技术降低了大模型微调门槛,推动AI落地与创新。来源:微信公众号【量子位】

11月5日·具身智能新突破:GEN-0模型开启新时代

Uniworld V2:刷新图像编辑SOTA

兔展智能与北京大学Uniworld团队推出新一代图像编辑模型Uniworld V2,基于创新的Uniworld-R1框架,首次将强化学习应用于图像编辑后期训练。该模型在GEdit-Bench和ImgEdit基准测试中取得SOTA成绩,超越OpenAI的GPT-Image-1等顶尖模型。Uniworld V2具备强大的中文字体掌握能力,能精准渲染复杂艺术字体;还支持精细化空间可控操作,如严格遵守用户指定的红框区域进行编辑;同时在全局光影融合方面表现出色。Uniworld-R1框架采用DiffusionNFT技术和MLLM作为免训练奖励模型,提升模型对人类意图的对齐能力。来源:微信公众号【量子位】

11月5日·具身智能新突破:GEN-0模型开启新时代
© 版权声明

相关文章

暂无评论

暂无评论...