8月12日·中国自研Matrix-3D:世界模型的新突破
8月12日·周二 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
中国自研Matrix-3D:世界模型的新突破
中国自研的世界模型Matrix-3D近日发布,仅需单张图即可生成可自由探索的3D世界,效果对标李飞飞的World Labs,并实现更大范围的探索空间。Matrix-3D由昆仑万维开发,支持360°自由视角浏览,生成场景范围大,且具备高度可控性和强泛化能力。它通过全景图像作为中间表达,解决了传统方法中视角受限和边界效应的问题,并引入全景图生成、可控全景视频生成和3D场景生成三大核心模块。此外,Matrix-3D还发布了Matrix-Pano数据集,包含11.6万条全景视频,助力3D生成和空间智能研究。来源:微信公众号【新智元】

微博智搜靠DeepSeek杀进全国TOP 2
最新QuestMobile报告显示,微博的AI智搜凭借DeepSeek技术杀入全国AI搜索引擎榜单前二,月人均使用次数达36.6次。微博智搜通过全景式视角和准确的信息总结,为用户提供高效、清晰的搜索体验。它能够快速梳理复杂信息,如天气预警、社会新闻等,并在娱乐、数码等领域提供精准内容。此外,微博智搜还通过AI技术优化信息审核,提升辟谣和求证的准确性,获得众多高管和大V的盛赞。来源:微信公众号【新智元】

FlashRL:让强化学习快如闪电
FlashRL是一种开源的强化学习方案,通过应用INT8/FP8量化技术,显著加速了强化学习中的rollout阶段,同时保持了与BF16持平的性能。FlashRL的核心在于截断重要性采样(TIS)技术,解决了量化rollout与训练之间的不匹配问题。它支持在线量化,并通过Flash-LLM-RL包实现了对vLLM的补丁,使其能够支持带参数更新的模型量化。在32B模型上,FlashRL的吞吐量加速比可达1.75倍,尤其在内存受限环境下,加速效果更为显著。来源:微信公众号【机器之心】

商汤「悟能」:具身智能的桥梁
商汤科技推出「悟能」具身智能平台,旨在通过世界模型加快AI从数字空间进入物理世界。该平台基于商汤在计算机视觉和自动驾驶领域的积累,提供10万3D资产,支持第一视角和第三视角的视频生成,并保持长达150秒的时空一致性。它还集成了导航、人机交互等能力,助力机器人在复杂环境中灵活应对。商汤希望通过「悟能」为行业提供「机器人大脑」,推动具身智能的通用化发展。来源:微信公众号【机器之心】

英伟达升级版Cosmos:机器人的「大脑」
英伟达在SIGGRAPH大会上发布了升级版Cosmos世界模型,推出70亿参数的Cosmos Reason视觉语言模型,具备推理能力,可帮助机器人进行任务规划。同时,新增Cosmos Transfer-2及精简版,加速虚拟场景转化为训练数据。英伟达还升级了Omniverse库和SDK,支持三维重建和仿真,并开源了Isaac Sim 5.0与Isaac Lab 2.2。此外,英伟达推出RTX PRO Blackwell服务器和DGX Cloud云平台,降低硬件门槛,助力机器人开发。来源:微信公众号【量子位】
