Kairos-HomeWorld : 大晓机器人推出的全屋三维可交互世界模型
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
主要介绍
Kairos-HomeWorld 是由上海大晓机器人联合香港中文大学多媒体实验室、深圳河套学院于 2026 年 6 月 5 日正式发布的全球首个全屋三维可交互世界模型统一框架。它突破了现有室内场景生成仅能覆盖单房间、缺乏全局一致性与可操作性的行业瓶颈,能够从一句通俗文本指令(如”生成一套 90 平新中式两室一厅”)直接生成结构连贯、物理合理、功能完整的全屋三维场景,并且场景中每个物体都可被机器人真实交互——冰箱门能开合、洗衣液可倾倒、窗帘能拉伸。更关键的是,研究团队同步开源了全球规模最大、首个专为中国家庭打造的全屋 3D 数据集,包含 30 万套中国真实住宅平面图、5000 个完整全屋仿真场景与 5 万件带物理属性的物件,彻底填补了国内缺乏大规模、高保真、符合本土居住习惯的室内场景数据的行业空白,为具身人工智能的国产化落地提供了核心数据与技术底座。
功能特点
| 维度 | 具体能力 |
|---|---|
| 一键全屋生成 | 输入一句文本指令,自动生成南北通透、功能分区合理的完整住宅 3D 模型,覆盖 30㎡ 一居室到 200㎡+ 大平层 |
| 全局一致性 | 房间动线合理、功能邻接性正确,不会出现”沙发挡门””物体穿墙”等问题 |
| 物体级全交互 | 全球首个全屋可操作物体生成框架,每场景平均 15+ 个可交互物体,支持抓取、移动、堆叠、倾倒、拉伸等操作 |
| 物理属性完备 | 物体自带密度、铰接结构、流形等完整物理属性,可直接导入仿真引擎 |
| 中国家庭专属 | 完整还原南北通透布局、封闭式厨房、独立生活阳台、干湿分离卫生间、玄关鞋柜等本土特征,甚至包含老小区非矩形厨房等复杂户型 |
| 数字生成零边际成本 | 新增场景近乎零成本,不受现实房源总量限制,优于 Figure AI + Brookfield 的实地采集路线 |
| 已落地验证 | 已成功应用于大晓自研服务机器人的具身智能日常训练,支持跨房间导航、多房间物品整理等长程家务任务 |
优缺点
优点:
- 全球首个实现”全屋生成 + 个体物体全交互”的统一框架,不是”只能看不能用”的展示品
- 中国家庭专属数据集,30 万套真实平面图远超 RPLAN(8 万套)和 ResPlan(1.7 万套),彻底解决机器人入户”水土不服”
- 四阶段架构将生成任务解耦,每个阶段可独立优化,工程落地性强
- 足迹物体密度达 4.16,交互丰富度行业领先
- 面向学术界与产业界全面免费开源,大幅降低中小机器人企业研发门槛
缺点:
- 目前已开源场景以 5000 套为主,相比 Figure AI 依托 Brookfield 超 10 万套住宅的规模仍有差距
- 复杂非标户型(如老式异形小户型)的生成质量尚需更多验证
- 交互物体以家居常见物品为主,长尾物品(如特殊厨具、地方特色物件)覆盖仍在扩充中
- 开源数据集虽免费,但大规模仿真训练仍需一定算力投入
如何使用
- 访问项目主页:搜索”Kairos-HomeWorld”或访问大晓机器人官方渠道,查看完整技术报告与演示视频
- 下载开源数据集:在 Hugging Face 获取数据集(包含 30 万套平面图 + 5000 全屋场景 + 5 万物体资产),面向学术与产业免费开放
- 体验一键生成:在项目提供的演示中输入文本指令(如”生成一套新中式 90 平米两室一厅”),即可看到从空房间结构→家具布局→可交互物品的完整生成过程
- 导入仿真引擎训练:将生成的场景和物体资产直接导入机器人仿真平台,机器人即可在虚拟环境中完成跨房间导航、物品整理等家务训练
- 查看排行榜与对比:项目主页提供与 RPLAN、ResPlan 等主流数据集的规模对比,直观了解优势
框架技术原理
Kairos-HomeWorld 采用四阶段分层生成架构,将复杂的全屋级生成任务解耦为四个独立阶段:
| 阶段 | 名称 | 核心机制 | 解决的问题 |
|---|---|---|---|
| 第一阶段 | 全局结构生成 | 首创基于 K-D 树的平面图结构化表示,将真实住宅平面图转化为 LLM 可高效学习的分层文本结构 | 避免房间重叠、拓扑断裂等传统户型生成缺陷 |
| 第二阶段 | 局部细节填充 | “俯视图全局初始化 + 第一人称细节漫游”分层策略,以 3D 建筑外壳锚定整个生成过程 | 解决 2D-3D 提升方法普遍存在的几何漂移问题 |
| 第三阶段 | 闭环校验 | 微调视觉语言模型构建递归闭环校验机制,自动检测并修正物理违规 | 将家具布局碰撞率控制在行业最优水平 |
| 第四阶段 | 交互增强 | 表面中心物体放置算法 + Physx-Omni 模型,自动获取物体材质、密度、铰接结构等物理属性 | 生成平均 15+ 个可操作物体,足迹物体密度达 4.16 |
最终生成的每个场景包含完整家具布局 + 带物理属性的可交互物品,可直接导入仿真引擎进行抓取、移动、堆叠、倾倒液体、拉伸柔性物体等操作。
创新点
- 全球首个全屋 + 物体级全交互统一框架:不是单房间生成,也不是”只能看不能用”,而是真正可操作的全屋世界模型
- K-D 树平面图结构化表示:首次将住宅平面图转化为 LLM 可学习的分层文本,从根本上解决户型生成的拓扑问题
- 表面中心物体放置算法:全局首个全屋可操作物体生成方法,让虚拟环境真正具备支撑机器人操作的能力
- 中国家庭专属数据集:30 万套真实平面图 + 5000 全屋场景,规模全球最大,且完整还原南北通透、封闭式厨房、独立阳台等本土特征
- 数字生成 vs 实地采集的范式突破:新增场景零边际成本,不受房源总量限制,训练效率与规模化拓展优于 Figure AI + Brookfield 的实地路线
- 递归闭环校验:用视觉语言模型自动纠错,而非人工检查,保证物理合规性
评估标准
| 评估维度 | 指标 | 说明 |
|---|---|---|
| 全局一致性 | 家具布局碰撞率 | 第三阶段闭环校验后控制在行业最优水平 |
| 交互丰富度 | 足迹物体密度(MObj) | 达 4.16,衡量家具表面上物体的密集程度与功能丰富度 |
| 可操作物体数量 | 每场景平均可交互物体数 | ≥ 15 个,全部支持抓取、移动、堆叠等操作 |
| 物理合规性 | 物理违规检测率 | 自动检测”沙发挡门””物体穿墙”等,递归修正 |
| 仿真就绪度(Sim-ready) | 是否可直接导入仿真引擎 | 所有物体自带密度、铰接、流形等属性,开箱即用 |
| 数据集规模 | 平面图/场景/物体数量 | 30 万平面图 / 5000 场景 / 5 万物体,全球最大中国家庭专属数据集 |
应用领域
| 领域 | 具体用途 |
|---|---|
| 家政机器人训练 | 跨房间导航、多房间物品整理、全屋家务执行的全流程仿真训练 |
| 具身智能研发 | 为国内机器人企业提供本土化训练数据,解决”水土不服”问题 |
| 室内场景生成 | 房地产、装修设计领域的快速 3D 场景搭建与可视化 |
| 学术研究 | POMDP 建模、世界模型评估、机器人操作学习等方向的基准测试 |
| 智能家居仿真 | 智能家电联动、家居动线规划等场景的虚拟验证 |
| 游戏与元宇宙 | 生成可交互的中国家庭 3D 场景资产 |
项目地址
| 资源 | 链接 |
|---|---|
| 🌐 百度百科 | https://baike..com/item/Kairos-HomeWorld/67905357 |
| 📊 HuggingFace 数据集 | https://huggingface.co/datasets/meituan-longcat/VitaBench(注:Kairos-HomeWorld 数据集同步开源,建议访问大晓机器人官方渠道获取最新链接) |
| 📰 官方发布新闻 | https://news.10jqka.com.cn/20260608/c677290659.shtml |
| 🏢 大晓机器人 | 搜索”大晓机器人”访问官网获取项目完整资料 |
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...