10月27日·具身智能新范式:Efficiency Law 与物理精确世界模型
10月27日·周一 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
具身智能新范式:Efficiency Law 与物理精确世界模型
2025 年,具身智能领域迎来新的突破。跨维智能与香港中文大学(深圳)提出 Efficiency Law,强调数据生成速率(r_D)对具身智能性能的重要性。与传统 Scaling Law 不同,Efficiency Law 更适用于当前具身智能发展,指出高效生成高质量数据是关键。同时,基于生成式仿真的世界模型(GS-World)被提出,将生成模型与物理仿真引擎结合,生成具备物理精确性的三维环境,为具身智能提供可靠的训练基础。这种引擎驱动的学习范式,使智能体能在仿真环境中自主学习与进化,推动具身智能从“模仿现实”走向“生成现实”,为未来通用具身智能发展奠定基础。来源:微信公众号【机器之心】
新型“验证码”让 AI 翻车,人类视觉错觉成 AI 检测新手段
一种基于光学错觉的新型“验证码”在网络上引发关注。该测试利用赫尔曼网格错觉原理,生成一张看似普通但能让人眼看到隐藏心形的图片。测试结果显示,包括 ChatGPT、Claude 和 Gemini 在内的多个大模型均未能准确识别出隐藏图案,部分模型甚至给出了荒谬答案。然而,当提示词调整或模型经过优化后,部分 AI 可以正确识别。这一现象引发了关于 AI 视觉感知能力与人类视觉系统差异的讨论,也让人思考这种光学错觉是否能成为检测 AI 的新方法。来源:微信公众号【机器之心】
Earth-Agent 问世,开启地球观测数据分析新纪元
上海人工智能实验室与中山大学联合研发的 Earth-Agent 正式发布,标志着地球科学领域迎来首个智能体。该智能体能够处理 RGB 图像、原始光谱数据和地球产品数据,执行从数据预处理到复杂时空分析的全流程任务。通过将地球科学专业知识封装为工具库,并利用大语言模型进行智能规划与调度,Earth-Agent 在多模态数据分析中展现出强大能力。其基准测试 Earth-Bench 包含 248 个任务,涵盖 13729 张图像,评估智能体的多步推理能力。未来,Earth-Agent 将不断扩展工具库,优化模型训练,有望成为地球科学领域的强大助手。来源:微信公众号【量子位】
美团开源 LongCat-Video,视频生成领域迎来新突破
美团推出开源视频生成模型 LongCat-Video,参数量达 13.6B,支持文生视频、图生视频和视频延长三大任务。该模型生成的视频不仅真实自然,还具备优秀的物理世界建模能力,能够生成长达数分钟的连贯视频。LongCat-Video 采用 Diffusion Transformer 框架,通过条件帧数量区分不同任务,并引入多种技术优化长视频生成效率。其在文生视频和图生视频的基准测试中表现优异,部分维度可与谷歌闭源模型 Veo3 媲美。美团表示,该模型旨在推动世界模型的发展,通过视频生成任务压缩多种知识,模拟真实世界的运行。来源:微信公众号【量子位】
OpenAI IPO 进程加速,奥特曼的“独狼”谈判术引发争议
OpenAI 的 IPO 计划迈出重要一步,软银批准了对其剩余的 225 亿美元投资,但要求其在年底前完成重组,从非营利组织转型为公益企业。与此同时,OpenAI CEO 奥特曼在价值 1.5 万亿美元的芯片交易中,绕过投行和律师,仅依靠核心团队与英伟达、AMD 等巨头直接谈判,达成多项协议。这种非常规的交易流程因缺乏详细财务条款而受到华尔街批评,但奥特曼认为这种方式能简化流程,依靠信任而非合同细节。目前,OpenAI 的重组进展将直接影响其最终获得的投资额,而奥特曼的谈判风格也引发了对其未来商业运作的广泛讨论。来源:微信公众号【量子位】