10月27日·具身智能新范式：Efficiency Law 与物理精确世界模型

228 0 0

10月27日·周一 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

具身智能新范式：Efficiency Law 与物理精确世界模型

2025 年，具身智能领域迎来新的突破。跨维智能与香港中文大学（深圳）提出 Efficiency Law，强调数据生成速率（r_D）对具身智能性能的重要性。与传统 Scaling Law 不同，Efficiency Law 更适用于当前具身智能发展，指出高效生成高质量数据是关键。同时，基于生成式仿真的世界模型（GS-World）被提出，将生成模型与物理仿真引擎结合，生成具备物理精确性的三维环境，为具身智能提供可靠的训练基础。这种引擎驱动的学习范式，使智能体能在仿真环境中自主学习与进化，推动具身智能从“模仿现实”走向“生成现实”，为未来通用具身智能发展奠定基础。来源：微信公众号【机器之心】

新型“验证码”让 AI 翻车，人类视觉错觉成 AI 检测新手段

一种基于光学错觉的新型“验证码”在网络上引发关注。该测试利用赫尔曼网格错觉原理，生成一张看似普通但能让人眼看到隐藏心形的图片。测试结果显示，包括 ChatGPT、Claude 和 Gemini 在内的多个大模型均未能准确识别出隐藏图案，部分模型甚至给出了荒谬答案。然而，当提示词调整或模型经过优化后，部分 AI 可以正确识别。这一现象引发了关于 AI 视觉感知能力与人类视觉系统差异的讨论，也让人思考这种光学错觉是否能成为检测 AI 的新方法。来源：微信公众号【机器之心】

Earth-Agent 问世，开启地球观测数据分析新纪元

上海人工智能实验室与中山大学联合研发的 Earth-Agent 正式发布，标志着地球科学领域迎来首个智能体。该智能体能够处理 RGB 图像、原始光谱数据和地球产品数据，执行从数据预处理到复杂时空分析的全流程任务。通过将地球科学专业知识封装为工具库，并利用大语言模型进行智能规划与调度，Earth-Agent 在多模态数据分析中展现出强大能力。其基准测试 Earth-Bench 包含 248 个任务，涵盖 13729 张图像，评估智能体的多步推理能力。未来，Earth-Agent 将不断扩展工具库，优化模型训练，有望成为地球科学领域的强大助手。来源：微信公众号【量子位】

美团开源 LongCat-Video，视频生成领域迎来新突破

美团推出开源视频生成模型 LongCat-Video，参数量达 13.6B，支持文生视频、图生视频和视频延长三大任务。该模型生成的视频不仅真实自然，还具备优秀的物理世界建模能力，能够生成长达数分钟的连贯视频。LongCat-Video 采用 Diffusion Transformer 框架，通过条件帧数量区分不同任务，并引入多种技术优化长视频生成效率。其在文生视频和图生视频的基准测试中表现优异，部分维度可与谷歌闭源模型 Veo3 媲美。美团表示，该模型旨在推动世界模型的发展，通过视频生成任务压缩多种知识，模拟真实世界的运行。来源：微信公众号【量子位】

OpenAI IPO 进程加速，奥特曼的“独狼”谈判术引发争议

OpenAI 的 IPO 计划迈出重要一步，软银批准了对其剩余的 225 亿美元投资，但要求其在年底前完成重组，从非营利组织转型为公益企业。与此同时，OpenAI CEO 奥特曼在价值 1.5 万亿美元的芯片交易中，绕过投行和律师，仅依靠核心团队与英伟达、AMD 等巨头直接谈判，达成多项协议。这种非常规的交易流程因缺乏详细财务条款而受到华尔街批评，但奥特曼认为这种方式能简化流程，依靠信任而非合同细节。目前，OpenAI 的重组进展将直接影响其最终获得的投资额，而奥特曼的谈判风格也引发了对其未来商业运作的广泛讨论。来源：微信公众号【量子位】