3月17日·全球首个通用具身智能平台「慧思开物」发布，开启机器人“安卓”时代

AI资讯速递1年前 (2025)发布 FuturX-Editor

659 0 0

3月17日·周一 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

全球首个通用具身智能平台「慧思开物」发布，开启机器人“安卓”时代

北京人形机器人创新中心发布全球首个通用具身智能平台「慧思开物」，标志着机器人行业从“功能机”迈向“智能机”时代。该平台通过统一架构，打破传统机器人开发模式，支持多构型机器人在多场景下的复杂任务执行，具备自然交互、空间感知、任务规划等能力。其分布式多智能体架构，包括云端的“具身大脑”和端侧的“具身小脑”，形成类似安卓系统的“底层系统+应用层”模式。发布会现场通过真机直播展示了搭载该平台的机器人在工业分拣、积木搭建、桌面整理、物流打包等场景中的出色表现，展现了其强大的泛化能力和易开发性。未来，「慧思开物」将通过开源开放，助力机器人走进千家万户，赋能千行百业。来源：微信公众号【新智元】

谷歌Gemini 2.0 Flash引发图像生成革命，PS和广告业面临冲击

谷歌的Gemini 2.0 Flash凭借其“一句话PS”功能在全网引发震动。这一功能不仅能够通过自然语言指令快速生成和修改图像，还具备强大的多模态能力，可同时处理文本和图像，生成符合现实逻辑的内容。Gemini 2.0 Flash的出现被认为将颠覆传统图像编辑工具Photoshop，其去水印、交叉图像生成等功能被广泛应用于广告、漫画、动漫等领域，甚至引发了对模特和广告行业的变革预测。此外，该模型还支持通过API调用，开发者可免费使用1500次/天，极大地降低了图像生成的门槛。谷歌的这一创新不仅展示了其在AI领域的领先地位，也为创意产业带来了无限可能。来源：微信公众号【新智元】

北大团队提出LIFT框架，为大模型注入长上下文知识，显著提升长文本能力

北京大学人工智能研究院和北京通用人工智能研究院的研究团队提出了一种名为LIFT（Long Input Fine-Tuning）的创新框架，旨在解决大语言模型（LLM）在长文本任务中的能力瓶颈。LIFT通过将长文本知识注入模型参数，而非依赖外部数据库或上下文窗口，实现了对长文本的高效理解和推理。该框架首次提出将长文本切分为固定长度的片段，并通过重叠片段的方式进行语言建模训练，同时设计了辅助任务来弥补模型能力损失。此外，LIFT还引入了门控记忆适配器（Gated Memory Adapter），有效平衡了模型对长文本的记忆能力和原有能力。实验表明，LIFT在多个长文本基准测试中显著提升了模型表现，例如在LooGLE长依赖问答任务中，Llama 3 8B的正确率从15.44%提升至29.97%。这一成果为大模型在长文本任务中的应用提供了新的思路和解决方案。来源：微信公众号【机器之心】

零一万物发布万智企业大模型平台，助力DeepSeek快速落地

李开复担任CEO的零一万物正式上线万智企业大模型一站式平台，为企业提供DeepSeek部署定制解决方案。零一万物通过推出一体机部署方案、集成API应用和行业定制服务，助力企业快速落地DeepSeek模型。该平台预装华为昇腾高性能GPU，内置DeepSeek全系列模型，并支持企业上传知识库进行微调和应用开发。此外，零一万物还展示了DeepSeek在联网搜索、知识库查询和智能体Agent生成中的应用，显著提升了企业级应用的准确性和效率。李开复认为，2025年将成为AI-First应用的爆发年，零一万物的举措为AI应用的商业化落地提供了新的思路和工具。来源：微信公众号【量子位】

新注意力机制Slim Attention让大模型内存占用减半，推理加速2倍

前苹果ASIC架构师Nils Graef和UC伯克利本科生Andrew Wasielewski提出的新注意力机制Slim Attention，为大模型的上下文处理带来了重大突破。Slim Attention通过调整标准多头注意力（MHA）中value缓存的处理方式，实现了KV缓存大小减半或上下文长度翻倍，且精度无损。此外，它还能在内存带宽受限的场景下将模型推理速度提升1.5-2倍。该机制的核心在于利用W_K和W_V的方阵性质，仅存储K矩阵并通过实时计算V矩阵来减少内存占用。Slim Attention被认为是标准MHA的精确数学重写，因此在不牺牲准确率的前提下，显著降低了内存占用并提升了推理效率。这一成果有望重塑大模型的训练和部署方式。来源：微信公众号【量子位】