6月30日·谷歌 AI 自动进化代码,GPU 核函数性能反超人类 21%

6月30日·周一  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

谷歌 AI 自动进化代码,GPU 核函数性能反超人类 21%

谷歌的 AlphaEvolve 团队在自动化编程领域取得了重大突破。基于 AlphaEvolve 的开源实现 OpenEvolve,成功在苹果芯片上进化出了比人类手动优化快 21% 的 GPU 核函数。这一成果标志着 AI 在自我进化和自动优化方面迈出了重要一步。OpenEvolve 通过自我进化代码,自动发现了一系列优化策略,包括针对 Apple Silicon 的 SIMD 优化、两阶段在线 Softmax 优化以及针对 GQA 的特定内存布局优化。这些优化策略不仅显著提升了 GPU 核函数的性能,还在真实世界的 Transformer 推理任务中实现了平均 12.5% 的性能提升。该研究证明了自动化代码优化技术在实际系统中的可行性,开启了 AI 自动优化的新时代。来源:微信公众号【新智元】

6月30日·谷歌 AI 自动进化代码,GPU 核函数性能反超人类 21%

港大开源 RAG-Anything,构建统一多模态知识图谱

香港大学黄超教授团队开源了 RAG-Anything 项目,这是一个一体化的多模态 RAG(检索增强生成)框架,能够处理文本、图像、表格、数学公式等多种异构内容。RAG-Anything 解决了传统 RAG 系统仅支持文本处理的局限,通过构建统一的多模态知识图谱架构,实现了从文档解析、知识图谱构建到智能问答的全流程自动化。该系统支持 PDF、Office 文档、图像等多种格式,具备深度内容理解能力和灵活的模块化扩展性。RAG-Anything 的推出为多模态文档的智能理解提供了新的技术方案,标志着多模态 RAG 系统从概念验证迈向实际可部署的工程化解决方案。来源:微信公众号【新智元】

6月30日·谷歌 AI 自动进化代码,GPU 核函数性能反超人类 21%

95后技术新星在京东:边改造业务边发 AI 顶会论文

在 AI 时代,顶尖技术人才成为企业竞争的焦点。京东通过启动 TGT 顶尖青年技术天才计划,吸引了众多 95 后技术新星加入。这些年轻的技术专家在京东不仅迅速融入业务,还通过解决实际问题取得了显著成果。例如,洛川博士加入京东后,针对电商平台中用户行为序列长导致的稀疏参数存储和通信瓶颈,设计了一套重要性感知的量化与缓存方案,显著加速了 CTR 模型的分布式训练。另一位青年技术专家谦屹,专注于图像生成和多模态大语言模型的研究,其成果被多个 AI 顶会收录。京东为这些年轻人才提供了全方位的支持体系,包括导师指导、丰富的业务场景和海量数据,帮助他们在短时间内从学界研究者转变为产业实践者,实现了个人成长与企业发展的双赢。来源:微信公众号【新智元

6月30日·谷歌 AI 自动进化代码,GPU 核函数性能反超人类 21%

2700 万参数的 HRM 推理模型,性能超越 DeepSeek 和 Claude

Sapient Intelligence 的研究者提出了一种全新的分层推理模型HRM),其灵感来源于人脑的分层处理和多时间尺度机制。HRM 仅包含 2700 万个参数,使用 1000 个训练样本,便在复杂的推理任务上取得了卓越的性能,超越了 DeepSeek 和 Claude 等大型模型。HRM 通过两个相互依赖的循环模块执行顺序推理任务,高级模块负责抽象规划,低级模块负责快速计算。该模型无需预训练或 CoT 数据即可运行,在复杂数独谜题和大型迷宫中最优路径查找等任务上表现出色。此外,HRM 在抽象与推理语料库(ARC)上的表现也优于上下文窗口更长的大型模型。HRM 的设计引入了近似梯度、深度监督和自适应计算时间等机制,使其在推理阶段能够动态利用额外计算资源,提升性能。来源:微信公众号【机器之心

6月30日·谷歌 AI 自动进化代码,GPU 核函数性能反超人类 21%

Rex-Thinker:会“思考”的目标检测模型,准确率和可解释性双突破

IDEA 团队提出了一种名为 Rex-Thinker 的新型指代物体检测模型,该模型通过引入人类思维中的“逻辑推理链”,显著提升了目标检测的准确率和可解释性。Rex-Thinker 通过“规划(Planning)- 验证(Action)- 决策(Summarization)”的三步推理框架,让 AI 像人类一样逐步思考和验证证据。该模型在权威测评中不仅准确率显著提升,还展现出强大的“知之为知之”能力。Rex-Thinker 采用了基于检索的检测多模态模型设计,结合了监督微调(SFT)和基于 GRPO 的强化学习后训练策略,进一步优化了推理质量。实验结果表明,Rex-Thinker 在 HumanRef Benchmark 上的性能显著优于现有方法,尤其在拒识能力上表现出色。此外,该模型在跨类别评估中也展示了良好的泛化能力。来源:微信公众号【量子位】

6月30日·谷歌 AI 自动进化代码,GPU 核函数性能反超人类 21%
© 版权声明

相关文章

暂无评论

暂无评论...