5月17日·OpenAI发布最强AI编程智能体Codex，开启编程新时代

626 0 0

5月17日·周六 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

OpenAI发布最强AI编程智能体Codex，开启编程新时代

OpenAI正式推出云端AI编程智能体Codex，由优化版模型codex-1加持，专为软件工程量身打造。Codex能够在云端沙盒环境中并行处理多项任务，与GitHub无缝集成，直接调用代码库，实现快速构建功能模块、修复代码漏洞、提交PR及自动测试验证等功能。其多任务并行能力可将原本耗时数天的任务缩短至30分钟内完成。基准测试显示，codex-1在SWE-bench上得分72.1%，超越Claude 3.7和o3-high。Codex将向全球ChatGPT Pro、Enterprise和Team用户开放，未来还将支持实时协作与异步任务委托，进一步提升开发效率。来源：微信公众号【新智元】

MIT博士论文造假风波：诺奖导师举报，学校官宣撤稿

MIT一名博士生的论文因数据造假被导师举报，学校要求撤稿。该论文曾因声称AI显著提升材料科学研究效率而备受关注，甚至获得顶级经济学期刊的发表机会。然而，随着质疑声不断，论文数据的真实性受到挑战。伦敦大学学院教授Robert Palgrave曾指出论文存在诸多疑点，如数据来源不明、研究方法不严谨等。最终，MIT展开内部审查后确认论文问题，要求撤稿。这一事件引发了学术界对数据造假和学术诚信的广泛关注。来源：微信公众号【新智元】

华为Selftok技术：用自回归内核统一扩散模型，革新图像生成

华为盘古多模态生成团队推出Selftok技术，通过反向扩散过程将自回归先验融入视觉token，让像素流转化为遵循因果律的离散序列。Selftok摒弃了传统的空间token化方法，解决了现有方法中因果依赖被破坏的问题，实现了视觉与语言模态的完美融合。实验结果显示，Selftok在图像重建和跨模态生成任务中均达到行业领先水平，无需图文对齐数据即可实现高质量的图像生成。该技术还入选了CVPR 2025最佳论文候选，展现了华为在多模态生成领域的强大实力。来源：微信公众号【机器之心】

苹果开源FastVLM，视觉语言模型速度提升85倍，可在iPhone上直接运行

苹果公司开源了一款高效的视觉语言模型 FastVLM，能够在iPhone上直接运行，显著提升了视觉理解的速度和效率。FastVLM通过引入新型混合视觉编码器FastViTHD，融合卷积层和Transformer模块，大幅减少了视觉token数量，从而实现了极高的运行速度。与传统模型相比，FastVLM的首个token输出速度提升了85倍，同时保持了高精度。该模型支持多种参数量级版本，适用于边缘设备和实时图文任务场景，特别优化了在iOS/Mac生态中的运行性能。FastVLM的开源为移动设备上的AI应用提供了强大的技术支持。来源：微信公众号【机器之心】

阿里通义实验室开源ZeroSearch，大模型无需搜索引擎即可提升推理能力

阿里通义实验室推出ZeroSearch框架，通过模拟搜索引擎环境和渐进式抗噪训练，使大语言模型（LLM）能够在无需真实搜索引擎API的情况下提升检索和推理能力。ZeroSearch仅需3B参数的LLM作为检索模块，即可有效提升搜索能力，节省了高昂的API成本。该框架通过轻量级微调让LLM生成有用结果和噪声干扰文档，通过课程化抗噪训练逐步提升模型的推理能力。实验表明，ZeroSearch在多个问答数据集上显著优于现有方法，且与多种强化学习算法兼容。ZeroSearch的开源为大模型的检索能力提升提供了新的解决方案。来源：微信公众号【量子位】