5月17日·OpenAI发布最强AI编程智能体Codex,开启编程新时代
5月17日·周六 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
OpenAI发布最强AI编程智能体Codex,开启编程新时代
OpenAI正式推出云端AI编程智能体Codex,由优化版模型codex-1加持,专为软件工程量身打造。Codex能够在云端沙盒环境中并行处理多项任务,与GitHub无缝集成,直接调用代码库,实现快速构建功能模块、修复代码漏洞、提交PR及自动测试验证等功能。其多任务并行能力可将原本耗时数天的任务缩短至30分钟内完成。基准测试显示,codex-1在SWE-bench上得分72.1%,超越Claude 3.7和o3-high。Codex将向全球ChatGPT Pro、Enterprise和Team用户开放,未来还将支持实时协作与异步任务委托,进一步提升开发效率。来源:微信公众号【新智元】

MIT博士论文造假风波:诺奖导师举报,学校官宣撤稿
MIT一名博士生的论文因数据造假被导师举报,学校要求撤稿。该论文曾因声称AI显著提升材料科学研究效率而备受关注,甚至获得顶级经济学期刊的发表机会。然而,随着质疑声不断,论文数据的真实性受到挑战。伦敦大学学院教授Robert Palgrave曾指出论文存在诸多疑点,如数据来源不明、研究方法不严谨等。最终,MIT展开内部审查后确认论文问题,要求撤稿。这一事件引发了学术界对数据造假和学术诚信的广泛关注。来源:微信公众号【新智元】

华为Selftok技术:用自回归内核统一扩散模型,革新图像生成
华为盘古多模态生成团队推出Selftok技术,通过反向扩散过程将自回归先验融入视觉token,让像素流转化为遵循因果律的离散序列。Selftok摒弃了传统的空间token化方法,解决了现有方法中因果依赖被破坏的问题,实现了视觉与语言模态的完美融合。实验结果显示,Selftok在图像重建和跨模态生成任务中均达到行业领先水平,无需图文对齐数据即可实现高质量的图像生成。该技术还入选了CVPR 2025最佳论文候选,展现了华为在多模态生成领域的强大实力。来源:微信公众号【机器之心】

苹果开源FastVLM,视觉语言模型速度提升85倍,可在iPhone上直接运行
苹果公司开源了一款高效的视觉语言模型FastVLM,能够在iPhone上直接运行,显著提升了视觉理解的速度和效率。FastVLM通过引入新型混合视觉编码器FastViTHD,融合卷积层和Transformer模块,大幅减少了视觉token数量,从而实现了极高的运行速度。与传统模型相比,FastVLM的首个token输出速度提升了85倍,同时保持了高精度。该模型支持多种参数量级版本,适用于边缘设备和实时图文任务场景,特别优化了在iOS/Mac生态中的运行性能。FastVLM的开源为移动设备上的AI应用提供了强大的技术支持。来源:微信公众号【机器之心】

阿里通义实验室开源ZeroSearch,大模型无需搜索引擎即可提升推理能力
阿里通义实验室推出ZeroSearch框架,通过模拟搜索引擎环境和渐进式抗噪训练,使大语言模型(LLM)能够在无需真实搜索引擎API的情况下提升检索和推理能力。ZeroSearch仅需3B参数的LLM作为检索模块,即可有效提升搜索能力,节省了高昂的API成本。该框架通过轻量级微调让LLM生成有用结果和噪声干扰文档,通过课程化抗噪训练逐步提升模型的推理能力。实验表明,ZeroSearch在多个问答数据集上显著优于现有方法,且与多种强化学习算法兼容。ZeroSearch的开源为大模型的检索能力提升提供了新的解决方案。来源:微信公众号【量子位】
