2月17日·DeepSeek团队推出CodeI/O，显著提升LLM推理能力

AI资讯速递1年前 (2025)发布 FuturX-Editor

672 0 0

2月17日·周一 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

DeepSeek团队推出CodeI/O，显著提升LLM推理能力

DeepSeek团队联合上海交通大学、香港科技大学研究人员推出CodeI/O方法，通过代码输入/输出预测提炼LLM推理模式，显著提升逻辑、数学等推理任务表现。该方法将代码转换为可执行函数，以自然语言思维链形式预测执行输出或可行输入，从而将推理流程从代码语法中解脱，保留逻辑严谨性。实验表明，CodeI/O在符号推理、科学推理、数学推理等任务上实现一致性能提升。此外，团队还通过多轮修订提升数据质量，增强跨领域推理能力。该成果获得Ai2研究所专家高度评价，论文已发布于arXiv，项目主页同步上线。来源：微信公众号【新智元】

DeepSeek助力TongGeometry，几何解题性能达IMO金牌水平

由北京通用人工智能研究院开发的TongGeometry模型在国际数学奥林匹克竞赛（IMO）几何题解题能力上取得重大突破，性能达到IMO金牌水平。该模型基于DeepSeek-Coder微调，通过策略网络和价值网络联合Beam Search进行解题，能够解决IMO-AG-30数据集中的所有30题，并在IMO-AG-50数据集上解决42题，超越人类金牌选手平均水平。TongGeometry不仅解题能力强，还能生成高质量的几何题目，其题目已被纳入全国高中数学联赛和美国USEMO竞赛。此外，TongGeometry在硬件需求上大幅优化，仅需32个CPU核心和1块4090显卡即可实现高效解题，相比谷歌DeepMind的AlphaGeometry，性能提升18倍。来源：微信公众号【量子位】

群核科技冲刺全球空间智能第一股

由浙大清华校友创办的群核科技正式向港交所递交招股说明书，冲击“全球空间智能第一股”。群核科技专注于空间认知技术研发与落地，凭借深厚技术积累和市场优势，成为全球最大的空间设计平台。2024年，其平均月活跃访客数达8630万，占据中国空间设计行业22.2%的市场份额。公司核心技术包括GPU基础设施、AI技术及合成数据生成技术，并构建了全球最大的室内场景认知深度学习数据集，填补了物理正确性数据的空白。此外，群核科技的多模态CAD大模型可实现物理正确的3D内容生成，直接应用于工业制造。其商业模式也从传统SaaS向Agent as a Service转型，借助算力收费释放技术优势。随着空间智能的爆发，群核科技的上市将成为行业标志性事件。来源：微信公众号【量子位】

新版GPT-4o超越DeepSeek-R1，登顶大模型竞技场

OpenAI推出的GPT-4o更新版本在大模型竞技场中表现突出，超越DeepSeek-R1并登上并列第一的位置。新版GPT-4o在创意写作、编程、指令遵循、长文本查询和多轮对话等多个单项任务中表现优异，尤其在编程任务中，生成的代码效果显著提升。此外，GPT-4o的个性变得更加鲜明，回复语气更拟人化，甚至能够“盲猜”用户心理。OpenAI CEO奥特曼表示，GPT-4o“相当不错，且不久将变得更好”。与此同时，网友还发现了ChatGPT的最新系统提示词，推测这可能是OpenAI为GPT-4.5做准备的早期测试版本。随着GPT-4o的升级，其与DeepSeek等模型的竞争也愈发激烈，未来表现备受期待。来源：微信公众号【量子位】

线性注意力机制ToST获ICLR Spotlight，重塑Transformer效率

加州大学伯克利分校吴梓阳团队提出了一种基于统计学的线性注意力机制——Token Statistics Transformer（ToST），并凭借该成果获得ICLR 2025大会Spotlight。ToST通过变分编码率缩减（VRR）框架，将传统Transformer的二次方计算复杂度降低至线性，显著提升了长序列处理效率。实验表明，ToST在自然语言处理和计算机视觉任务中表现优异，且模型可解释性更强。该成果不仅为大模型的高效化提供了新思路，还为多模态融合和跨学科应用奠定了基础。来源：微信公众号【机器之心】