2月13日·OpenThinker-32B开源，性能直逼DeepSeek-R1-32B

AI资讯速递1年前 (2025)发布 FuturX-Editor

630 0 0

2月13日·周四 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

OpenThinker-32B开源，性能直逼DeepSeek-R1-32B

斯坦福、UC伯克利等多机构联合发布了开源推理模型 OpenThinker-32B，并开源了114k训练数据。该模型仅用1/8数据量，在数学、代码和科学等基准测试中，性能超越李飞飞团队的s1模型，直逼DeepSeek-R1-Distill-32B。研究团队通过数据规模化、推理过程验证和模型扩展等方法，成功训练出这一SOTA级推理模型。OpenThinker-32B的开源，包括模型权重、数据集、训练代码等，为AI社区提供了宝贵资源，推动了开源推理模型的发展。来源：微信公众号【新智元】

文心一言宣布4月1日起免费并上线深度搜索功能

百度宣布文心一言将于4月1日起全面免费，消息引发广泛关注，百度股价随之上涨超10%。与此同时，文心一言上线了“深度搜索”功能，该功能通过自主调用联网、文档处理、绘图、代码解释器等多种工具，能够精准理解问题并提供专业详实的回答。在实测中，文心一言展现了强大的信息整合与分析能力，无论是宏观经济领域的深度对话，还是复杂任务的多工具调用，都能高效完成。这一升级不仅提升了用户体验，更标志着AI与搜索的深度融合，推动了信息交互方式的变革。来源：微信公众号【新智元】

哥德尔-Prover发布，成为当前最强形式化推理模型

普林斯顿大学陈丹琦团队开源了名为Goedel-Prover的形式化推理模型，该模型在自动定理证明任务上超越了DeepSeek-Prover，达到当前最佳水平。Goedel-Prover通过形式化语言进行推理，解决了非形式化推理难以验证的问题。团队利用大规模自然语言数学题数据集，训练形式化转换器，生成了包含164万条形式语句的数据集，并采用“专家迭代”方法优化模型。在多个基准测试中，Goedel-Prover表现优异，解题正确率显著提升，成功解决了大量复杂数学问题。此外，团队还将开源强化学习版本及164万条形式化陈述，为形式化推理研究提供新动力。来源：微信公众号【机器之心】

DeepSeek-R1实现GPU内核自动生成，性能超越人工优化

英伟达研究团队利用DeepSeek-R1模型通过推理时扩展技术实现了GPU内核的自动生成与优化。实验表明，DeepSeek-R1生成的GPU内核在某些情况下甚至优于熟练工程师开发的优化内核。该研究利用闭环推理流程，通过验证器对生成的内核进行分析并反馈提示，引导模型不断改进代码。结果显示，该方法可在15分钟内生成优化的注意力内核，并在斯坦福KernelBench基准测试中达到100%的Level-1问题解决率。这一成果不仅展示了大模型在代码生成领域的潜力，也引发了对AI技术可能改变传统编程模式的讨论。来源：微信公众号【机器之心】

腾讯元宝接入DeepSeek-R1满血版，支持联网与微信生态整合

腾讯主力AI应用“元宝”正式接入DeepSeek-R1满血版，成为首个引入第三方模型的应用。用户可以在混元模型和DeepSeek-R1之间自由切换，同时享受联网搜索功能。此次接入的DeepSeek-R1-671B版本支持调用微信公众号、视频号等腾讯独家生态内容，进一步提升信息的准确性和实时性。量子位的测试显示，切换到DeepSeek-R1后的腾讯元宝在联网搜索和推理能力上表现出色，几乎每问必答且响应迅速。腾讯表示，元宝依托腾讯云的充足算力，针对推理效率进行了优化，保障用户体验。此次合作不仅是腾讯对DeepSeek技术能力的认可，也展现了腾讯在A来源：微信公众号【量子位】