2月13日·OpenThinker-32B开源,性能直逼DeepSeek-R1-32B
2月13日·周四 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
OpenThinker-32B开源,性能直逼DeepSeek-R1-32B
斯坦福、UC伯克利等多机构联合发布了开源推理模型OpenThinker-32B,并开源了114k训练数据。该模型仅用1/8数据量,在数学、代码和科学等基准测试中,性能超越李飞飞团队的s1模型,直逼DeepSeek-R1-Distill-32B。研究团队通过数据规模化、推理过程验证和模型扩展等方法,成功训练出这一SOTA级推理模型。OpenThinker-32B的开源,包括模型权重、数据集、训练代码等,为AI社区提供了宝贵资源,推动了开源推理模型的发展。来源:微信公众号【新智元】

文心一言宣布4月1日起免费并上线深度搜索功能
百度宣布文心一言将于4月1日起全面免费,消息引发广泛关注,百度股价随之上涨超10%。与此同时,文心一言上线了“深度搜索”功能,该功能通过自主调用联网、文档处理、绘图、代码解释器等多种工具,能够精准理解问题并提供专业详实的回答。在实测中,文心一言展现了强大的信息整合与分析能力,无论是宏观经济领域的深度对话,还是复杂任务的多工具调用,都能高效完成。这一升级不仅提升了用户体验,更标志着AI与搜索的深度融合,推动了信息交互方式的变革。来源:微信公众号【新智元】

哥德尔-Prover发布,成为当前最强形式化推理模型
普林斯顿大学陈丹琦团队开源了名为Goedel-Prover的形式化推理模型,该模型在自动定理证明任务上超越了DeepSeek-Prover,达到当前最佳水平。Goedel-Prover通过形式化语言进行推理,解决了非形式化推理难以验证的问题。团队利用大规模自然语言数学题数据集,训练形式化转换器,生成了包含164万条形式语句的数据集,并采用“专家迭代”方法优化模型。在多个基准测试中,Goedel-Prover表现优异,解题正确率显著提升,成功解决了大量复杂数学问题。此外,团队还将开源强化学习版本及164万条形式化陈述,为形式化推理研究提供新动力。来源:微信公众号【机器之心】


DeepSeek-R1实现GPU内核自动生成,性能超越人工优化
英伟达研究团队利用DeepSeek-R1模型通过推理时扩展技术实现了GPU内核的自动生成与优化。实验表明,DeepSeek-R1生成的GPU内核在某些情况下甚至优于熟练工程师开发的优化内核。该研究利用闭环推理流程,通过验证器对生成的内核进行分析并反馈提示,引导模型不断改进代码。结果显示,该方法可在15分钟内生成优化的注意力内核,并在斯坦福KernelBench基准测试中达到100%的Level-1问题解决率。这一成果不仅展示了大模型在代码生成领域的潜力,也引发了对AI技术可能改变传统编程模式的讨论。来源:微信公众号【机器之心】

腾讯主力AI应用“元宝”正式接入DeepSeek-R1满血版,成为首个引入第三方模型的应用。用户可以在混元模型和DeepSeek-R1之间自由切换,同时享受联网搜索功能。此次接入的DeepSeek-R1-671B版本支持调用微信公众号、视频号等腾讯独家生态内容,进一步提升信息的准确性和实时性。量子位的测试显示,切换到DeepSeek-R1后的腾讯元宝在联网搜索和推理能力上表现出色,几乎每问必答且响应迅速。腾讯表示,元宝依托腾讯云的充足算力,针对推理效率进行了优化,保障用户体验。此次合作不仅是腾讯对DeepSeek技术能力的认可,也展现了腾讯在A来源:微信公众号【量子位】
