2月13日·OpenThinker-32B开源,性能直逼DeepSeek-R1-32B

2月13日·周四  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

OpenThinker-32B开源,性能直逼DeepSeek-R1-32B

斯坦福、UC伯克利等多机构联合发布了开源推理模型OpenThinker-32B,并开源了114k训练数据。该模型仅用1/8数据量,在数学、代码和科学等基准测试中,性能超越李飞飞团队的s1模型,直逼DeepSeek-R1-Distill-32B。研究团队通过数据规模化、推理过程验证和模型扩展等方法,成功训练出这一SOTA级推理模型。OpenThinker-32B的开源,包括模型权重、数据集、训练代码等,为AI社区提供了宝贵资源,推动了开源推理模型的发展。来源:微信公众号【新智元】

2月13日·OpenThinker-32B开源,性能直逼DeepSeek-R1-32B

文心一言宣布4月1日起免费并上线深度搜索功能

百度宣布文心一言将于4月1日起全面免费,消息引发广泛关注,百度股价随之上涨超10%。与此同时,文心一言上线了“深度搜索”功能,该功能通过自主调用联网、文档处理、绘图、代码解释器等多种工具,能够精准理解问题并提供专业详实的回答。在实测中,文心一言展现了强大的信息整合与分析能力,无论是宏观经济领域的深度对话,还是复杂任务的多工具调用,都能高效完成。这一升级不仅提升了用户体验,更标志着AI与搜索的深度融合,推动了信息交互方式的变革。来源:微信公众号【新智元

2月13日·OpenThinker-32B开源,性能直逼DeepSeek-R1-32B

哥德尔-Prover发布,成为当前最强形式化推理模型

普林斯顿大学陈丹琦团队开源了名为Goedel-Prover的形式化推理模型,该模型在自动定理证明任务上超越了DeepSeek-Prover,达到当前最佳水平。Goedel-Prover通过形式化语言进行推理,解决了非形式化推理难以验证的问题。团队利用大规模自然语言数学题数据集,训练形式化转换器,生成了包含164万条形式语句的数据集,并采用“专家迭代”方法优化模型。在多个基准测试中,Goedel-Prover表现优异,解题正确率显著提升,成功解决了大量复杂数学问题。此外,团队还将开源强化学习版本及164万条形式化陈述,为形式化推理研究提供新动力。来源:微信公众号【机器之心】

2月13日·OpenThinker-32B开源,性能直逼DeepSeek-R1-32B 2月13日·OpenThinker-32B开源,性能直逼DeepSeek-R1-32B

DeepSeek-R1实现GPU内核自动生成,性能超越人工优化

英伟达研究团队利用DeepSeek-R1模型通过推理时扩展技术实现了GPU内核的自动生成与优化。实验表明,DeepSeek-R1生成的GPU内核在某些情况下甚至优于熟练工程师开发的优化内核。该研究利用闭环推理流程,通过验证器对生成的内核进行分析并反馈提示,引导模型不断改进代码。结果显示,该方法可在15分钟内生成优化的注意力内核,并在斯坦福KernelBench基准测试中达到100%的Level-1问题解决率。这一成果不仅展示了大模型在代码生成领域的潜力,也引发了对AI技术可能改变传统编程模式的讨论。来源:微信公众号【机器之心

2月13日·OpenThinker-32B开源,性能直逼DeepSeek-R1-32B 2月13日·OpenThinker-32B开源,性能直逼DeepSeek-R1-32B
© 版权声明

相关文章

暂无评论

暂无评论...