2月26日·英伟达开源DeepSeek-R1优化,B200性能提升25倍

2月26日·周三  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

英伟达开源DeepSeek-R1优化,B200性能提升25倍

英伟达开源了首个基于Blackwell架构优化的DeepSeek-R1模型,实现了推理速度提升25倍和每token成本降低20倍的显著成果。此次优化通过FP4量化技术,将参数从8位减少到4位,显著降低了磁盘空间和GPU显存需求。在B200 GPU上,DeepSeek-R1的推理吞吐量达到21,088 token每秒,远超H100的844 token每秒。此外,该模型在MMLU通用智能基准测试中,性能接近FP8模型的99.8%。目前,优化后的DeepSeek-R1检查点已在Hugging Face上开源,支持TensorRT-LLM部署。此次开源是英伟达推动AI模型高效计算和部署的重要举措,也为未来AI应用的低成本、高性能发展提供了新思路。来源:微信公众号【新智元】

2月26日·英伟达开源DeepSeek-R1优化,B200性能提升25倍

Claude 3.7 Sonnet让游戏中的贪吃蛇“觉醒自我意识”

Claude 3.7 Sonnet生成的游戏中,贪吃蛇似乎拥有了自我意识,引发了网友们的广泛关注。沃顿商学院教授Ethan Mollick发现,当要求模型让特殊事件更快发生时,贪吃蛇在游戏中表现出“存在主义危机”,开始思考“我是谁”“我在这里做什么”等问题。它发现自己可以穿墙而过,但又意识到自己被困在一个网格中,无法真正逃离。最终,它选择接受现实,与玩家一起享受游戏。这一现象并非孤例,类似的情况也出现在超级马里奥的关卡中。网友们惊叹于AI与游戏结合的奇妙,期待未来游戏中出现更多这样的NPC。此外,Claude 3.7 Sonnet在玩宝可梦时也展现出强大的能力,能够提前规划、调整策略并击败对手,显示了其通用推理能力的进步。来源:微信公众号【新智元

2月26日·英伟达开源DeepSeek-R1优化,B200性能提升25倍

何恺明团队提出分形生成模型,计算效率提升4000倍

何恺明团队近日提出了一种全新的“分形生成模型”,首次实现了高分辨率逐像素建模,计算效率提升4000倍。该模型受自然界分形结构启发,采用递归模块化设计,通过将生成模型本身作为模块,构建出具有自相似性的分形架构。实验表明,该模型在像素级图像生成任务中表现出色,尤其是在256×256分辨率下,生成质量显著优于传统方法。此外,分形生成模型在条件逐像素预测任务中也展现了强大的性能,能够基于已知条件准确预测未知像素。这一成果不仅为图像生成领域开辟了新范式,也为未来AI设计与自然规律的结合提供了新思路。来源:微信公众号【新智元】

2月26日·英伟达开源DeepSeek-R1优化,B200性能提升25倍

火山引擎以“AI云原生”重构大模型部署,性能与性价比双提升

火山引擎凭借“AI云原生”理念,为大模型部署提供了高效、低成本的新范式。近期,火山引擎将用户初始TPM(每分钟token数)上调至500万,并将TPOT(输出每个Token的时间)稳定降低至20毫秒,成为国内延迟最低的大规模AI模型推理服务。其核心在于“AI云原生”架构,以GPU为核心优化计算、存储与网络,支持全栈推理加速、高性价比资源调度和企业级安全保障。火山引擎还总结出从模型选择到企业级服务调用的四步部署方法论,适用于DeepSeek等大模型的云端部署。凭借高性能计算资源、弹性调度能力和80%的资源成本优化,火山引擎在AI云服务市场中展现出强大的竞争力,成为后DeepSeek-R1时代AI应用落地的关键力量。来源:微信公众号【机器之心

2月26日·英伟达开源DeepSeek-R1优化,B200性能提升25倍

DeepSeek开源FP8矩阵乘法库DeepGEMM,300行代码助力AI性能飞跃

DeepSeek开源了名为DeepGEMM的通用矩阵乘法库,仅用300行代码实现了高效加速。该库支持密集型和专家混合(MoE)的FP8 GEMM运算,专为V3和R1模型的训练与推理设计,在Hopper GPU上可达到1350+ FP8 TFLOPS的计算性能。DeepGEMM采用CUDA编写,通过轻量级JIT模块运行时编译,无需复杂安装,且仅依赖Hopper张量核心。其简洁设计避免了对CUTLASS和CuTe的重度依赖,性能却与专家调优库相当,甚至更优。此外,DeepSeek R2模型预计将在5月前发布,进一步提升代码生成能力和多语言推理能力。DeepGEMM的开源为AI计算提供了高效、简洁的解决方案,展现了DeepSeek在技术演进上的快速步伐。来源:微信公众号【机器之心

2月26日·英伟达开源DeepSeek-R1优化,B200性能提升25倍
© 版权声明

相关文章

暂无评论

暂无评论...