2月19日·DeepSeek V3/R1 满血微调秘籍发布，低成本打造高质量私有模型

AI资讯速递1年前 (2025)更新 FuturX-Editor

705 0 0

2月19日·周三 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

DeepSeek V3/R1 满血微调秘籍发布，低成本打造高质量私有模型

Colossal-AI 团队推出的开源大模型后训练工具箱，旨在帮助开发者通过后训练结合专业领域数据，低成本打造高质量的私有模型。该工具箱支持 DeepSeek V3/R1 6710 亿参数模型的 LoRA 低成本 SFT 微调，并兼容英伟达 GPU、华为昇腾 NPU 等多种硬件。此外，还提供了强化学习工具链，如 PPO、GRPO 等，以及灵活的训练配置接口。开发者可通过简单的脚本和命令，快速完成模型微调，显著降低硬件资源消耗，提升业务竞争力。来源：微信公众号【新智元】

2025 斯隆研究奖公布，8 位华人计算机科学家入选

2025 年斯隆研究奖名单揭晓，共有 126 位杰出科学家获奖，涵盖物理学、化学、数学、计算机科学等七大领域。其中，计算机科学领域有 22 位学者入选，华人科学家占据 8 席。这些华人学者多来自国内顶尖高校，包括清华姚班校友 Zhihao Jia、清华校友 Su Yu、上交大校友 Sharon Yixuan Li、浙大校友 Wen Sun 等。他们凭借在人工智能、机器学习、密码学等领域的卓越成就脱颖而出。斯隆研究奖被誉为“诺奖风向标”，自 1955 年设立以来，已有 58 位获奖者获得诺贝尔奖。此次获奖的华人学者展现了中国在前沿科技领域的强大人才培养能力，也为全球科学研究注入了新的活力。来源：微信公众号【新智元】

月之暗面发布新注意力架构MoBA，与DeepSeek NSA同日“撞车”

月之暗面科技有限公司发布了一种名为MoBA（Mixture of Block Attention）的新型注意力架构，并公开了相关代码。MoBA由月之暗面创始人杨植麟署名，旨在通过混合专家（MoE）原理优化Transformer模型的注意力机制，以高效处理长序列任务。与DeepSeek同日发布的NSA注意力机制类似，MoBA将上下文划分为块，通过无参数门控机制动态选择关键块进行计算，显著降低计算成本。实验表明，MoBA在处理长序列任务时表现出色，与全注意力机制相当，同时具备更高的效率和可扩展性。此外，MoBA已有一年的实际部署验证，其代码可在GitHub查看，为大语言模型的长上下文处理提供了新的解决方案。来源：微信公众号【机器之心】

宇树机器人被疑AI合成，王兴兴发新视频自证

宇树科技发布的机器人跳舞视频引发争议，被网友质疑是AI或CG合成。为回应质疑，宇树科技CEO王兴兴在小红书发布了一段宇树G1机器人的实拍视频，视频中机器人在镜子前跳舞，未添加配乐，以证明其动作的真实性。然而，尽管视频有力反驳了合成质疑，小红书平台仍标注该视频“疑似包含AI创作信息”。此前，宇树科技发布的机器人走路、跑步等视频也曾多次被质疑为合成，原因在于其动作自然流畅，与人类无异。尽管如此，宇树科技始终坚持开源初心，每月发布视频展示机器人最新进展，为公众带来震撼。此次事件也引发了关于AI合成内容识别的讨论。来源：微信公众号【量子位】

清华团队发布AgentSociety，推动智能社会治理研究变革

清华大学电子系城市科学与计算中心联合多学科团队，成功构建了基于大模型的“大型社会模拟器AgentSociety”1.0版本。该模拟器通过大模型驱动的社会人智能体、真实城市社会环境和大规模社会模拟引擎，能够精确模拟社会舆论传播、观点极化和公众政策响应等复杂社会现象。AgentSociety从社会学第一性原理出发，赋予智能体情感、需求和认知能力，使其能够在真实环境中动态交互，形成逼真的社会生态。此外，该平台还提供智能社会科学研究工具箱，支持实验、访谈、问卷调查等多种研究方法，助力社会科学研究范式从行为模拟向心智建模转变，为政策制定和智能社会治理提供有力支持。来源：微信公众号【机器之心】