2月10日

AI资讯速递2年前 (2024)更新 FuturX-Editor

685 0 0

2月10日·周六 AI工具和资源推荐

AI全网资源导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

DeepSeekMath：挑战大语言模型的数学推理极限

DeepSeekMath，一个7B模型但有逼近GPT-4的数学推理能力，在MATH基准榜单上超过一众30B~70B的开源模型。数据：来自Common Crawl提取的120B高质量数学网页数据，总数据量是开源数据集OpenWebMath的9倍。训练：使用了代码领域模型DeepSeek-Coder-v1.5初始化，可以获得比从通用用模型初始化更好的数学能力。对齐：引入了PPO变体的强化学习算法GRPO，丢弃了Critic Model，显著减少了训练显存并提升了对齐效果。实验：在中英数学基准榜单上超过Mistral 7B、Llemma-34B，逼近GPT-4能力，跟Minerva 540B效果相当。来源：微信公众号【DeepSeek】

“AI队友”悟性高，上海AI实验室推出多模态交互智能体框架OpenPAL

上海人工智能实验室（上海AI实验室）推出智能体框架OpenPAL，首次在多人实时竞技环境中验证了AI智能体在执行开放任务时的人机交互能力。当面对未知环境时，OpenPAL可通过自我探索学习实现“进化”，同时，相较于传统智能体框架，其部署成本更低，将为人类提供更友好、更可靠的“AI队友”支持，实现“人机共智”。多人实时竞技环境因其环境多样和任务随机性，通常被视作研究开放任务学习的理想环境。在与人类组队竞技时，OpenPAL在适应陌生环境后，不仅提前预判了有效的“进攻”集结点，还自发学会了借助墙壁、草丛等掩体，避开“敌人”视线，悄悄接近集结点。当人类通过语言明确任务目标后，OpenPAL在遵循指令的基础上，巧妙借助地形与建筑优势，从不同方向配合对“敌人”发动了“进攻”，表现出了良好的人机协同性。来源：微信公众号【上海人工智能实验室】