9月22日·周日 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
AI在《黑神话》中超越人类玩家:无强化学习纯大模型方案
近日,阿里巴巴的研究人员展示了一个新型的VARP(视觉动作角色扮演)智能体框架,该框架在《黑神话·悟空》游戏中的表现令人瞩目。该智能体无需强化学习,仅通过大模型即可直接将游戏截图作为输入,通过视觉语言模型推理生成Python代码形式的动作,操作游戏角色。在90%的简单和中等难度战斗场景中,AI的表现甚至超过了人类玩家。研究团队构建了包含键鼠操作和游戏截图的人类操作数据集,并提出了动作规划系统和人类引导轨迹系统。在精英怪牯护院的战斗中,AI的胜率尤其突出。然而,对于新手玩家普遍感到困难的幽魂,AI同样面临挑战。这项研究不仅展示了AI在游戏领域的新进展,也预示着未来AI技术在更多领域的应用潜力。来源:微信公众号【量子位】
OpenAI o1:AI推理新高度,AlphaGo启发下的创新
OpenAI 最新推出的 o1 模型,以其卓越的推理能力在AI领域引起广泛关注。o1 不需专门训练即可处理复杂任务,如数学竞赛和博士级别的科学问答。o1 的研发团队在访谈中透露,该模型的灵感部分源自AlphaGo,结合了强化学习和监督学习两种范式。团队成员包括 Jakub Pachocki、Łukasz Kaiser 和 Ilya Sutskever 等,他们分享了研发过程中的挑战与突破。o1 通过生成连贯的思维链,显著提升了AI的思考和推理能力。此外,o1 Mini 的推出旨在将推理能力带给更多用户,尽管它在知识面上有所限制,但在推理方面表现出色。OpenAI 对算法进步和大规模系统的构建给予了同等重视,这在 o1 的成功中发挥了关键作用。来源:微信公众号【机器之心】
群体智能新突破:GPT-4助力LLM数学性能提升11.6%
在人工智能领域,群体智能的崛起正推动着技术的新浪潮。最近,蒙特利尔大学、剑桥、普林斯顿以及谷歌DeepMind的研究人员联合发现,通过GPT-4的辅助,其他大型语言模型(LLM)在数学问题解决上的性能显著提升了11.6%。这一成果通过一种“元认知”的方式实现,即GPT-4能够识别并标记数学问题所需的解决技能,从而引导其他LLM更有效地解决问题。研究团队通过自动化技能发现过程,将数学问题分类,并利用这些分类来提升模型的解题能力。这一发现不仅展示了LLM在数学领域的潜力,也为AI的群体智能协作提供了新的思路。来源:微信公众号【新智元】
DeepMind提出AligNet框架:类人神经网络新进展
DeepMind的最新研究提出了AligNet框架,旨在通过层次化视觉概念对齐人类感知,以缩小人工智能与人类智能之间的差异。该框架通过模拟人类判断来训练教师模型,并将类人结构迁移到预训练的视觉基础模型中,从而提高模型在多项任务上的表现,增强泛化性和鲁棒性。AligNet利用仿射变换对齐神经网络模型与人类在语义判断上的差异,通过聚类生成大量语义相似性三元组,进而将这种类人相似性结构信息迁移到预训练的神经网络中。实验结果显示,AligNet框架显著提升了模型与人类行为的一致性,使模型的内部表示更贴近人类的语义类别层次结构,为实现更类人的AI系统提供了新的可能性。来源:微信公众号【新智元】
上交、伯克利提出DVLO:基于深度聚类的多模态融合新网络
在ECCV 2024的一次口头报告中,上海交通大学与加州伯克利大学的研究团队联合提出了一种新型的多模态融合网络——DVLO,该网络首次基于深度聚类进行图像与点云数据的融合。DVLO通过双向结构对齐策略,实现了局部到全局的信息融合,显著提升了视觉/激光雷达里程计的性能。研究者们设计了一种局部到全局的融合策略,不仅促进了全局信息的交互,还保留了局部的细粒度信息。在KITTI里程计数据集上的实验结果显示,DVLO在多数序列上超越了现有的深度激光雷达、视觉和视觉激光雷达融合里程计方法,达到了新的最佳状态(SOTA)。此外,DVLO的融合策略也成功应用于场景流估计等其他多模态任务,展现了其广泛的适用性和强大的性能。来源:微信公众号【机器之心】
【今日案例】
AI赋能运动员体能检测与训练
https://yuanbao.tencent.com/bot/app/share/chat/d676ecebba48d7fc38a9e03c24adfe33