2月8日·谷歌AI斩获奥数金牌,AlphaGeometry 2突破几何难题

2月8日·周六  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

谷歌AI斩获奥数金牌,AlphaGeometry 2突破几何难题

谷歌DeepMind的AI系统AlphaGeometry 2(AG2)在国际数学奥林匹克竞赛(IMO)中取得重大突破,成功摘得金牌。AG2在2000-2024年IMO几何题的解题率从54%飙升至84%,横扫42道几何难题,超越了历年IMO金牌得主的平均水平。此次突破得益于AG2采用的全新搜索算法——基于知识共享集成的搜索树(SKEST),以及更强大的语言模型和符号引擎。AG2不仅能够自动理解自然语言形式的几何问题,还能通过关键的辅助作图,给出优雅的解法,展现出超凡的创造力。尽管仍有部分高级几何解法技巧尚未实现,但AG2的成就标志着AI在数学竞赛领域的巨大潜力。来源:微信公众号【新智元】

2月8日·谷歌AI斩获奥数金牌,AlphaGeometry 2突破几何难题

AIME 2025初赛暴露数据集污染问题,o3-mini表现亮眼

AIME 2025 I数学竞赛中,大语言模型的表现引发了广泛关注。o3-mini以78%的正确率脱颖而出,而DeepSeek-R1则以65%的成绩位列第四。然而,威斯康星大学麦迪逊分校教授Dimitris Papailiopoulos对这一结果提出了质疑。他发现,AIME 2025的多道题目在互联网上存在相似或相同的“原题”,这暗示了数据集可能被污染。这一发现引发了对AI模型是否真正具备数学推理能力的讨论。MathArena平台旨在评估大模型在未见过的数学问题上的推理和泛化能力,但数据净化的难度使得评估结果的可信度受到挑战。尽管如此,o3-mini的表现仍显示出其在数学推理方面的潜力。来源:微信公众号【新智元

2月8日·谷歌AI斩获奥数金牌,AlphaGeometry 2突破几何难题

微软研究院、剑桥大学和中科院联合提出了一种新的多模态推理方法——多模态思维可视化MVoT)。该方法通过融合文本和图像信息,让AI在推理过程中能够“想象”并生成视觉图像,从而提升推理的可解释性和稳健性。与传统的思维链(CoT)相比,MVoT在复杂空间推理任务中表现更优,尤其是在高难度场景中,准确率高出20%以上。此外,MVoT还可以与CoT组合使用,进一步提升模型性能。研究人员通过引入token差异损失,优化了多模态序列建模,使模型在生成视觉推理时更加准确。这一成果不仅推动了多模态推理技术的发展,也为AI的空间想象力和自我解释能力提供了新的思路。来源:微信公众号【新智元】

2月8日·谷歌AI斩获奥数金牌,AlphaGeometry 2突破几何难题

港中文提出文生图CoT推理新范式,显著提升图像生成质量

香港中文大学等机构的研究者首次将思维链(CoT)推理应用于图像生成领域,提出了一种新的推理和优化框架。研究团队通过“Verify(验证)”和“Reinforce(强化)”方案,系统性探索了CoT推理在文生图任务中的潜力,并提出了两种新型奖励模型:潜力评估奖励模型(PARM)及其增强版本PARM++。PARM通过清晰度判断、潜力性评估和最佳选择三个步骤优化图像生成质量,而PARM++则引入反思机制,进一步提升生成效果。实验表明,结合测试时验证和偏好优化(DPO)对齐的策略,模型在文本生成图像任务中的性能提升了27%。这一成果为自回归图像生成领域带来了新的突破,也为大模型推理能力的提升提供了新的思路。来源:微信公众号【机器之心】

2月8日·谷歌AI斩获奥数金牌,AlphaGeometry 2突破几何难题

苹果推出“台灯机器人”,用动作表达情绪重新定义交互

苹果公司最新研究展示了一款独特的非人形机器人——“台灯机器人”,它通过灵活的动作表达“情绪”,重新定义了机器人与人类的交互方式。这款机器人灵感来源于皮克斯动画《Luxo Jr.》,由6自由度机械臂、LED灯头、激光投影仪和摄像头组成。研究团队开发了名为ELEGNT的框架,将机器人运动建模为马尔可夫决策过程,融合功能效用与表达效用。实验表明,加入表达性动作的机器人在人性化程度、感知智能和互动参与度等方面显著优于传统机器人。用户研究中,参与者普遍认为这种机器人更具生命力和趣味性,甚至被比作“宠物”或“孩子”。这一创新为未来机器人设计提供了新的思路,让机器人不仅完成任务,还能传递情感。来源:微信公众号【量子位

2月8日·谷歌AI斩获奥数金牌,AlphaGeometry 2突破几何难题
© 版权声明

相关文章

暂无评论

暂无评论...