10月4日·GPT-5的电脑操作水平接近人类水平
10月4日·周六 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
GPT-5的电脑操作水平接近人类水平
Agent S3在计算机使用智能体(CUA)领域取得了重大突破,其性能在OSWorld基准测试中达到了69.9%,仅比人类水平低2%。Agent S3通过简化框架并引入原生代码智能体,将性能提升至62.6%,刷新了当前的最佳成绩。此外,Agent S3首次引入了并行扩展的CUA框架——Behavior Best-of-N (bBoN),通过多次执行挑选最佳结果,使准确率进一步提高到69.9%。这一成果展示了AI在模拟人类电脑操作方面的巨大潜力,预示着未来软件自动化操作的广阔前景。来源:微信公众号【机器之心】

Insta360全景视觉研究迎来系统性综述
Insta360影石研究院及其合作高校发布了一篇全景视觉领域的最新综述文章,系统梳理了从透视视觉到全景视觉的差距、挑战和方法。该综述基于300多篇论文,覆盖20多个代表性任务,首次以“透视-全景gap”为主线,分析了全景视觉的三大核心挑战:几何畸变、非均匀采样和边界连续性问题。文章还提出了多种解决方案,并对未来的研究方向进行了展望。这篇综述为全景视觉领域的研究者和工程团队提供了清晰的研究路线图,有助于推动该领域的发展。来源:微信公众号【机器之心】

陶哲轩借助GPT-5解决数学难题
著名数学家陶哲轩再次借助GPT-5解决了MathOverflow上的一个数学难题。问题的核心是比较最小公倍数数列和高度丰数数列的关系。陶哲轩通过与GPT-5的对话,分步解决了这一问题,并最终通过GPT-5生成的29行Python代码验证了结果。这一过程不仅展示了AI在数学研究中的巨大潜力,还表明AI可以作为数学家的有力工具,帮助解决复杂的数学问题。陶哲轩表示,如果没有AI的帮助,完成这一任务将需要数小时的人工努力。来源:微信公众号【量子位】

OpenAI强硬回击马斯克的窃密诉讼
OpenAI对马斯克旗下xAI的窃密诉讼进行了强硬回击,全面否认了所有指控,并斥责马斯克滥用诉权。xAI指控OpenAI通过系统性挖角和诱导员工窃取其商业机密,但OpenAI反驳称这些指控毫无根据,并强调其招聘行为完全合法合规。OpenAI还指出,xAI公开未被指控泄密的离职员工信息是恶意“人肉”,目的是恐吓员工。双方的法律争端预计将在11月18日的听证会上进一步展开。来源:微信公众号【量子位】

AI系统17小时写出30页学术论文
一个名为Virtuous Machines的AI系统在17小时内完成了一篇30页的学术论文,涵盖了从选题到成稿的全过程。该系统通过模拟人类科研流程,自主设计实验、招募参与者、分析数据,并最终撰写出符合APA格式规范的论文。这一成果展示了AI在科研领域的巨大潜力,尤其是在提高效率和处理复杂数据方面。尽管AI在某些细节上仍有待改进,但其在科研自动化方面已经取得了显著进展。来源:微信公众号【量子位】
