9月16日·周一 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
AI模型o1智商超120,1小时内完成NASA博士年代码
加州大学欧文分校的物理学博士Kyle Kabasares在测试AI模型o1时发现,该模型能在1小时内完成他花费一年时间编写的博士论文代码。o1的表现令人震惊,不仅在智商测试中得分超过120,还在Codeforces编程比赛中超越了99.8%的选手。这一突破性进展展示了AI在编程和复杂问题解决方面的巨大潜力,预示着人工智能技术在多个领域的应用前景将更加广泛。来源:微信公众号【新智元】
MMMU华人团队发布Pro版,提升多模态AI基准测试难度
MMMU华人团队近日对多模态大型语言模型(MLLMs)的基准测试进行了更新,推出了更高难度的MMMU-Pro版本。新版本通过过滤纯文本问题、增加候选选项至10个以及引入纯视觉问答,旨在更严格地评估AI模型在多学科领域的多模态理解和推理能力。实验结果显示,模型在MMMU-Pro上的性能较原基准测试有显著下降,准确率下降了16.8%到26.9%。此外,研究还探讨了OCR提示和思维链(CoT)推理对模型性能的影响,发现CoT推理能显著提升模型在标准和视觉输入设置下的性能。这一更新标志着多模态AI评估标准的进步,推动了AI技术在理解和推理方面的发展。来源:微信公众号【新智元】
Chai Discovery挑战DeepMind,开源超越AlphaFold 3的AI模型
Chai Discovery,一家成立仅六个月的AI生物技术初创公司,宣布其最新模型Chai-1在蛋白质和其他生命分子预测方面达到或超越了DeepMind的AlphaFold 3的性能。Chai-1模型在药物发现任务中展现了卓越的表现,并已将模型权重和推理代码开源,仅限非商业用途。这一举措为研究人员和开发者提供了极大的便利,允许他们在本地运行、修改模型,或通过服务器在线调用。Chai-1的发布被视为药物发现领域的“ChatGPT时刻”,标志着分子生物学的黄金时代的到来。Chai Discovery由一群来自顶尖机构如OpenAI、谷歌、Meta FAIR的人才组成,其CEO Joshua Meier是ESM-1b蛋白质语言模型的作者之一。公司在成立之初便完成了3000万美元的种子轮融资,显示出其在AI生物技术领域的强大潜力。来源:微信公众号【新智元】
北大校友打造AI版“我的世界”,模拟人类社会
由北大校友、前MIT教授Robert Yang领导的团队推出了一个名为Sid的AI项目,该项目通过1000个智能体模拟人类社会,构建了一个虚拟世界。这些智能体在GPT-4技术的加持下,能够进行长期自主运作、组织性协作,并具备亲人类动机和有意识的沟通能力。在这个世界中,智能体使用统一货币宝石(gem)进行物品交换,并通过投票表达对领导人的支持或反对,甚至能通过投票修改宪法。该项目展示了智能体在模拟社会中的复杂互动和决策过程,引发了人们对AI与人类社会融合的广泛讨论。来源:微信公众号【量子位】
上交大与哈佛联合推出LoRA-Dash,革新AI模型微调框架
上海交通大学和哈佛大学的研究人员共同提出了一种新的AI模型微调框架LoRA-Dash,旨在解决特定任务微调中计算资源消耗大的问题。LoRA-Dash在参数量减少8至16倍的情况下,能够达到与LoRA方法相同的效果,显著提高了微调效率。该框架通过严格定义并分析特定任务方向(Task-specific Directions, TSD),并在此基础上进行优化,使得模型能够更快地适应新任务。实验表明,LoRA-Dash在常识推理、自然语言理解和主体驱动生成等任务上均取得了显著的性能提升。这一成果不仅展示了TSD在提升微调性能方面的潜力,也为未来AI模型的优化提供了新的方向。来源:微信公众号【量子位】
【今日案例】
上海中秋台风影响
https://yuanbao.tencent.com/bot/app/share/chat/f0b68619b09638268b74821a272e57bf/issueShare