7月23日·Llama 3.1:开源巨兽,超越GPT-4o的AI新纪元
7月23日·周二 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
Llama 3.1:开源巨兽,超越GPT-4o的AI新纪元
近日,Reddit上泄露的Llama 3.1模型引起了广泛关注。这款开源的AI模型拥有高达4050亿参数,其性能在多个基准测试中超越了Meta的GPT-4o和Claude Sonnet 3.5等闭源模型,达到了SOTA(State of the Art)水平。Llama 3.1不仅在性能上取得突破,还支持包括英语、法语、德语、印地语、意大利语、葡萄牙语、西班牙语和泰语在内的多语言输入和输出。模型使用了超过15万亿个token的公开数据进行训练,预训练数据截止日期为2023年12月。此外,Llama 3.1还采用了分组查询注意力(Grouped Query Attention)技术,以提高推理可扩展性。尽管模型卡信息和部分下载链接已经泄露,但出于安全考虑,建议等待官方渠道的正式发布。Llama 3.1的问世,预示着AI领域又一重大进步,为多语言对话和自然语言生成任务提供了强大的新工具。来源:微信公众号【机器之心】
中国学者陈麟参与解决数学界重大难题:几何朗兰兹猜想
历经30年的数学探索,几何朗兰兹猜想终于得到证明,这一成就标志着数学领域的一大突破。由9位数学家组成的团队完成了这项工作,其中中国学者陈麟作为主要作者之一,贡献显著。几何朗兰兹猜想是朗兰兹纲领的几何化版本,该纲领被誉为现代数学研究中最大的单项项目,旨在揭示数论、代数几何和群表示论之间的深刻联系。陈麟,清华大学丘成桐数学科学中心的助理教授,曾在15岁时获得国际数学奥林匹克(IMO)金牌。此次证明不仅为数学和物理学领域提供了新的视角和工具,还为量子场论和弦理论研究开辟了新的道路。这项成果得到了包括菲尔兹奖得主彼得·舒尔茨在内的多位数学界重量级人物的高度评价。来源:微信公众号【量子位】
马斯克打造世界最强AI超算集群,10万块H100芯片助力下一代模型训练
埃隆·马斯克近日在推特上宣布,由xAI、X和英伟达等合作方共同打造的孟菲斯超级集群已正式投入使用,开始训练任务。这一集群由10万块H100芯片组成,规模超越了目前世界上最强大的超级计算机Frontier。xAI创始成员表示,公司成立之初便致力于实现数据、人才和计算三方面的优势,如今这一目标已经实现。马斯克还透露,该超算集群的建成将为训练全球最强AI模型提供重大优势,预计Grok-3模型的训练将需要这批H100芯片的支持。
此外,马斯克还提到,尽管今年6月曾对H100芯片的电力需求表示担忧,但预计将在明年夏天投入使用由30万块B200芯片组成的更大规模集群。xAI与甲骨文的合作仍在继续,但10万卡H100集群选择了自建模式,并以极快的速度推进建设。戴尔和超微成为了新的合作商,马斯克亲自参与了集群的建设过程。
来源:微信公众号【量子位】
神经网络在Minecraft中展现空间意识,研究成果登上《自然-机器智能》
加州理工学院的研究团队在神经网络领域取得突破性进展,首次证明了神经网络能够创建自己的空间地图。研究者们利用预测编码算法,在《我的世界》(Minecraft)游戏中训练神经网络,使其能够学习并预测环境中物体的空间组织。这项研究不仅展示了神经网络的空间感知能力,还揭示了它们如何将信息以空间形式存储和组织。通过在Minecraft中录制的视频训练,神经网络能够预测视频的后续帧,且预测精度极高,均方误差仅为0.094%。研究结果发表在《自然 – 机器智能》(Nature Machine Intelligence)杂志上,这一发现有望推动神经网络在解决复杂问题方面的能力,向更高级的人工智能迈进。来源:微信公众号【机器之心】
谷歌AI革新气候模拟,NeuralGCM模型效率提升10万倍
谷歌AI团队开发了一种革命性的新气候模型NeuralGCM,该模型结合了机器学习和传统物理方法,实现了在气候模拟方面的重大突破。NeuralGCM在模拟大气方面的效率比其他模型高出惊人的10万倍,同时在2至15天的天气预报中比现有最先进的物理模型还要准确。这项成果不仅在《Nature》杂志上发表,也标志着高性能计算领域25年的进步速度。
NeuralGCM模型通过使用神经网络学习小尺度天气变化的物理原理,并结合大规模过程的数值求解器,克服了传统模型在模拟小尺度气候过程时的局限性。它能够快速生成集合天气预测,且在气候尺度预测方面表现出色,预测1980年至2020年间的气温平均误差仅为0.25摄氏度,远低于其他模型。
谷歌团队已在GitHub上公开了NeuralGCM的源代码和模型权重,以促进气候科学社区的进一步研究和模型改进。NeuralGCM的成功开发和公开,为气候预测和理解提供了一个快速、准确且成本效益高的全新工具。来源:微信公众号【新智元】