8月1日·谷歌开源端侧小模型Gemma 2 2B 性能超群

8月1日·周四 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

谷歌开源端侧小模型Gemma 2 2B 性能超群

谷歌近期开源了一款名为Gemma 2 2B端侧AI模型,该模型以2B参数量级在性能上超越了参数更多的GPT-3.5和Mixtral竞品模型。Gemma 2 2B不仅在真实对话任务中表现出色,还具备内置的安全改进功能,实现了性能与效率的平衡。此外,谷歌还推出了ShieldGemma安全内容分类器和Gemma Scope模型可解释性工具,以提高AI模型的安全性和透明度。Gemma 2 2B的轻量化特点使其在端侧设备上运行迅速,如在iPhone 15 Pro上的4bit量化版本表现出色。这一成果挑战了“模型越大越好”的传统观念,预示着小模型在AI领域的巨大潜力。来源:微信公众号【机器之心】

8月1日·谷歌开源端侧小模型Gemma 2 2B 性能超群

斯坦福大学推出arXiv论文讨论平台alphaXiv,促进学术交流

斯坦福大学的学生团队为arXiv论文库创建了一个名为alphaXiv的开放讨论论坛。这个平台允许用户在任何arXiv论文上直接发布问题和评论,实现对论文段落甚至句子的精准定位讨论。用户可以在论文旁边看到实时讨论区,提出问题或发表评论,并与他人互动,包括回应、点赞或反对评论。这种创新的学术交流方式得到了图灵奖得主Yann LeCun的认可。alphaXiv的推出,不仅为学术界提供了一个更为便捷的协作和讨论环境,也推动了学术研究的透明度和互动性。许多论文作者,如《KAN or MLP: A Fairer Comparison》的第一作者Runpeng Yu,已经在平台上与读者进行了积极的交流。alphaXiv的上线,标志着学术交流方式的一次重大进步。来源:微信公众号【机器之心】

8月1日·谷歌开源端侧小模型Gemma 2 2B 性能超群

浪潮信息突破CPU服务器运行千亿参数大模型难题

浪潮信息在AI算力领域取得重大突破,成功在通用CPU服务器上运行了102B参数规模的大模型推理。这一成果不仅展示了通用服务器在处理大规模AI任务上的潜力,也为传统行业提供了无需专用芯片即可使用AI的可能性。面对计算、内存和通信的硬件资源巨大需求,浪潮信息通过软硬件系统的协同创新,优化了CPU与内存之间的数据搬运效率,并采用全链路UPI总线互连技术,显著提高了通信带宽和减少了延迟。此外,浪潮信息还引入了张量并行计算和NF4量化技术,进一步提升了模型的推理性能。这项技术攻关不仅填补了业界空白,还为企业提供了一个成本效益更高的AI部署新选择,推动了AI在更多行业的应用。来源:微信公众号【新智元】

8月1日·谷歌开源端侧小模型Gemma 2 2B 性能超群

美国计划推出芯片新规限制中国厂商,但部分盟友获豁免

据外媒报道,美国政府计划在下个月公布一项新的芯片出口管制规定,旨在进一步限制中国芯片制造商获取关键半导体设备。这项规定预计会扩展所谓的《外国直接产品规则》,影响约六家中国顶尖半导体企业,阻止它们从多国获取出口产品。然而,美国的重要盟友,包括日本、荷兰和韩国等关键芯片设备出口国,将被排除在新规定之外,从而限制了规则的全球影响力。与此同时,美国还计划将约120家中国实体加入限制贸易名单,要求供应商获得许可证才能发货,而这些许可证很可能会被拒绝。尽管如此,美国的新规定草案还豁免了A:5集团中的30多个国家,显示了美国在实施限制措施时的外交考量。中国外交部对此表示,美国的做法破坏了全球贸易,损害了各方利益,并强调遏制和打压阻挡不了中国的发展。来源:微信公众号【AI前线】

AI大模型发展或将重演CNN路径:由大到小的转变

近期,AI领域观察者注意到大型神经网络模型的发展可能正重演卷积神经网络(CNN)的发展历程。贾扬清等业界专家提出,随着大模型参数规模的增长,行业未来可能会转向更小、更高效的模型。这一观点与当前业界普遍认同的Scaling Law形成对比,而Scaling Law认为模型越大,性能越好。贾扬清指出,7B-70B参数规模的大模型在实际应用中更为方便,它们易于托管且能够提供质量上乘的输出。此外,他还提到OpenAI正在开发比当前“最先进”大模型更小但速度更快的模型。这一转变可能意味着行业将更加重视性价比和实用性。CNN的发展历史也支持这一观点,从AlexNet的崛起到MobileNet的端侧应用,模型的发展经历了由大到小的转变。目前,这一趋势已得到部分业界人士的认可,同时也引发了对未来AI模型发展方向的深入讨论。来源:微信公众号【量子位】

【今日案例】

GPT-4o推高级语音功能会对哪些行业带来影响?

https://yuanbao.tencent.com/bot/app/share/chat/c4f71e2decdf1eb9450cfbe1a041b7ac

© 版权声明

相关文章

暂无评论

暂无评论...