12月30日

AI资讯速递3年前 (2023)发布 FuturX-Editor

994 0 0

12月30日·周六

中文大模型基准测评2023年度报告

SuperCLUE发布了《中文大模型基准测评2023年度报告》，该报告通过多维度综合性测评，对国内外大模型发展现状进行了观察与思考。报告内容包括国内大模型的关键进展、测评体系和方法说明，大模型综合测评结果，SuperCLUE2.0的升级，以及四大维度的测评分析和示例介绍，同时还包括优秀模型案例的介绍。来源：微信公众号【 CLUE中文语言理解测评基准、ITSoul】

经过北京科学智能研究院、深势科技、北京应用物理与计算数学研究所等 29 家单位的 42 位合作者的通力协作，深度势能团队近日面向社区发布了深度势能预训练大模型 DPA-2，将成为 OpenLAM 大原子模型计划的重要载体。基于 DPA-2 的微调/蒸馏/应用自动化流程也于同期面向社区全面开放，打通了面向各类实际应用的最后一公里。相关文章[1]以《DPA-2: Towards a universal large atomic model for molecular and material simulation》为题，在 arXiv 上预发表。DPA-2 在模型架构显著更新的同时，最大的特点在于采用了多任务训练的策略，从而可以同时学习计算设置不同、标签类型不同的各类数据集。由此产生的模型在下游任务上显示出极强的 few-shot 乃至 zero-shot 迁移的能力，显著超越过去的方案。目前用于训练 DPA-2 模型的数据集已覆盖了半导体、钙钛矿、合金、表面催化、正极材料、固态电解质、有机分子等多类体系。来源：微信公众号【深势科技 DP Technology】