12月30日

AI资讯速递7个月前发布 大Joe
220 0

12月30日·周六

中文大模型基准测评2023年度报告

SuperCLUE发布了《中文大模型基准测评2023年度报告》,该报告通过多维度综合性测评,对国内外大模型发展现状进行了观察与思考。报告内容包括国内大模型的关键进展、测评体系和方法说明,大模型综合测评结果,SuperCLUE2.0的升级,以及四大维度的测评分析和示例介绍,同时还包括优秀模型案例的介绍。来源:微信公众号【 CLUE中文语言理解测评基准、ITSoul】

OpenLAM | 深度势能预训练大模型DPA-2发布

经过北京科学智能研究院、深势科技、北京应用物理与计算数学研究所等 29 家单位的 42 位合作者的通力协作,深度势能团队近日面向社区发布了深度势能预训练大模型 DPA-2,将成为 OpenLAM 大原子模型计划的重要载体。基于 DPA-2 的微调/蒸馏/应用自动化流程也于同期面向社区全面开放,打通了面向各类实际应用的最后一公里。相关文章[1]以《DPA-2: Towards a universal large atomic model for molecular and material simulation》为题,在 arXiv 上预发表。DPA-2 在模型架构显著更新的同时,最大的特点在于采用了多任务训练的策略,从而可以同时学习计算设置不同、标签类型不同的各类数据集。由此产生的模型在下游任务上显示出极强的 few-shot 乃至 zero-shot 迁移的能力,显著超越过去的方案。目前用于训练 DPA-2 模型的数据集已覆盖了半导体、钙钛矿、合金、表面催化、正极材料、固态电解质、有机分子等多类体系。来源:微信公众号【深势科技 DP Technology】

© 版权声明

相关文章

暂无评论

暂无评论...