11月1日

AI资讯速递3年前 (2023)发布 FuturX-Editor

609 0 0

11月1日·周三

复旦智算平台CFFF公布科学大模型最新进展

10月31日，2023云栖大会在杭州召开。复旦大学浩清教授、人工智能创新与产业研究院院长漆远发布演讲称，作为国内高校最大的云上智算平台，复旦大学智能计算平台CFFF（Computing for the Future at Fudan）在气象、化学分子预训练、医疗等科学大模型上都已取得重大进展。四个月前，CFFF正式上线。这台科研“超级计算机”由复旦大学与阿里云等共同打造，支持千亿参数的大模型训练，总体算力规模跻身全球前15名。这在国内高校中尚属首例，也领先斯坦福大学等国际知名高校。CFFF平台由面向多学科融合创新的智能计算集群“切问一号”和面向高精尖研究的专用高性能计算集群“近思一号”组成。基于百G高速数据传输网和阿里云全球领先的大规模异构算力，复旦校内的“近思一号”和1500公里外阿里云乌兰察布数据中心的“切问一号”连成了一台真正意义上的“超级计算机”，复旦四校区的所有实验设备都能高速接入。来源：电子工程世界

阿里云通义千问2.0发布！综合性能超过GPT-3.5，APP正式上线

智东西10月31日报道，在今日举行的2023云栖大会上，阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中，通义千问2.0综合性能超过GPT-3.5和Llama 2，正在加速追赶GPT-4。当天，通义千问APP在各大手机应用市场正式上线，所有人都可通过APP直接体验最新模型能力。阿里云CTO周靖人谈道，面向智能时代，阿里云将通过从底层算力到人工智能（AI）平台再到模型服务的全栈技术创新，升级云计算体系，打造一朵AI时代最开放的云。除了发布通义千问2.0外，周靖人还公布了云计算基础能力的最新进展，升级了AI平台，并发布一站式模型应用开发平台阿里云百炼。来源：凤凰新闻-智东西

全球最强长文本大模型，一次可读35万汉字：Baichuan2-192K上线

10 月 30 日，百川智能正式发布 Baichuan2-192K 长窗口大模型，将大语言模型（LLM）上下文窗口的长度一举提升到了 192K token。这相当于让大模型一次处理约 35 万个汉字，长度达到了 GPT-4（32K token，约 2.5 万字）的 14 倍，Claude 2.0（100K token，约 8 万字）的 4.4 倍。换句话说，Baichuan2-192K 可以一次性读完一本《三体 2》，是全球处理上下文窗口长度最长的大模型。此外，它也在文本生成质量、上下文理解、问答能力等多个维度的评测中显著领先对手。以 API 的形式全面开放之后，Baichuan2-192K 能够与大量垂直场景深度结合，在人们的工作、生活、学习中发挥作用，助力行业用户大幅提升效率。Baichuan2-192K 能够一次性处理和分析数百页的材料，对于长篇文档关键信息提取与分析，长文档摘要、长文档审核、长篇文章或报告编写、复杂编程辅助等真实场景都有巨大的助力作用。来源：微信公众号【机器之心】