11月1日

AI资讯速递11个月前发布 大Joe
177 0

11月1日·周三

复旦智算平台CFFF公布科学大模型最新进展

10月31日,2023云栖大会在杭州召开。复旦大学浩清教授、人工智能创新与产业研究院院长漆远发布演讲称,作为国内高校最大的云上智算平台,复旦大学智能计算平台CFFF(Computing for the Future at Fudan)在气象、化学分子预训练、医疗等科学大模型上都已取得重大进展。四个月前,CFFF正式上线。这台科研“超级计算机”由复旦大学与阿里云等共同打造,支持千亿参数的大模型训练,总体算力规模跻身全球前15名。这在国内高校中尚属首例,也领先斯坦福大学等国际知名高校。CFFF平台由面向多学科融合创新的智能计算集群“切问一号”和面向高精尖研究的专用高性能计算集群“近思一号”组成。基于百G高速数据传输网和阿里云全球领先的大规模异构算力,复旦校内的“近思一号”和1500公里外阿里云乌兰察布数据中心的“切问一号”连成了一台真正意义上的“超级计算机”,复旦四校区的所有实验设备都能高速接入。来源:电子工程世界

阿里云通义千问2.0发布!综合性能超过GPT-3.5,APP正式上线

智东西10月31日报道,在今日举行的2023云栖大会上,阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中,通义千问2.0综合性能超过GPT-3.5和Llama 2,正在加速追赶GPT-4。当天,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。阿里云CTO周靖人谈道,面向智能时代,阿里云将通过从底层算力到人工智能(AI)平台再到模型服务的全栈技术创新,升级云计算体系,打造一朵AI时代最开放的云。除了发布通义千问2.0外,周靖人还公布了云计算基础能力的最新进展,升级了AI平台,并发布一站式模型应用开发平台阿里云百炼。来源:凤凰新闻-智东西

全球最强长文本大模型,一次可读35万汉字:Baichuan2-192K上线

10 月 30 日,百川智能正式发布 Baichuan2-192K 长窗口大模型,将大语言模型(LLM)上下文窗口的长度一举提升到了 192K token。这相当于让大模型一次处理约 35 万个汉字,长度达到了 GPT-4(32K token,约 2.5 万字)的 14 倍,Claude 2.0(100K token,约 8 万字) 的 4.4 倍。换句话说,Baichuan2-192K 可以一次性读完一本《三体 2》,是全球处理上下文窗口长度最长的大模型此外,它也在文本生成质量、上下文理解、问答能力等多个维度的评测中显著领先对手。以 API 的形式全面开放之后,Baichuan2-192K 能够与大量垂直场景深度结合,在人们的工作、生活、学习中发挥作用,助力行业用户大幅提升效率。Baichuan2-192K 能够一次性处理和分析数百页的材料,对于长篇文档关键信息提取与分析,长文档摘要、长文档审核、长篇文章或报告编写、复杂编程辅助等真实场景都有巨大的助力作用。来源:微信公众号【机器之心】

© 版权声明

相关文章

暂无评论

暂无评论...