11月1日·周三
复旦智算平台CFFF公布科学大模型最新进展
阿里云通义千问2.0发布!综合性能超过GPT-3.5,APP正式上线
智东西10月31日报道,在今日举行的2023云栖大会上,阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中,通义千问2.0综合性能超过GPT-3.5和Llama 2,正在加速追赶GPT-4。当天,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。阿里云CTO周靖人谈道,面向智能时代,阿里云将通过从底层算力到人工智能(AI)平台再到模型服务的全栈技术创新,升级云计算体系,打造一朵AI时代最开放的云。除了发布通义千问2.0外,周靖人还公布了云计算基础能力的最新进展,升级了AI平台,并发布一站式模型应用开发平台阿里云百炼。来源:凤凰新闻-智东西
全球最强长文本大模型,一次可读35万汉字:Baichuan2-192K上线
10 月 30 日,百川智能正式发布 Baichuan2-192K 长窗口大模型,将大语言模型(LLM)上下文窗口的长度一举提升到了 192K token。这相当于让大模型一次处理约 35 万个汉字,长度达到了 GPT-4(32K token,约 2.5 万字)的 14 倍,Claude 2.0(100K token,约 8 万字) 的 4.4 倍。换句话说,Baichuan2-192K 可以一次性读完一本《三体 2》,是全球处理上下文窗口长度最长的大模型。此外,它也在文本生成质量、上下文理解、问答能力等多个维度的评测中显著领先对手。以 API 的形式全面开放之后,Baichuan2-192K 能够与大量垂直场景深度结合,在人们的工作、生活、学习中发挥作用,助力行业用户大幅提升效率。Baichuan2-192K 能够一次性处理和分析数百页的材料,对于长篇文档关键信息提取与分析,长文档摘要、长文档审核、长篇文章或报告编写、复杂编程辅助等真实场景都有巨大的助力作用。来源:微信公众号【机器之心】