12月6日·周三
新加坡将把人工智能人才数量增加三倍,达到 15,000 名专家
新加坡副总理黄循财周一表示,作为国家人工智能战略的一部分,新加坡计划将包括机器学习科学家和工程师在内的人工智能专家人数增加两倍,达到 15,000 人。这个拥有 545 万人口的东南亚国家是谷歌母公司 Alphabet (GOOGL.O) 和微软 (MSFT.O) 等全球科技巨头的亚洲总部所在地,该国表示还将努力提高其可用的高性能 通过与芯片制造商和云服务提供商的合作来保护计算资源的访问。英伟达 (NVDA.O) 向美国证券交易委员会提交的一份文件显示,截至 10 月份的季度,该公司的收入包括来自新加坡的 27 亿美元,仅次于美国、中国和台湾。新加坡还根据其人工智能战略承诺增加政府对该行业的激励措施,包括支持人工智能初创企业的加速器计划,并鼓励企业建立人工智能“卓越中心”。来源:reuters
美图发布AI视觉大模型4.0:主打AI设计与AI视频
12月5日,美图创造力大会(12月5-6日在厦门举行。美图公司自研AI视觉大模型MiracleVision(奇想智能)4.0版本发布,主打AI设计与AI视频。MiracleVision 4.0在AI设计方面,新增了矢量图形、文字特效、智能分层、智能排版四大能力。同时上线全新视觉模型商店,支持创建个人视觉模型,助力设计师群体实现独特的艺术追求。AI视频方面,新增了文生视频、图生视频、视频运镜、视频生视频四大能力。目前,MiracleVision的AI视频能力已能融入行业工作流,尤其是电商和广告行业。为了让图像动起来,又能表现创意,美图大模型团队在强大图像生成能力的基础上,搭载了经过精密计算的运动模块,并使用高质量视频数据集进行训练,保证4.0版本能精准理解语义,生成流畅视频内容,并支持最高4K超清分辨率。MiracleVision4.0将于2024年1月陆续上线至美图旗下产品,届时用户可在美图秀秀、美颜相机、Wink、美图设计室、WHEE等产品中体验。来源:凤凰网科技
突破分辨率极限,字节联合中科大提出多模态文档大模型
由字节跳动和中国科学技术大学合作研究的DocPedia,于2023年11月24日上传至arXiv,一个统一的高分辨率多模态文档大模型DocPedia。在此研究中,作者用一种新的方式解决了现有模型不能解析高分辨文档图像的短板。DocPedia分辨率可达2560×2560,而目前业内先进多模态大模型如LLaVA、MiniGPT-4等处理图像分辨率上限为336×336,无法解析高分辨率的文档图像。在论文中,作者展示了DocPedia高分辨图文理解的示例,可以看到DocPedia能理解指令内容,准确地从高分辨率的文档图像和自然场景图像中提取相关的图文信息。结合图像中的文本信息,DocPedia还可以利用大模型推理能力,根据上下文分析问题。读取完图片信息后,DocPedia还会根据其储备的丰富的世界知识,回答图像中没有展示出来的扩展内容。分辨率的提升和有效的训练方法使DocPedia在各项测试基准上均取得了不错的提升。作者团队提出感知-理解联合训练策略:在原有低阶感知任务的基础上,增加文档理解、场景图像两种高阶的偏语义理解的任务。这样一种感知-理解联合训练策略,进一步提高了DocPedia的性能。来源:量子位