3月28日·GPT-4o“吉卜力风”爆火,引发创作与伦理争议
3月28日·周五 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
GPT-4o“吉卜力风”爆火,引发创作与伦理争议
近日,OpenAI推出的GPT-4o模型凭借其强大的原生图像生成功能,尤其是“吉卜力风格”的图像创作能力,迅速在网络走红。用户只需上传图片并输入指令,即可将任何图像转换为吉卜力风格的动画效果,引发了社交媒体的狂欢,甚至奥特曼也更换了“吉卜力风格”的头像。然而,这一现象也引发了争议。宫崎骏曾痛批AI作画是对生命的侮辱,而如今GPT-4o的火热,让传统创意工作者面临巨大冲击。尽管如此,AI赋能的“视觉表达权”也让更多普通人能够轻松参与创作,展现了技术发展的双刃剑效应。来源:微信公众号【新智元】

Anthropic破解Claude“大脑”,AI“黑箱”之谜初现端倪
长久以来,AI的运作机制宛如一个神秘的“黑箱”,其内部的思考过程难以捉摸。然而,Anthropic近期的一项突破性研究为揭开这一谜团带来了曙光。研究人员通过类似大脑扫描的技术,深入探究了Claude 3.5 Haiku模型的内部工作机制,发现了其独特的“心算”策略。例如,Claude在计算36+59时,会通过多条并行计算路径,先粗略估算范围,再精确计算末位数,最终得出答案。此外,Claude在创作诗歌时还会提前规划,挑选与主题相关且押韵的词汇,再倒推构造句子。研究人员还发现,Claude的多语言能力并非依赖独立的语言模块,而是基于共享的抽象概念空间进行推理,再将结果翻译成不同语言。这些发现不仅为理解AI的复杂思维提供了新视角,也为确保AI系统的可靠性和透明性奠定了基础。来源:微信公众号【新智元】

出门问问AIGC业务狂飙,纯软件营收破2.2亿,跑通全球市场
出门问问在2024年交出了一份亮眼的业绩答卷。其AIGC纯软件产品收入突破2.2亿元,同比增长88.5%,总收入达3.9亿元,同比增长6%。作为“AIGC第一股”,出门问问凭借“产模结合”战略,将自研大模型“序列猴子”与一站式AIGC产品矩阵深度融合,构建起数据与产品壁垒。其AIGC产品矩阵涵盖魔音工坊、奇妙元、奇妙问、元创岛等多个场景,满足不同用户需求。公司注册用户超1000万人,付费用户超100万人,用户遍布全球。出门问问还加速全球化布局,与英伟达、谷歌等巨头合作,推动技术与场景深度融合。从语音交互到AIGC转型,出门问问用13年穿越AI周期,成为全球AIGC领域的标杆企业。来源:微信公众号【新智元】


OpenAI安全防线被突破,思维链劫持攻击致拒绝率骤降
杜克大学陈怡然团队提出了一种名为“思维链劫持”(H-CoT)的攻击方法,成功攻破了包括OpenAI o1/o3、DeepSeek-R1等在内的多款大型推理模型的安全防线。研究表明,这些模型的安全审查过程透明化反而暴露了弱点。攻击者通过提取模型的安全逻辑并伪造思维链,诱导模型放松防御,使其拒绝率从98%骤降至2%。实验表明,H-CoT攻击对OpenAI o系列、DeepSeek-R1、Gemini 2.0 Flash Thinking等模型均有效,凸显了大型推理模型在安全机制上的脆弱性。这一发现提醒业界和学界需重新审视模型的安全设计,寻找透明性与安全性的平衡。来源:微信公众号【新智元】

Meta与牛津大学推出VGGT,开启3D视觉新范式
Meta与牛津大学联合发布了VGGT(Visual Geometry Grounded Transformer),一种基于纯前馈Transformer架构的通用3D视觉模型。VGGT能够从单张或多张图像中直接推理出相机参数、深度图、点云及3D轨迹等核心几何信息,仅需一次前向推理,无需复杂的后处理优化。该模型在多个3D任务中显著超越传统优化方法与现有SOTA模型,推理速度可达秒级。VGGT的成功展示了“简单架构+数据驱动”的强大潜力,标志着3D视觉领域可能迎来基础模型时代。来源:微信公众号【机器之心】

阿里QVQ-Max大模型上线,看手相、解数学题、视频推理样样行
阿里巴巴推出了一款名为QVQ-Max的多模态大模型,能够对图像和视频进行深度思考并生成分析结果。QVQ-Max可以处理多种任务,例如看手相、分析风景照片、解答数学题以及为视频生成字幕等。它通过深度思考功能,能够识别图像中的关键元素并结合背景知识进行推理。例如,它可以分析手掌上的生命线、头线和心线,还能识别出两张西湖风景照片分别属于不同季节。在数学推理方面,QVQ-Max能够通过图像识别数字规律并给出正确答案。此外,它还能处理视频内容,为视频中的镜头创建生动有趣的字幕。QVQ-Max目前免费开放体验,用户可以通过上传图片或视频来测试其功能。来源:微信公众号【量子位】
