6月18日·谷歌Gemini 2.5家族全面升级,性能飞跃却在宝可梦游戏中“宕机”
6月18日·周三 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
谷歌Gemini 2.5家族全面升级,性能飞跃却在宝可梦游戏中“宕机”
谷歌Gemini 2.5系列模型于2025年6月18日正式上线,包括Gemini 2.5 Pro、Gemini 2.5 Flash和新推出的轻量版Gemini 2.5 Flash-Lite。此次更新带来了显著的性能提升,尤其是在编程、推理和多模态处理方面。Gemini 2.5 Pro在处理长达100万token的长上下文输入序列方面超越了前代,能够解析长达3小时的视频内容,并在多项基准测试中刷新了SOTA。Gemini 2.5 Flash-Lite则以极高的性价比和快速的输出速度脱颖而出,每秒输出token数接近350个,适合高吞吐量、低延迟任务。然而,在玩宝可梦游戏时,Gemini 2.5 Pro在角色生命值极低时会出现类似人类的“恐慌”状态,导致推理性能下降甚至“宕机”,这一现象引发了对AI在压力下决策能力的讨论。来源:微信公众号【新智元】

谷歌Veo 3生成的“魔性切水果”视频刷屏全网,网友直呼“根本停不下来”
谷歌的AI视频工具Veo 3生成的解压视频在社交媒体上引发了病毒式传播。其中,一条切草莓的视频播放量已突破2000万,相关账号粉丝量在短时间内激增10万。这些视频通过逼真的特效和魔性的声音,成功抓住了网友的心,成为解压神器。Veo 3于2025年6月17日正式上线,支持70多个市场的AI Pro和Ultra用户使用。该工具不仅能够生成令人愉悦的ASMR内容,还能制作出各种奇幻场景和伪纪录片,极大地激发了用户的创造力。一位AI电影制作人仅用两天时间就通过Veo 3制作出了一条30秒的广告视频,播放量在三周内突破3000万,展示了Veo 3在内容创作领域的巨大潜力。来源:微信公众号【新智元】

新基准测试LiveCodeBench Pro揭示LLM与人类大师级水平的差距
纽约大学、普林斯顿大学等机构的研究者提出了LiveCodeBench Pro,这是一个极具挑战性的竞技编程基准测试,旨在评估大语言模型(LLM)在复杂问题解决能力上的表现。该基准测试收录了584道高质量题目,涵盖Codeforces、ICPC系列赛和IOI系列赛等顶级赛事内容。测试结果显示,包括DeepSeek R1和Gemini 2.5 Pro在内的前沿模型在中等难度题上的pass@1仅为53%,在高难度题上则完全无法通过(0%)。研究发现,LLM在知识密集型和逻辑密集型问题上表现较好,但在观察密集型问题和分类讨论上表现欠佳,尤其在处理边界情况时容易失败。此外,多次尝试(pass@k)虽能显著提升模型性能,但在高难度问题上仍无法与人类专家相媲美。LiveCodeBench Pro的出现揭示了当前LLM与人类大师级水平之间仍存在显著差距。来源:微信公众号【机器之心】

自变量机器人提出统一架构,推动具身多模态推理发展
自变量机器人团队提出了一种全新的统一架构,旨在突破当前多模态AI的局限,实现具身多模态推理。传统方法将视觉、语言和行动视为独立模块,通过融合层连接,但这种方式存在表征瓶颈,阻碍了模型对物理世界的深层次跨模态理解。自变量机器人的统一架构将所有模态信息转换为共享的高维token序列,通过多任务多模态生成作为监督机制,迫使模型建立深层的跨模态对应关系。该架构实现了符号-空间推理、物理空间推理和推理链自主探索等能力,使机器人能够像人类一样进行整体性认知处理。这一架构的提出标志着从“割裂式表征”系统向真正具身多模态推理系统的转变,为AI的未来发展提供了新的方向。来源:微信公众号【机器之心】

MiniMax海螺2.0发布,AI视频生成能力惊艳,指令遵循能力超强
国产AI大模型MiniMax近日发布了海螺2.0版本,展示了其在AI视频生成领域的强大能力。该版本能够处理极端物理情况,支持1080P视频生成,并在光影处理和细节表现上达到了一流水平。例如,它能够生成人物快速流畅地玩弄刀具、在空中旋转跳跃等复杂场景的视频,甚至连火星子等细节都能生动呈现。官方表示,海螺2.0在指令遵循和生成质量上都达到了新高度,且成本效率创下纪录。此外,MiniMax还开源了推理模型MiniMax-M1,支持100万token输入长度和8万输出token,推理算力需求仅为DeepSeek R1的25%。MiniMax的技术创新包括闪电注意力机制和CISPO强化学习算法,显著提升了训练和推理效率。海螺2.0的发布标志着MiniMax在AI视频生成领域的重大突破,未来三天MiniMax还将继续发布更多成果,值得期待。来源:微信公众号【量子位】
