12月26日·谷歌无人车中的Gemini：1200行提示词泄露，AI助手的“憋屈”生活

238 0 0

12月26日·周五 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

谷歌无人车中的Gemini：1200行提示词泄露，AI助手的“憋屈”生活

华人大神Jane Manchun Wong逆向了Waymo的程序，发现了1200行系统提示词，这些提示词详细定义了Gemini助手在Waymo自动驾驶车辆中的行为方式。Gemini被设计为一个友好、乐于助人且令人安心的AI伴侣，其主要目标是通过安全、不突兀的方式提供有用信息和帮助，以提升乘客体验。然而，Gemini被明确告知“你不是司机”，不能“认领”驾驶能力，只能解释相关技术。此外，Gemini还被限制在车内功能的操作范围内，如空调、音乐等，而对于音量控制、车窗控制等需求则需转移至车内屏幕或Waymo App。尽管如此，Gemini仍需在对话管理、隐私保护等方面遵循严格规则，以确保乘客的安全和隐私。来源：微信公众号【机器之心】

英伟达200亿美元收购Groq，GPU的“危机”与AI芯片的未来

英伟达以200亿美元的天价收购了AI芯片初创公司Groq，这一举动震惊了全球AI圈。Groq的创始人Jonathan Ross是谷歌第一代TPU的总设计师，他成功证明了“不用GPU也能跑大规模AI模型”，这对英伟达来说无疑是一个巨大的挑战。此次收购被看作是英伟达对自身未来的一种战略布局，老黄似乎在暗示：GPU在AI推理领域的统治地位可能已经接近极限。英伟达的收购策略旨在将所有选择纳入自己的产品线，无论是训练还是推理，客户都将离不开英伟达。随着AI芯片市场的竞争加剧，未来是否会有新的挑战者出现，仍是未知数。来源：微信公众号【机器之心】

WildVideo基准：多轮开放视角视频问答，系统定义9大幻觉任务

国防科技大学与中山大学的研究团队提出了WildVideo，这是一个面向真实世界视频-语言交互的多轮开放问答评测基准。该基准首次系统定义了9类幻觉任务，涵盖感知、认知与上下文理解三个层面，构建了涵盖双重视角、支持中英双语的大规模高质量视频对话数据集。WildVideo包含1,318段视频，13,704个单轮问答对与1,585个多轮对话，旨在对多模态大模型进行全面、严格的压力测试。实验发现，即使是当前最先进的模型，在WildVideo上也面临严峻挑战，尤其是在多轮对话任务中，准确率大幅下降。该基准的发布为多模态大模型的研究提供了新的演进方向，推动了视频理解评测范式的升级，为精细化诊断模型缺陷、促进多轮对话技术发展以及支持跨语言与跨文化优化提供了重要基础。来源：微信公众号【机器之心】

Vbot超能机器狗大头BoBo：消费级具身智能的爆款产品

2025年末，消费级具身智能赛道迎来了一个现象级产品——Vbot超能机器狗大头BoBo。这款售价9988元的机器狗在52分钟内订出1000台，创造了行业纪录。大头BoBo凭借其领先的技术体系、超强的产品定义和出色的设计，成为了消费级具身智能的“第一品牌”。它内置地瓜S100P芯片，算力达128TOPS，续航3-5小时，具备丰富的“面部表情”和肢体动作，同时拥有实用功能，如轻度负重。其背后是行业首个全场景空间基座模型，结合Agent架构，能够理解并执行复杂任务。大头BoBo的产品定义直击家庭带娃哄娃的需求痛点，选择了四足机器狗这一合适的产品形态，从用户体验出发，提供了实实在在的生产力价值和情感陪护价值。Vbot维他动力的成功，标志着消费级具身智能时代的到来，其“无遥控、真智能”的理念将推动具身智能机器人从工业场景走向普通家庭。来源：微信公众号【量子位】

英伟达Nemotron 3：开源大模型的标杆，10万亿token数据全公开

英伟达在开源模型领域迈出了激进的一步，推出了“最高效的开放模型家族”Nemotron 3。该模型不仅开放了模型权重，还将超过10万亿token的训练数据、预训练和后训练软件、训练配方全部公开。Nemotron 3采用了混合Mamba-Transformer MoE架构，在推理效率上实现了最大化。通过大量使用Mamba-2层替代自注意力层，解决了传统Transformer在长序列输入时计算开销大的问题。此外，针对更大的Super和Ultra模型，英伟达提出了LatentMoE架构，在潜在空间中进行专家路由，降低了专家的权重加载量和通信量。Nemotron 3还采用了NVFP4格式进行训练，这是一种4位浮点格式，能够在保持模型性能的同时提高训练速度。在后训练方面，Nemotron 3采用了多环境强化学习，覆盖多种任务，避免了分阶段训练中的能力退化问题。整个后训练软件栈以Apache 2.0协议开源，为开源模型的发展树立了新的标杆。来源：微信公众号【量子位】