日日新SenseNova V6:商汤推出的多模态融合模型系列
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
主要介绍
日日新SenseNova V6是商汤科技于2025年4月10日发布的全新升级版多模态融合大模型体系,包含旗舰版基座模型SenseNova V6 PRO、性价比版SenseNova V6 Turbo及轻量级全模态交互模型SenseNova V6 Omni。该系列模型通过多模态长思维链训练、全局记忆和强化学习等技术突破,形成领先的多模态推理能力,并实现高效能与低成本的完美结合。

功能特点
-
多模态深度推理
支持最长64K思维链的深度推理,涵盖文本、图像、视频等多模态数据,可处理复杂任务如保险理赔材料审核、数学解题等。 -
全局记忆与长视频解析
突破传统模型仅支持短视频的限制,支持10分钟级视频全帧率解析,并具备全局记忆能力,可保留关键语义。 -
实时交互能力
SenseNova V6 Omni提供极致的实时交互体验,支持角色扮演、翻译点读、文旅导游、绘本讲解、数学讲解等场景。 -
高效能与低成本
多模态训练整体效率对齐语言训练,推理成本实现业界最低,支持企业低成本部署。
优缺点
优点
- 多模态能力国内第一:在多模态推理、长思维链、全局记忆等方面表现突出,对标OpenAI o1和Gemini 2.0。
- 高效能与低成本:多模态训练效率业内领先,推理成本最低,适合大规模商业化应用。
- 强大的扩展性:能够快速适配新业务场景,无需重新设计规则或调整流程。
缺点
- 技术复杂度高:多模态融合与长思维链训练需要强大的算力支持,中小企业可能面临部署门槛。
- 数据依赖性强:模型性能高度依赖于高质量的多模态训练数据,数据获取和标注成本较高。
如何使用
-
企业级部署
企业可通过商汤大装置SenseCore 2.0获取模型API接口,集成至自有系统中,实现多模态数据处理与分析。 -
开发者生态
开发者可基于商汤开放的模型能力与工具链,进行二次开发,快速构建行业应用。 -
云服务接入
用户可通过商汤云服务平台,按需调用模型能力,降低本地部署成本。
框架技术原理
-
多模态长思维链训练
基于超过200B高质量多模态长思维链数据,通过多智能体协作进行合成和验证,支持最长64K的多模态长思维链。 -
全局记忆与强化学习
构建面向多种图文任务的混合增强学习框架,基于不同难度分级和多奖励模型进行训练,实现长视频理解与深度推理。 -
多模态统一时序表征
将视觉、听觉、语言和时间轴逻辑对齐,形成多模态统一时序表征,通过细粒度级联信息压缩和内容敏感的动态过滤,实现长视频的高比例压缩。



创新点
-
原生多模态通用架构
采用6200亿参数的混合专家架构(MoE),实现文本、图像和视频的原生融合,纯文本和多模态任务性能均领先国际一流模型。 -
多模态增强学习框架
构建面向多种图文任务的混合增强学习框架,支持多难度分级和多奖励模型训练,提升模型在复杂场景中的适应能力。 -
轻量级全模态交互模型
SenseNova V6 Omni深度融合语言、语音和视频,提供极致的实时交互体验,成为国内首个商业化的全模态实时交互模型。
评估标准
-
多模态推理能力
在权威评测中,多模态推理能力国内第一,对标OpenAI o1和Gemini 2.0 Thinking。 -
长记忆与视频理解
支持10分钟级视频全帧率解析,长记忆能力突破传统模型限制。 -
成本与效率
多模态训练整体效率对齐语言训练,推理成本实现业界最低。 -
行业应用效果
在保险理赔、文档处理、游戏剪辑等场景中表现优异,显著提升业务效率。
应用领域
-
医疗健康
辅助医生进行疾病诊断、医学影像分析等。 -
金融服务
用于风险评估、反欺诈、智能投顾等场景。 -
教育领域
提供个性化学习辅导、智能答疑等服务。 -
智能制造
实现生产流程优化、质量检测等。 -
娱乐与媒体
用于视频内容生成、游戏角色互动等。
项目地址
- 官网:商汤科技官网
- 技术文档与API:商汤开发者平台(需注册登录获取)
- 模型体验:日日新SenseNova V6 Web端体验