Skywork Deep Research Agent v2 : 昆仑万维推出的升级版深度研究智能体
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
主要介绍
Skywork Deep Research Agent v2 是昆仑万维于2025年8月14日正式发布的天工超级智能体(Skywork Super Agents)的核心引擎升级版。作为一款深度研究智能体,它首次整合了多模态检索、理解与生成能力,支持处理图文混排信息,生成高质量报告,并具备一键式网站部署、自动化数据分析等创新功能。该版本旨在重塑AI在办公与研究领域的应用边界,为用户提供更高效、更全面的信息处理工具。

功能特点
- 多模态深度调研:
- 整合多模态检索、理解和生成能力,支持处理文本、图片、视频等混合信息,避免因忽略非文本信息而导致的决策依据缺失。
- 自动分析图片并将其作为高质量配图插入文档,或整合图片信息生成新图表,降低读者理解成本。
- 多模态深度浏览器智能体:
- 模拟人类浏览与交互方式,支持社交媒体内容分析、社区内容洞察、并行搜索和多动作规划。
- 提供深度多模态内容理解,包括图片、视频及评论情感分析。
- 自动化数据分析与报告:
- 自动生成直观易懂的可视化报告,支持一键式网站部署,便于成果展示和团队分享。
- 无缝融入工作流:
- 与信息检索智能体或文档智能体联动,提升办公效率。
- 复杂任务执行能力:
- 在权威评测榜单BrowseComp上,常规模式正确率达27.8%,开启“并行思考”模式后跃升至38.7%,刷新行业纪录。
优缺点
- 优点:
- 多模态处理能力强:首次将多模态检索、理解和生成能力完整整合到深度研究工作中。
- 自动化程度高:支持从数据收集到报告生成的全流程自动化。
- 性能卓越:在多项任务测评集上取得SOTA(State-of-the-Art)表现,验证了其在复杂任务中的综合实力。
- 缺点:
- 部分功能处于内测阶段:如多模态深度浏览器智能体尚未全面开放。
- 依赖高质量数据:多模态信息的处理效果受数据质量影响较大。
如何使用
- 访问入口:用户可通过全球官网 https://skywork.ai 或中国官网 https://tiangong.cn 注册使用。
- 核心操作:
- 输入指令:在主界面描述研究需求,如“生成关于新能源汽车市场的行业研究报告”。
- 多模态处理:系统自动爬取文本、图片、视频等多模态信息,进行分析和理解。
- 生成报告:根据分析结果生成图文并茂的深度报告,并支持一键部署为独立网站。
- 示例场景:
- 行业研究:输入“生成包含最新数据和趋势分析的新能源汽车行业报告”,系统自动完成数据收集、分析和报告生成。
- 社交媒体分析:输入“分析小红书上关于美妆产品的用户情感倾向”,系统提供图片、视频及评论情感分析结果。
框架技术原理
- 多模态爬取技术(MM-Crawler):
- 高效爬取互联网上的多模态数据,包括文本、图片、视频等,确保信息的完整性和多样性。
- 长距离多模态信息收集:
- 跨页面、跨平台追踪关联数据,构建全面准确的信息图谱。
- 异步并行Multi-Agent多模态理解架构:
- 多个智能体协同工作,基于异步并行的方式处理多模态数据,提升理解和生成的效率。
- 多模态结果呈现能力:
- 将多模态信息用直观、易懂的方式呈现,如插入高质量图片或生成新的图表。
- 端到端强化学习:
- 基于高质量数据合成流程生成训练数据集,动态调整训练难度,提升模型学习效率和最终性能。
创新点
- 多模态深度调研:
- 首次将多模态检索、理解和生成能力完整整合到深度研究工作中,打破传统产品仅局限于文本检索分析的框架。
- 多模态深度浏览器智能体:
- 模拟人类浏览与交互方式,革新传统数据采集与分析模式,提供低延迟、高回复率、任务完成度高的体验。
- 并行思考模式:
- 在BrowseComp评测中,开启并行思考模式后正确率跃升至38.7%,刷新行业纪录,展现自研系统架构的卓越潜力与强大扩展性。
评估标准
- 基准测试:
- BrowseComp:评估搜索任务性能,常规模式正确率27.8%,并行思考模式正确率38.7%。
- GAIA Test:测试复杂任务执行能力,取得SOTA表现。
- 实际应用指标:
- 任务完成度:是否达成用户目标,如生成正确报告或网站。
- 执行效率:平均推理时间与资源消耗。
- 易用性:配置复杂度与文档完整性。
应用领域
- 行业研究与报告生成:
- 快速生成包含最新数据和趋势分析的专业行业研究报告,支持多种格式导出。
- 社交媒体内容分析:
- 深入分析社交媒体帖子中的图片、视频及评论情感,提供全面的信息洞察。
- 数据分析与可视化:
- 上传原始数据后,自动生成数据表格、图表和分析报告,帮助财务和市场部门快速洞察数据趋势。
- 多媒体内容创作:
- 输入创意主题,生成包含图文、动画和语音讲解的多媒体内容,如播客、网页或科普视频。
项目地址
- 全球官网:https://skywork.ai
- 中国官网:https://tiangong.cn
- GitHub仓库:https://github.com/SkyworkAI/Skywork-DeepResearch(提供API预览使用功能申请)
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...