DianJin-R1 ：阿里云通义点金联合苏大推出的金融推理大模型

AI工具3个月前更新 FuturX-Editor

292 0 0

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

主要介绍

DianJin-R1 是阿里云通义点金团队与苏州大学联合推出的金融推理大模型，专为金融领域设计，旨在通过增强推理能力解决金融任务中的复杂问题。该模型融合了先进的技术和全面的数据支持，特别是在金融知识、数值推理和合规检查方面表现出色。DianJin-R1 的核心亮点包括其全面开源的推理数据集 DianJin-R1-Data 和两阶段优化训练策略，使其在金融推理任务中具有显著优势。

DianJin-R1 ：阿里云通义点金联合苏大推出的金融推理大模型

功能特点

金融推理增强
- 专注于金融领域的推理任务，如财务报告分析、风险评估和合规检查。
多数据集支持
- 基于 CFLUE、FinQA 和 CCC 等数据集进行训练，覆盖中英文金融问答和合规场景。
两阶段优化
- 通过监督微调（SFT）和强化学习（RL）两阶段训练，提升推理质量和准确性。
结构化输出
- 生成详细的推理路径和最终答案，支持可解释的决策过程。

优缺点

优点

金融领域专用：针对金融任务优化，推理能力显著优于通用模型。
开源生态：数据集和模型权重全面开源，支持学术研究和商业应用。
高性能：在金融基准测试中表现优异，超越了 DeepSeek-R1 等模型。

缺点

领域局限性：在非金融领域的推理任务中表现可能不如专用模型。
计算资源需求：尽管支持轻量化部署，但在高精度场景下仍需较强算力。

如何使用

安装依赖
- 使用 Hugging Face 的 Transformers 库安装模型：
  python
  from transformers import pipeline
  
  model = pipeline(“text-generation”, model=“aliyun/dianjin-r1”)

金融推理任务示例

输入金融问题，模型会生成详细的推理步骤和答案：

python

	prompt = “根据以下财务报告，计算公司的净利润率：收入=1000万，成本=600万，税费=100万”
	response = model(prompt, max_new_tokens=200)
	print(response[0][‘generated_text’])

部署选项
- 支持在本地 PC、云端或边缘设备上部署，适合金融分析和合规检查等场景。

框架技术原理

数据集构建
- CFLUE：包含 38,638 道金融资格模拟考试题，涵盖多科目和难度。
- FinQA：8,281 个金融问答对，需对财务报告进行数值推理。
- CCC：基于多智能体系统合成的合规检查数据集，聚焦复杂合规场景。
两阶段训练
- 监督微调（SFT）：基于 Qwen2.5-7B-Instruct 和 Qwen2.5-32B-Instruct 训练，生成结构化推理过程和答案。
- 强化学习（RL）：使用群体相对政策优化（GRPO）算法，引入格式奖励和准确性奖励，提升推理质量。

创新点

金融推理专用数据集
- 首次开源了高质量的金融推理数据集 DianJin-R1-Data，支持金融领域的研究和应用。
多智能体系统数据合成
- 通过通义点金平台实现基于多智能体系统的数据合成，提升推理质量。
结构化推理生成
- 模型生成详细的推理路径和最终答案，支持可解释的金融决策。

评估标准

金融基准测试
- 在 CFLUE、FinQA 和 CCC 等金融数据集上评估模型的推理能力。
通用推理基准
- 在 MATH-500 和 GPQA-Diamond 等通用推理数据集上评估模型的泛化能力。
推理质量
- 通过推理路径的连贯性和答案的正确性评估模型的性能。

应用领域

金融分析
- 财务报告分析、风险评估和投资决策支持。
合规检查
- 金融客服对话的合规性检查，防止违规行为。
金融教育
- 金融资格考试辅导和实战案例分析。

项目地址

GitHub 仓库：
https://github.com/aliyun/qwen-dianjin
Hugging Face 模型：
https://huggingface.co/DianJin
论文地址：
https://arxiv.org/abs/2504.15716

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

DAMO GRAPE:阿里达摩院联合浙江肿瘤医院推出的早期胃癌识别模型

FuturX-Editor

113 0

OmniSync – 人民大学联合快手、清华推出的通用对口型框架

FuturX-Editor

235 0

Fin-R1 —— 上海财经联合财跃星辰推出的金融推理大模型

FuturX-Editor

292 0

Sitcom-Crafter —— 北航联合港中文等高校推出的 3D 人类动作生成系统

FuturX-Editor

337 0

DeepSeek-R1-0528 ： DeepSeek 开源的最新版 R1 模型

FuturX-Editor

350 0

Augmented Physics——将教科书静态图表生成交互式物理模拟的AI技术

FuturX-Editor

816 0

暂无评论

暂无评论...

AI全网资源导航每日收集国内外热点AI/人工智能/工具/模型/框架以及最新的AI学习资料/课程等，在这个全新的AI时代，助力每一个人，赋能每一个具体业务场景，与所有人一起努力向前！

友链申请免责声明广告合作关于我们

Copyright © 2025 AI智库导航-aiguide.cc 沪ICP备2022030655号