JoyAI-LLM-Flash : 京东开源的混合专家架构大模型

AI工具2个月前发布 FuturX-Editor

306 0 0

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

主要介绍

JoyAI-LLM-Flash是京东于2026年2月开源的中型指令大模型，采用混合专家（MoE）架构，总参数量48B，激活参数量仅3B，支持128K超长上下文。该模型基于20万亿Token预训练数据，在前沿知识理解、逻辑推理、代码生成及智能体交互等任务中表现卓越，兼顾高性能与低推理成本，适用于端侧部署、企业级Agent开发及长文本处理等场景。 JoyAI-LLM-Flash : 京东开源的混合专家架构大模型

功能特点

超长上下文处理：支持128K Token上下文，可处理长文档、复杂对话及多轮交互任务。
高效MoE推理：256个专家动态路由，每Token激活8个专家，兼顾性能与低推理成本。
稠密多Token预测（MTP）：吞吐量较非MTP版本提升1.3-1.7倍，生成效率显著提高。
代码生成能力：擅长逻辑推理与代码生成，支持多种编程语言辅助开发。
智能体交互优化：支持复杂任务规划、工具调用及多步骤推理。
前沿知识覆盖：具备强大的语义理解和知识问答能力，覆盖广泛领域。

优缺点

优点：

性价比高：总参数量48B但激活参数仅3B，推理成本低，适合资源受限场景。
性能卓越：在知识理解、推理、代码生成等任务中表现接近旗舰级模型。
部署灵活：支持端侧（手机、IoT设备）和企业级应用，适应多场景需求。

缺点：

模型规模限制：总参数量48B，在极端复杂任务中可能不如千亿级模型。
生态成熟度：作为新开源模型，社区工具和插件支持需进一步发展。

如何使用

访问平台：通过HuggingFace模型库（https://huggingface.co/jdopensource/JoyAI-LLM-Flash）或京东AI平台加载模型。
输入指令：用自然语言描述任务需求，例如：
- “分析这篇论文的核心结论。”
- “生成一个Python函数，实现数据排序并修复潜在Bug。”
- “规划一个多步骤的客户投诉处理流程。”
获取结果：模型输出文本、代码或任务规划方案，用户可直接使用或进一步调整。

框架技术原理

混合专家架构（MoE）：256个专家模块动态路由，每Token激活8个专家，通过稀疏激活降低计算量。
FiberPO优化框架：首次将纤维丛理论引入强化学习，结合Muon优化器进行SFT、DPO及RL训练，提升训练稳定性。
稠密MTP技术：单次前向传播并行预测多个未来Token，解决规模扩展时的不稳定问题。
MLA注意力机制：多头潜在注意力（隐藏维度2048，支持32头注意力），高效处理长序列依赖。

创新点

数学理论与AI融合：FiberPO框架将纤维丛理论应用于强化学习，优化模型训练路径。
动态路由与稀疏激活：MoE架构通过专家动态路由实现计算资源高效分配。
多Token预测机制：稠密MTP技术显著提升生成效率，降低推理延迟。

评估标准

任务准确率：在知识问答、代码生成等任务中的正确率。
上下文处理能力：128K Token窗口下的长文本推理连贯性。
推理效率：每秒处理Token数（TPS）及吞吐量提升幅度。
用户偏好度：在智能体交互、内容创作等场景中的选择比例。

应用领域

端侧AI助手：部署在手机、IoT设备上，实现本地化语音交互、文档处理。
智能客服系统：处理复杂多轮对话，支持电商、金融等领域自动化服务。
代码辅助开发：提供实时代码补全、Bug修复及技术文档解读。
企业级Agent平台：支持任务规划、工具调用及多步骤推理，适用于RPA、自动化办公。
长文档处理：论文分析、合同审查、研报总结等专业场景。

项目地址

HuggingFace模型库：https://huggingface.co/jdopensource/JoyAI-LLM-Flash
京东AI平台：可通过京东生态接入模型服务（需注册账号）。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

GLM-4-Air-0414 —— 智谱推出的基座模型

FuturX-Editor

860 0

MultiTalk : 音频驱动的多人对话视频生成框架

FuturX-Editor

853 0

EX-4D ：字节跳动Pico团队推出的4D视频生成框架

FuturX-Editor

516 0

司农：南京农业大学开源的农业领域大模型

FuturX-Editor

960 0

QVQ-Max —— 阿里通义推出的视觉推理模型

FuturX-Editor

717 0

Kotaemon—— 基于 RAG 技术的开源工具，聊天的方式快速检索文档信息

FuturX-Editor

827 0

暂无评论

暂无评论...

AI全网资源导航每日收集国内外热点AI/人工智能/工具/模型/框架以及最新的AI学习资料/课程等，在这个全新的AI时代，助力每一个人，赋能每一个具体业务场景，与所有人一起努力向前！

友链申请免责声明广告合作关于我们

Copyright © 2026 AI智库导航-aiguide.cc 沪ICP备2022030655号