FIBO ：开源的图像生成模型，首个原生支持JSON

AI工具3个月前发布 FuturX-Editor

152 0 0

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

主要介绍

FIBO 是首个开源且原生支持 JSON 的文本生成图像模型，专为长结构化描述训练而成。它在超过 1 亿条结构化 JSON 描述（每条约 1,000 字）上训练，能够精确、可重复地控制光线、构图、色彩与相机参数。FIBO 面向非商业用途开放模型权重与代码，使用 100% 授权数据，确保训练来源合规，适合专业工作流。 FIBO ：开源的图像生成模型，首个原生支持JSON

功能特点

结构化 JSON 提示：将简短文本提示扩展为详细的结构化 JSON 描述，包含光线、构图、色彩等细节。
迭代可控生成：支持从简短提示生成图像，或基于已有 JSON 提示进行多轮细化。
特征解耦控制：可单独调整某个属性（如相机角度）而不破坏整体场景。
灵感模式：通过输入图像提取结构化提示，生成相关图像，激发创意。
企业级合规性：100% 使用授权数据，确保法律透明性和可重复性。
生产级集成：支持 API 接口、ComfyUI 节点及本地推理。

优缺点

优点：

精确控制：通过结构化 JSON 描述，实现对图像细节的精确控制。
迭代优化：支持多轮细化，逐步优化画面。
合规性：使用授权数据，确保法律透明性。
灵活性：支持多种工作模式，适应不同创作需求。

缺点：

学习成本：结构化 JSON 描述需要一定学习成本，对新手不友好。
硬件要求：模型规模较大，对硬件资源有一定要求。

如何使用

访问项目地址：前往 GitHub 仓库（https://github.com/Bria-AI/FIBO）或 HuggingFace 模型库（https://huggingface.co/briaai/FIBO），获取模型代码和预训练权重。
选择工作模式：根据需求选择生成、精修或灵感模式。
输入提示：提供简短文本提示或结构化 JSON 描述。
生成图像：运行模型，生成高质量图像。
调整与优化：基于生成的图像和 JSON 提示，进行多轮细化与调整。

框架技术原理

架构：基于 8B 参数的 DiT 架构，采用流匹配（Flow Matching）训练方式。
文本编码器：使用 SmolLM3-3B，搭配创新的 DimFusion 条件架构，实现高效的长描述训练。
VAE：采用 Wan 2.2，负责图像的编码和解码。
VLM 引导：通过视觉语言模型（VLM）将简短文本提示扩展为详细的结构化 JSON 提示。
结构化监督：使用结构化 JSON 描述进行训练，促进特征解耦，避免提示词漂移。

创新点

原生支持 JSON：首个支持原生 JSON 描述的文本生成图像模型，实现精确控制。
特征解耦：结构化描述带来天然的特征解耦能力，支持针对性调整。
VLM 引导：借助 VLM 辅助提示系统，自动扩展简短用户意图，补全缺失细节。
企业级合规性：100% 使用授权数据，确保治理、可重复性与法律透明性。

评估标准

提示词一致性：生成图像与输入提示的一致性。
图像质量：生成图像的清晰度、细节和真实感。
控制精度：对光线、构图、色彩等参数的控制精度。
迭代稳定性：多轮细化过程中的画面一致性和稳定性。
合规性：数据来源的合法性和透明性。

应用领域

专业设计与创意工作流：为广告、产品设计和平面设计生成高质量图像，支持快速迭代和精准控制。
影视与娱乐：生成电影、游戏和动画的概念艺术与场景设计，助力视觉化创作。
教育与培训：生成教学图像和虚拟实验场景，辅助教育内容制作。
科学研究：将科学数据转化为直观图像，辅助研究展示和数据可视化。
医疗与健康：生成医学示意图和虚拟手术场景，支持医学教学和手术培训。

项目地址

GitHub 仓库：https://github.com/Bria-AI/FIBO
HuggingFace 模型库：https://huggingface.co/briaai/FIBO

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Whisper-Medusa —— aiOla推出的开源AI语音识别模型

FuturX-Editor

524 0

LTX-2 : Lightricks推出的电影级AI视频生成模型

FuturX-Editor

764 0

EmoTalk3D——华为和复旦大学联合推出的3D数字人新框架

FuturX-Editor

789 0

Vision Search Assistant —— 结合视觉语言模型和网络代理搜索技术的开源框架

FuturX-Editor

633 0

OmniAudio ：阿里通义推出的空间音频生成模型

FuturX-Editor

430 0

InstanceAssemble ：小红书联合复旦推出的图像生成框架

FuturX-Editor

493 0

暂无评论

暂无评论...

AI全网资源导航每日收集国内外热点AI/人工智能/工具/模型/框架以及最新的AI学习资料/课程等，在这个全新的AI时代，助力每一个人，赋能每一个具体业务场景，与所有人一起努力向前！

友链申请免责声明广告合作关于我们

Copyright © 2026 AI智库导航-aiguide.cc 沪ICP备2022030655号