BettaFish(微舆)是一个开源的多智能体协作舆情分析系统,专为自动化信息采集、分析与决策支持设计。该项目由一名20岁大学生开发,以“小而强大,不畏挑战”为理念,采用斗鱼(BettaFish)命名,象征其轻量化与强对抗性。系统通过多智能体架构模拟专业分析团队,用户仅需输入需求,即可自动完成从30+国内外主流社交媒体(微博、小红书、抖音、快手等)的数据采集、多维度分析到报告生成的全流程,目标在于打破信息茧房、还原舆情真相并预测趋势。
功能特点
- AI驱动的全域监控:爬虫集群7×24小时运行,覆盖国内外主流社媒及百万级用户评论,支持热点捕获与评论下钻。
- 复合分析引擎:融合微调模型、统计模型等多类中间件,通过多模型协同提升分析深度与准确性。
- 多模态能力:突破纯文本限制,可解析短视频内容(如抖音、快手)及结构化信息卡片(天气、股票等)。
- 论坛协作机制:五大智能体(QueryEngine、MediaEngine、InsightEngine、ForumEngine、ReportEngine)通过“主持人+辩论”模式协同推理,避免单一模型思维局限。
- 公私域数据融合:支持内部业务数据库与舆情数据无缝集成,提供“外部趋势+内部洞察”的全面分析视角。
- 轻量化与高扩展性:基于纯Python模块化设计,支持一键部署、自定义模型集成及业务逻辑扩展。
优缺点
优点:
- 全自动化流程:从数据采集到报告生成无需人工干预,大幅提升效率。
- 多模态与跨平台:覆盖图文、视频及结构化数据,适配新媒体时代需求。
- 开源可定制:代码完全开源,用户可自由修改Agent工具集与Prompt,适配金融、教育等多场景。
- 低成本部署:纯Python实现,无需复杂分布式框架,单机即可运行。
缺点:
- 数据合规风险:爬虫功能需遵守平台规则及法律法规,使用者需自行承担责任。
- 技术门槛:虽提供详细文档,但多智能体调试与自定义扩展仍需一定技术基础。
- 资源依赖:部分功能依赖外部LLM API(如Tavily、Gemini),可能产生额外成本。
主要应用场景
- 品牌公关:实时监测社交媒体舆情,预警危机事件(如“甲醛宿舍”事件分析)。
- 市场研究:分析产品试喝挑战视频中的方言关键词,辅助区域口味优化决策。
- 金融投研:结合雪球论坛与电商平台数据,评估散户对新能源政策的反馈,辅助量化策略。
- 社会计算:融合微博留守儿童话题与实地调研数据,揭示媒体报道与实际困境的认知差异。
- 公共卫生:监测社交媒体疾病关键词地域集中度,为疫情预警提供数据支持。
使用方法
- 环境配置:安装Python依赖包(
pip install -r requirements.txt)、Playwright浏览器驱动(playwright install chromium)。 - 数据库初始化:复制配置文件(
config.py.example),填写MySQL数据库及LLM API Key,执行数据库初始化脚本(python schema/init_database.py)。 - 启动系统:运行主应用(
python app.py),访问http://localhost:5000使用完整功能;或单独启动Agent(如streamlit run SingleEngineApp/query_engine_streamlit_app.py)。 - 自定义扩展:修改Agent工具集API参数与Prompt,集成自定义业务数据库(需编写
CustomBusinessDBTool)。
收费标准
BettaFish完全开源免费,用户可自由下载、使用及修改代码。但使用外部LLM API(如Tavily、Gemini)可能产生费用,需根据具体服务计费。
网站地址
GitHub项目地址:https://github.com/666ghj/BettaFish
AI工具和资源推荐-AI全网资源导航-aiguide.cc
相关导航
暂无评论...
