OpenSquilla : 开源的微内核 AI Agent 框架,可降低Token成本
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
主要介绍
2026年6月,上海基元律动科技有限公司正式开源发布了OpenSquilla——一个基于Apache-2.0许可证的微内核AI Agent Harness框架(Python 3.12+)。它的核心定位是”同样的预算,更高的智能密度”:在Agent应用与大模型之间插入一层智能运行中枢,通过本地模型路由、自适应推理深度、四层认知记忆和按需技能加载四大机制,将Token成本降低60%–89%。框架上线仅数月即完成首轮融资,估值突破1亿美元。在PinchBench 1.2.1基准测试中,OpenSquilla以0.688美元总成本拿到0.9251分,而竞品OpenClaw花了6.233美元才拿到0.9255分——成本降低约9倍,质量基本持平。
功能特点
- SquillaRouter智能路由:本地LightGBM+ONNX分类器,毫秒级(<20ms)判断任务复杂度,自动将任务分配至T0(最便宜)到T3(最强)四个层级的最优模型,分类过程完全在设备本地完成,零额外Token消耗。
- 自适应推理深度:仅对复杂查询启用深度推理,简单问题不消耗推理Token;System Prompt根据任务复杂度自动缩放,避免过度消耗。
- 四层认知记忆架构:工作记忆→情景记忆→语义记忆→原始记忆,支持向量语义检索(sqlite-vec)+ BM25关键词搜索,记忆自动衰减与”冒泡”晋升,空闲时启动”梦境模式”自动凝练新技能候选。
- MetaSkill可组合工作流:v0.3.0引入的核心创新,将技能定义为可复用的DAG工作流,支持llm_classify、route条件分支、on_failure容错、并行执行等6种步骤类型,内置9个预制MetaSkill(如合同分析、短剧制作等)。
- 上下文裁剪引擎:按需动态加载Skill与记忆片段,无关信息过滤率达85%,人设文件可从16K Token压缩至4.8K,典型上下文从34.5K降至12.7K。
- 分层安全沙箱:Standard/Strict/Locked三档策略,Linux下用Bubblewrap实现系统调用级隔离(CPU/内存/时长/网络),无需Docker即可部署到Serverless环境。
- 统一网关多通道接入:基于Starlette ASGI的本地网关(默认127.0.0.1:18791),WebUI、CLI、Slack、Discord、Telegram、飞书、钉钉、企业微信、QQ、Matrix共享同一TurnRunner循环。
- 微内核插件架构:核心编排器仅约100行代码,负责状态机与管道编排;Provider、Memory、Channels、Tools、Sandbox等全部以插件形式运行在用户空间,插件崩溃不影响核心。
- 多LLM统一接入:支持OpenRouter、OpenAI、Anthropic、Ollama、DeepSeek、Gemini、Qwen/DashScope、Moonshot、Mistral、Groq等20+提供商,支持主模型+备用模型自动切换。
- 成本追踪与配额管理:每轮/每会话Token与费用汇总,内置配额钩子可自动节流防超支。
优缺点
优点:
- Token成本降低60%–89%,实测总成本较竞品降低约9倍,同时保持98%以上任务准确率。
- 本地路由决策零额外Token消耗,与OpenRouter相比路由精度高4.4个百分点、成本低75%;与Anthropic Opus 4.7相比精度持平、成本低约9倍。
- 上下文裁剪带来额外20%–50%成本降低,上下文体积减少约63%。
- 越用越聪明:反馈学习系统分析用户修正记录,连续使用两周任务返工率下降57%。
- 微内核设计内存占用<500MB,启动快,对轻薄本友好。
- MetaSkill支持自演化,Agent空闲时自动提炼新技能候选,使用越多能力越丰富。
- 数据不出域,本地部署满足高度敏感数据场景需求。
缺点:
- 新生项目,社区仍在快速成长中,生态丰富度不及OpenClaw(1000+预制Skill)。
- 学习闭环较弱,主要依赖预设规则压缩与归档,不具备Hermes那样的自主深度推理能力。
- 复杂音频场景(如说唱Battle)偶现歌词混乱问题(来自早期测试反馈)。
- 物理定律遵循不够严谨,失重场景测试中部分物体未表现出失重状态。
- 当前主要验证集中在文本与工具调用场景,多模态(视觉/音频)能力仍在完善中。
如何使用
- 环境准备:确保系统安装Python 3.12+,克隆GitHub仓库
git clone https://github.com/opensquilla/opensquilla,安装依赖pip install -r requirements.txt。 - 启动本地网关:运行
opensquilla start,默认在127.0.0.1:18791启动WebUI与ASGI网关,浏览器打开即可使用。 - 配置模型提供商:在配置文件中填入API Key(支持OpenRouter/OpenAI/Anthropic/DeepSeek/Qwen等20+),系统自动完成多提供商接入。
- 选择路由策略:默认启用SquillaRouter四档智能路由,也可手动指定固定模型。
- 加载Skill与MetaSkill:内置10+ Skill自动检索,也可通过
meta-skill-creator自助创建新MetaSkill,或从社区导入N+个Skill。 - 接入通信渠道:在网关配置中启用飞书/钉钉/企业微信/QQ/Telegram等通道,同一TurnRunner循环统一处理。
- 监控成本:WebUI内置成本追踪面板,可设置每会话Token配额,超支自动节流。
框架技术原理
第一层:SquillaRouter本地智能路由
不同于OpenRouter的云端API网关模式,OpenSquilla的路由是一个长在Harness内部的本地集成树模型(LightGBM + ONNX Runtime)。它综合消息长度、语言、代码块、关键词、语义嵌入等12个维度特征,在毫秒内将任务分为T0–T3四档。T0走最便宜模型(简单问候、格式整理),T2走中等模型(代码生成、数据采集),T3才启用最强模型(深度研究、复杂推理)。路由决策根据Agent长期使用反馈持续自训练,越用越准。
第二层:自适应推理深度与上下文裁剪
System Prompt根据任务复杂度自动缩放,简单任务不触发深度推理。上下文裁剪引擎先判断”当前任务到底需要什么”,再按需加载Skill与记忆片段——用不到的Skill不加载,无关的记忆不召回,网页HTML中的标签、广告、导航栏等先裁掉再送入模型。无关信息过滤率达85%。
第三层:MetaSkill DAG编排
MetaSkill是一个SKILL.md文件,包含触发条件(自然语言匹配或显式指定)、composition块(DAG步骤序列)。支持6种步骤类型:llm_classify、agent、skill_exec、route(条件分支)、on_failure(容错)、parallel(并行,默认最大并行度4)。DAG必须无环,由TopologicalSorter校验。模板使用Jinja2,但所有用户输入经过ImmutableSandboxedEnvironment严格沙箱化,防止注入攻击。
第四层:四层认知记忆 + 梦境模式
工作记忆(当前任务上下文)→ 情景记忆(会话历史,向量+BM25检索)→ 语义记忆(长期知识,自动衰减)→ 原始记忆(原始数据归档)。每24小时自动将零散记忆结构化,形成常青知识。空闲时启动”梦境模式”:回顾过去运行记录,提炼重复模式,自动起草新MetaSkill提案,经用户审查后采纳。
微内核架构
核心编排器仅约100行代码,负责状态机与管道编排。所有能力模块(Provider、Memory、Channels、Tools、Sandbox)均以插件形式运行在用户空间,通过统一接口与核心通信。插件崩溃不影响核心运行,也无需Docker即可实现系统级隔离。
创新点
- 本地集成树模型路由,区别于云端网关:OpenRouter是通用云端调度,不会随特定Agent的使用反馈自动变聪明;OpenSquilla的路由长在Harness里,持续吸收”哪些任务成功/失败/烧Token”的信号回流训练,把Token成本从事后结算变成调用前决策。
- 上下文裁剪按需加载,而非全量注入:对比OpenClaw默认全量上下文传递(典型34.5K Token),OpenSquilla按需裁剪至12.7K Token,过滤率85%,这是工程细节上的账单级优化。
- MetaSkill”Makefile而非新命令”的设计哲学:不创造新执行原语,而是组织已有的Skill、工具、LLM调用、子Agent形成可复用、可审计、可改进的DAG工作流,支持条件分支、并行执行、容错替代。
- 梦境模式自演化:Agent空闲时自动回顾运行记录、提炼使用模式、起草新MetaSkill提案,”能力在后台悄悄生长”,使用越多能力越丰富。
- 四层记忆 + 记忆冒泡晋升:引入记忆自动衰减与”冒泡”机制,零散记忆定期结构化升级为常青知识,解决传统Agent记忆越滚越大的问题。
评估标准
| 基准/对比项 | OpenSquilla成绩 | 对比方案 | 差距 |
|---|---|---|---|
| PinchBench 1.2.1(综合Agent能力) | $0.688 / 0.9251分 | OpenClaw $6.233 / 0.9255分 | 成本降低89%,质量基本持平 |
| 路由精度(vs OpenRouter) | 精度高4.4个百分点 | OpenRouter | 成本低75% |
| 同类任务成本(vs Anthropic Opus 4.7) | 精度基本持平 | Opus 4.7 | 成本低约9倍 |
| 上下文体积 | 12.7K Token(典型) | OpenClaw 34.5K Token | 减少约63% |
| 无关信息过滤率 | 85% | 全量注入 | — |
| 任务返工率(连续使用2周后) | 下降57% | — | 越用越准 |
| 内存占用 | <500MB | OpenClaw通常更高 | 轻薄本友好 |
| 模型提供商支持 | 20+ | OpenClaw需手动配置 | 开箱即用 |
应用领域
- 预算敏感型个人/创业团队:Token成本降低60%–89%,是AI应用公司维持30%+ token毛利率的关键基础设施。
- 跨系统编排:ERP+CRM+OA多系统联动,MetaSkill的DAG编排让跨系统调用变得简单,支持同时调用50+种外部工具。
- 长期自动化任务:7×24小时运行的Agent场景(客服、监控、数据处理),四层记忆+梦境模式让系统越用越聪明。
- 数据不出域的企业场景:本地部署+分层沙箱,满足高度敏感数据合规要求。
- 多端消息集成:飞书/钉钉/企业微信/QQ/Telegram/Slack/Discord统一接入,适合矩阵运营与企业通讯集成。
与OpenClaw(工作流自动化之王)、Hermes(深度推理专家)形成”三足鼎立”:简单重复任务选OpenClaw,深度决策选Hermes,跨多系统协作选OpenSquilla。
项目地址
- GitHub仓库:https://github.com/opensquilla/opensquilla
- 百度百科:https://baike.baidu.com/item/OpenSquilla/67979178
- 许可证:Apache-2.0
- 开发公司:上海基元律动科技有限公司