OpenSquilla : 开源的微内核 AI Agent 框架，可降低Token成本

4 0 0

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

主要介绍

2026年6月，上海基元律动科技有限公司正式开源发布了OpenSquilla——一个基于Apache-2.0许可证的微内核AI Agent Harness框架（Python 3.12+）。它的核心定位是”同样的预算，更高的智能密度”：在Agent应用与大模型之间插入一层智能运行中枢，通过本地模型路由、自适应推理深度、四层认知记忆和按需技能加载四大机制，将Token成本降低60%–89%。框架上线仅数月即完成首轮融资，估值突破1亿美元。在PinchBench 1.2.1基准测试中，OpenSquilla以0.688美元总成本拿到0.9251分，而竞品OpenClaw花了6.233美元才拿到0.9255分——成本降低约9倍，质量基本持平。 OpenSquilla : 开源的微内核 AI Agent 框架，可降低Token成本

功能特点

SquillaRouter智能路由：本地LightGBM+ONNX分类器，毫秒级（<20ms）判断任务复杂度，自动将任务分配至T0（最便宜）到T3（最强）四个层级的最优模型，分类过程完全在设备本地完成，零额外Token消耗。
自适应推理深度：仅对复杂查询启用深度推理，简单问题不消耗推理Token；System Prompt根据任务复杂度自动缩放，避免过度消耗。
四层认知记忆架构：工作记忆→情景记忆→语义记忆→原始记忆，支持向量语义检索（sqlite-vec）+ BM25关键词搜索，记忆自动衰减与”冒泡”晋升，空闲时启动”梦境模式”自动凝练新技能候选。
MetaSkill可组合工作流：v0.3.0引入的核心创新，将技能定义为可复用的DAG工作流，支持llm_classify、route条件分支、on_failure容错、并行执行等6种步骤类型，内置9个预制MetaSkill（如合同分析、短剧制作等）。
上下文裁剪引擎：按需动态加载Skill与记忆片段，无关信息过滤率达85%，人设文件可从16K Token压缩至4.8K，典型上下文从34.5K降至12.7K。
分层安全沙箱：Standard/Strict/Locked三档策略，Linux下用Bubblewrap实现系统调用级隔离（CPU/内存/时长/网络），无需Docker即可部署到Serverless环境。
统一网关多通道接入：基于Starlette ASGI的本地网关（默认127.0.0.1:18791），WebUI、CLI、Slack、Discord、Telegram、飞书、钉钉、企业微信、QQ、Matrix共享同一TurnRunner循环。
微内核插件架构：核心编排器仅约100行代码，负责状态机与管道编排；Provider、Memory、Channels、Tools、Sandbox等全部以插件形式运行在用户空间，插件崩溃不影响核心。
多LLM统一接入：支持OpenRouter、OpenAI、Anthropic、Ollama、DeepSeek、Gemini、Qwen/DashScope、Moonshot、Mistral、Groq等20+提供商，支持主模型+备用模型自动切换。
成本追踪与配额管理：每轮/每会话Token与费用汇总，内置配额钩子可自动节流防超支。

优缺点

优点：

Token成本降低60%–89%，实测总成本较竞品降低约9倍，同时保持98%以上任务准确率。
本地路由决策零额外Token消耗，与OpenRouter相比路由精度高4.4个百分点、成本低75%；与Anthropic Opus 4.7相比精度持平、成本低约9倍。
上下文裁剪带来额外20%–50%成本降低，上下文体积减少约63%。
越用越聪明：反馈学习系统分析用户修正记录，连续使用两周任务返工率下降57%。
微内核设计内存占用<500MB，启动快，对轻薄本友好。
MetaSkill支持自演化，Agent空闲时自动提炼新技能候选，使用越多能力越丰富。
数据不出域，本地部署满足高度敏感数据场景需求。

缺点：

新生项目，社区仍在快速成长中，生态丰富度不及OpenClaw（1000+预制Skill）。
学习闭环较弱，主要依赖预设规则压缩与归档，不具备Hermes那样的自主深度推理能力。
复杂音频场景（如说唱Battle）偶现歌词混乱问题（来自早期测试反馈）。
物理定律遵循不够严谨，失重场景测试中部分物体未表现出失重状态。
当前主要验证集中在文本与工具调用场景，多模态（视觉/音频）能力仍在完善中。

如何使用

环境准备：确保系统安装Python 3.12+，克隆GitHub仓库 git clone https://github.com/opensquilla/opensquilla，安装依赖 pip install -r requirements.txt。
启动本地网关：运行 opensquilla start，默认在127.0.0.1:18791启动WebUI与ASGI网关，浏览器打开即可使用。
配置模型提供商：在配置文件中填入API Key（支持OpenRouter/OpenAI/Anthropic/DeepSeek/Qwen等20+），系统自动完成多提供商接入。
选择路由策略：默认启用SquillaRouter四档智能路由，也可手动指定固定模型。
加载Skill与MetaSkill：内置10+ Skill自动检索，也可通过 meta-skill-creator 自助创建新MetaSkill，或从社区导入N+个Skill。
接入通信渠道：在网关配置中启用飞书/钉钉/企业微信/QQ/Telegram等通道，同一TurnRunner循环统一处理。
监控成本：WebUI内置成本追踪面板，可设置每会话Token配额，超支自动节流。

框架技术原理

第一层：SquillaRouter本地智能路由
不同于OpenRouter的云端API网关模式，OpenSquilla的路由是一个长在Harness内部的本地集成树模型（LightGBM + ONNX Runtime）。它综合消息长度、语言、代码块、关键词、语义嵌入等12个维度特征，在毫秒内将任务分为T0–T3四档。T0走最便宜模型（简单问候、格式整理），T2走中等模型（代码生成、数据采集），T3才启用最强模型（深度研究、复杂推理）。路由决策根据Agent长期使用反馈持续自训练，越用越准。

第二层：自适应推理深度与上下文裁剪
System Prompt根据任务复杂度自动缩放，简单任务不触发深度推理。上下文裁剪引擎先判断”当前任务到底需要什么”，再按需加载Skill与记忆片段——用不到的Skill不加载，无关的记忆不召回，网页HTML中的标签、广告、导航栏等先裁掉再送入模型。无关信息过滤率达85%。

第三层：MetaSkill DAG编排
MetaSkill是一个SKILL.md文件，包含触发条件（自然语言匹配或显式指定）、composition块（DAG步骤序列）。支持6种步骤类型：llm_classify、agent、skill_exec、route（条件分支）、on_failure（容错）、parallel（并行，默认最大并行度4）。DAG必须无环，由TopologicalSorter校验。模板使用Jinja2，但所有用户输入经过ImmutableSandboxedEnvironment严格沙箱化，防止注入攻击。

第四层：四层认知记忆 + 梦境模式
工作记忆（当前任务上下文）→ 情景记忆（会话历史，向量+BM25检索）→ 语义记忆（长期知识，自动衰减）→ 原始记忆（原始数据归档）。每24小时自动将零散记忆结构化，形成常青知识。空闲时启动”梦境模式”：回顾过去运行记录，提炼重复模式，自动起草新MetaSkill提案，经用户审查后采纳。

微内核架构
核心编排器仅约100行代码，负责状态机与管道编排。所有能力模块（Provider、Memory、Channels、Tools、Sandbox）均以插件形式运行在用户空间，通过统一接口与核心通信。插件崩溃不影响核心运行，也无需Docker即可实现系统级隔离。

创新点

本地集成树模型路由，区别于云端网关：OpenRouter是通用云端调度，不会随特定Agent的使用反馈自动变聪明；OpenSquilla的路由长在Harness里，持续吸收”哪些任务成功/失败/烧Token”的信号回流训练，把Token成本从事后结算变成调用前决策。
上下文裁剪按需加载，而非全量注入：对比OpenClaw默认全量上下文传递（典型34.5K Token），OpenSquilla按需裁剪至12.7K Token，过滤率85%，这是工程细节上的账单级优化。
MetaSkill”Makefile而非新命令”的设计哲学：不创造新执行原语，而是组织已有的Skill、工具、LLM调用、子Agent形成可复用、可审计、可改进的DAG工作流，支持条件分支、并行执行、容错替代。
梦境模式自演化：Agent空闲时自动回顾运行记录、提炼使用模式、起草新MetaSkill提案，”能力在后台悄悄生长”，使用越多能力越丰富。
四层记忆 + 记忆冒泡晋升：引入记忆自动衰减与”冒泡”机制，零散记忆定期结构化升级为常青知识，解决传统Agent记忆越滚越大的问题。

评估标准

基准/对比项	OpenSquilla成绩	对比方案	差距
PinchBench 1.2.1（综合Agent能力）	$0.688 / 0.9251分	OpenClaw $6.233 / 0.9255分	成本降低89%，质量基本持平
路由精度（vs OpenRouter）	精度高4.4个百分点	OpenRouter	成本低75%
同类任务成本（vs Anthropic Opus 4.7）	精度基本持平	Opus 4.7	成本低约9倍
上下文体积	12.7K Token（典型）	OpenClaw 34.5K Token	减少约63%
无关信息过滤率	85%	全量注入	—
任务返工率（连续使用2周后）	下降57%	—	越用越准
内存占用	<500MB	OpenClaw通常更高	轻薄本友好
模型提供商支持	20+	OpenClaw需手动配置	开箱即用