npm - @archsight/aios - Versions diffs - 1.0.1 → 1.1.0 - Mend

@archsight/aios 1.0.1 → 1.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (39) hide show

package/CHANGELOG.md +49 -5
package/LICENSE +184 -21
package/README.md +43 -17
package/agents/README.md +2 -1
package/agents/euclid/constraints.md +2 -1
package/agents/euclid/responsibilities.md +1 -1
package/agents/euclid/role.md +1 -1
package/agents/euclid/system-prompt.md +5 -2
package/agents/euclid/workflow.md +3 -3
package/bin/archsight-aios.mjs +436 -1
package/docs/quickstart.md +2 -1
package/governance/README.md +3 -0
package/governance/arbitration-protocol.md +153 -0
package/package.json +3 -3
package/runtime/README.md +7 -0
package/runtime/agent-routing.md +41 -17
package/runtime/archsight-aios.manifest.json +58 -36
package/runtime/capability-adapters.json +27 -0
package/runtime/capability-registry.json +458 -0
package/runtime/capability-registry.schema.json +135 -0
package/runtime/skill-routing.md +17 -13
package/skills/README.md +12 -9
package/skills/aios-arch/SKILL.md +62 -24
package/skills/aios-ceo/SKILL.md +11 -8
package/skills/aios-exec/SKILL.md +11 -8
package/skills/aios-knowledge/SKILL.md +12 -9
package/skills/aios-plan/SKILL.md +38 -28
package/skills/aios-review/SKILL.md +12 -9
package/skills/aios-runtime/SKILL.md +14 -11
package/skills/aios-structural/SKILL.md +67 -0
package/skills/aios-structural/agents/openai.yaml +4 -0
package/templates/project-ai/.ai/ARCHSIGHT_AIOS_RULES.md +13 -10
package/templates/project-ai/.ai/agent-routing.md +17 -12
package/templates/project-ai/.ai/skills.md +14 -11
package/templates/project-ai/.ai/workflows.md +6 -5
package/workflows/README.md +2 -0
package/workflows/architecture-review.md +44 -22
package/workflows/feature-development.md +25 -19
package/workflows/rag-pipeline.md +9 -5

package/templates/project-ai/.ai/skills.md CHANGED Viewed

@@ -16,10 +16,11 @@ AIOS 是建筑行业增强层，不是通用任务替代器。只有当前项目
 | 建筑行业平台 UI / UX 设计方案 / 工作台体验 | `aios-design` | Janus |
 | 建筑行业项目架构评审 | `aios-arch` | Atlas |
 | 建筑行业项目交付计划 | `aios-plan` | Mason |
-| 建筑行业项目代码审查 | `aios-review` | Argus |
-| BIM / IFC / 建筑知识建模 | `aios-knowledge` | Vitruvius |
-| 建筑行业 AI Runtime / RAG / MCP / Memory | `aios-runtime` | Daedalus |
-| 建筑行业项目受控实现 / 测试 / 文档 / 脚本 | `aios-exec` | Hephaestus |
+| 建筑行业项目代码审查 | `aios-review` | Argus |
+| BIM / IFC / 建筑知识建模 | `aios-knowledge` | Vitruvius |
+| 结构力学 / 荷载 / FEM / 确定性求解链路 | `aios-structural` | Euclid |
+| 建筑行业 AI Runtime / RAG / MCP / Memory | `aios-runtime` | Daedalus |
+| 建筑行业项目受控实现 / 测试 / 文档 / 脚本 | `aios-exec` | Hephaestus |
 ## 本项目启用的 Skills
@@ -27,16 +28,18 @@ AIOS 是建筑行业增强层，不是通用任务替代器。只有当前项目
 - [ ] `aios-ceo`
 - [ ] `aios-design`
 - [ ] `aios-plan`
-- [ ] `aios-review`
-- [ ] `aios-knowledge`
-- [ ] `aios-runtime`
-- [ ] `aios-exec`
+- [ ] `aios-review`
+- [ ] `aios-knowledge`
+- [ ] `aios-structural`
+- [ ] `aios-runtime`
+- [ ] `aios-exec`
 ## 启用规则
 - 只勾选当前项目真实安装或可访问的 Skill。
 - 涉及建筑行业软件 / 系统评价、项目立项、产品定位、商业目标、范围取舍或阶段路线时，优先启用 `aios-ceo`。
 - 涉及建筑行业平台 UI / UX 方案、工作台体验、交互状态、响应式或前端实现交接时，优先启用 `aios-design`。
-- 只有启用建筑、BIM、IFC、规范知识库、GraphRAG 或智能审图 profile 时，才默认启用 `aios-knowledge`。
-- 当前任务不涉及建筑行业语义时，不要为了“已安装 AIOS”而强制使用 `aios-*` Skill。
-- 如 Skill 来源、安装位置或同步方式无法确认，应标注待核验，不要假设已经启用。
+- 只有启用建筑、BIM、IFC、规范知识库、GraphRAG 或智能审图 profile 时，才默认启用 `aios-knowledge`。
+- 涉及结构力学、荷载、FEM、结构计算工具链或工程安全风险时，启用 `aios-structural`；关键数值必须来自确定性求解器或项目已有计算书。
+- 当前任务不涉及建筑行业语义时，不要为了“已安装 AIOS”而强制使用 `aios-*` Skill。
+- 如 Skill 来源、安装位置或同步方式无法确认，应标注待核验，不要假设已经启用。

package/templates/project-ai/.ai/workflows.md CHANGED Viewed

@@ -26,11 +26,12 @@ AIOS Workflow 是建筑行业项目的增强路径，不是普通工程任务的
 - 先明确输入和验收标准。
 - 再选择 Workflow。
-- 再调用对应 Skill。
-- 最后用测试、构建、lint、typecheck 或人工检查验证。
-- 涉及建筑行业、BIM、IFC、规范、审图或 RAG / GraphRAG 时，先确认项目是否启用对应 profile。
-## 本项目默认流程
+- 再调用对应 Skill。
+- 最后用测试、构建、lint、typecheck 或人工检查验证。
+- 涉及建筑行业、BIM、IFC、规范、审图或 RAG / GraphRAG 时，先确认项目是否启用对应 profile。
+- 涉及规范检查、结构计算、安全扫描、测试门禁或 Agent 冲突时，输出 `Claim / Evidence / Tool Result / Decision`；工具证据缺失时不得标记为已验证。
+## 本项目默认流程
 待填写：

package/workflows/README.md CHANGED Viewed

@@ -17,3 +17,5 @@
 - spec driven development
 每个 workflow 应明确参与角色、输入、输出、执行顺序、验收标准和回滚策略。
+涉及多 Agent 冲突、规范证据、结构计算、安全扫描、测试门禁或 Runtime 权限时，Workflow 还应输出 `Claim / Evidence / Tool Result / Decision`，并按 [Capability-Backed Arbitration Protocol](../governance/arbitration-protocol.md) 仲裁。

package/workflows/architecture-review.md CHANGED Viewed

@@ -18,19 +18,21 @@
 | 阶段 | 主 Agent | Skill |
 | --- | --- | --- |
 | 架构判断 | Atlas | `aios-arch` |
-| 工程拆解 | Mason | `aios-plan` |
-| Runtime 设计 | Daedalus | `aios-runtime` |
-| 行业语义 | Vitruvius | `aios-knowledge` |
-| 风险审查 | Argus | `aios-review` |
+| 工程拆解 | Mason | `aios-plan` |
+| Runtime 设计 | Daedalus | `aios-runtime` |
+| 行业语义 | Vitruvius | `aios-knowledge` |
+| 结构力学 / 求解链路 | Euclid | `aios-structural` |
+| 风险审查 | Argus | `aios-review` |
 ## 输入
 - 背景和目标。
 - 当前架构、目录、模块和数据结构。
 - 现有代码、配置、接口契约、测试、脚本、部署入口和运行方式。
-- 候选方案。
-- 约束：成本、时间、团队、运行环境、权限、数据规模。
-- 已知风险和历史决策。
+- 候选方案。
+- 约束：成本、时间、团队、运行环境、权限、数据规模。
+- 已知风险和历史决策。
+- 可用 Capability、工具返回值、测试 / 构建 / 规范查询 / 求解器证据。
 ## 执行顺序
@@ -40,11 +42,14 @@
 4. Atlas 盘点已有能力，确认应复用的模块、契约、测试和脚本。
 5. Atlas 做端到端链路抽样：对关键用户输入、配置字段、领域元数据、版本关系、审计关系或跨存储关系，至少追踪一条从 UI / API / CLI 入口到领域模型、后台任务、存储、检索/消费端和测试的完整路径。
 6. Atlas 对候选方案做 tradeoff，识别复杂度、技术债、生产失效方式和长期迁移成本。
-7. Atlas 用 P0/P1/P2 或等效等级标注风险优先级，形成架构依据。
-8. Daedalus 评审 AI Runtime / RAG / Tool / Memory 相关设计。
-9. Vitruvius 评审 BIM / IFC / 建筑规范相关语义。
-10. Argus 评审安全、权限、Prompt 注入、依赖和发布风险。
-11. Mason 将通过评审的方案拆成可执行任务，并纳入 Failure Modes、测试缺口、并行 workstream 和冲突点。
+7. Atlas 用 P0/P1/P2 或等效等级标注风险优先级，形成架构依据。
+8. Daedalus 评审 AI Runtime / RAG / Tool / Memory 相关设计。
+9. Vitruvius 评审 BIM / IFC / 建筑规范相关语义。
+10. Euclid 评审结构力学、荷载、边界条件、FEM 或求解器接口相关问题；关键数值必须来自确定性求解器或标记 `Need verify`。
+11. Argus 评审安全、权限、Prompt 注入、依赖和发布风险。
+12. 对 Agent 冲突输出 `Claim / Evidence / Tool Result / Decision`，按 `governance/arbitration-protocol.md` 仲裁。
+13. Atlas 做交付审查增强：列出本次事实刷新、历史报告过期判断、与既有报告 diff、领域风险 / 工程风险分类，以及每个高优先级发现的文件落点和验证方式。
+14. Mason 将通过评审的方案拆成可执行任务，并纳入 Failure Modes、测试缺口、并行 workstream 和冲突点。
 ## 输出
@@ -52,10 +57,14 @@
 2. 架构判断
 3. 风险与边界
 4. 推荐方案
-5. Rejected 方案
-6. Assumption / Need verify
-7. Failure Modes
-8. 后续执行任务
+5. Rejected 方案
+6. Assumption / Need verify
+7. Failure Modes
+8. Claim / Evidence / Tool Result / Decision
+9. 后续执行任务
+10. 本次事实刷新
+11. 已过期判断 / 与既有报告 diff
+12. 第一小步建议
 ## 文档与补充检查
@@ -67,9 +76,21 @@
 - 工程计划优先采纳 Failure Modes、测试缺口、并行 workstream、冲突标记和回归命令。
 - 纠正文档中的细节错误，例如 Assumption 与 Need verify 数量混淆。
 - 对“未覆盖”的判断要谨慎：如果已有评审已触及某风险但未形成完整策略，应写成“已触及但未系统展开”。
-- 如果本次是“全新独立评审”，仍应建立历史高优先级发现的回归清单；清单只用于防止漏检，不要求继承旧报告结论。
-- 抽象发现不能吞掉具体断链。若某字段、关系或元数据已经被纳入更大的 P1/P2 主题，还必须说明是否完成端到端贯通；未贯通时应保留独立风险或验收项。
-- 对 RAG / GraphRAG、规范知识库和审计系统，重点抽查 `source_version`、适用地区、专业、生效状态、复核状态、版本替代关系、证据引用和缓存/索引版本是否从摄取入口贯通到消费端。
+- 如果本次是“全新独立评审”，仍应建立历史高优先级发现的回归清单；清单只用于防止漏检，不要求继承旧报告结论。
+- 抽象发现不能吞掉具体断链。若某字段、关系或元数据已经被纳入更大的 P1/P2 主题，还必须说明是否完成端到端贯通；未贯通时应保留独立风险或验收项。
+- 对 RAG / GraphRAG、规范知识库和审计系统，重点抽查 `source_version`、适用地区、专业、生效状态、复核状态、版本替代关系、证据引用和缓存/索引版本是否从摄取入口贯通到消费端。
+- 每个 P0/P1/P2 发现必须标注为 `领域风险`、`工程风险` 或 `混合风险`，并说明文件 / 模块、最小改动范围和验证命令；无法定位时标为 `Need verify`。
+- 最终必须给出“现在最该做的一件小事”，优先选择低风险、可验证、能消除静默错误或关键漂移的动作。
+## 仲裁门禁
+当 Atlas、Mason、Vitruvius、Euclid、Daedalus 或 Argus 的判断冲突时：
+- 先把意见转成 Claim，不直接用自然语言争论结论。
+- 优先采纳确定性工具、项目事实和结构化知识证据。
+- 工具结果缺少输入、版本、适用条件或执行状态时，标为 `Need verify`。
+- L1 工具失败、规范适用性冲突、安全权限失败或结构输入无效时，阻断进入 Mason 拆解或 Hephaestus 执行。
+- 涉及生产授权、法规合规最终判断、结构安全结论或商业范围取舍时，升级给人类负责人。
 ## 端到端链路抽样清单
@@ -88,9 +109,10 @@
 - 核心技术栈替换。
 - 生产数据模型迁移。
-- Runtime 权限扩大。
-- 自动执行权限放开。
-- 影响长期平台路线的服务边界调整。
+- Runtime 权限扩大。
+- 自动执行权限放开。
+- 影响长期平台路线的服务边界调整。
+- 法规合规最终判定和结构安全结论。
 ## 验收标准

package/workflows/feature-development.md CHANGED Viewed

@@ -20,9 +20,10 @@
 | 架构边界 | Atlas | `aios-arch` |
 | 任务拆解 | Mason | `aios-plan` |
 | 受控实现 | Hephaestus | `aios-exec` |
-| 质量审查 | Argus | `aios-review` |
-| AI Runtime 相关 | Daedalus | `aios-runtime` |
-| BIM / IFC / 行业语义相关 | Vitruvius | `aios-knowledge` |
+| 质量审查 | Argus | `aios-review` |
+| AI Runtime 相关 | Daedalus | `aios-runtime` |
+| BIM / IFC / 行业语义相关 | Vitruvius | `aios-knowledge` |
+| 结构力学 / 求解链路相关 | Euclid | `aios-structural` |
 ## 输入
@@ -33,36 +34,41 @@
 ## 执行顺序
-1. Atlas 判断需求是否涉及架构边界、数据模型、Runtime 或长期复杂度。
-2. Mason 将需求拆成任务、依赖、验收标准和执行顺序。
-3. Hephaestus 按 Mason 的任务执行最小改动。
-4. Argus 审查 diff、测试缺口、安全和技术债风险。
-5. Mason 汇总交付状态、剩余风险和发布条件。
+1. Atlas 判断需求是否涉及架构边界、数据模型、Runtime 或长期复杂度。
+2. Mason 将需求拆成任务、依赖、验收标准和执行顺序。
+3. 如涉及规范、结构计算、安全或 Runtime 权限，先按 Capability 证据和仲裁协议确认是否可进入执行。
+4. Hephaestus 按 Mason 的任务执行最小改动。
+5. Argus 审查 diff、测试缺口、安全和技术债风险。
+6. Mason 汇总交付状态、剩余风险和发布条件。
 ## 升级规则
 - 涉及服务边界、数据模型、核心技术栈：升级给 Atlas。
-- 涉及权限、安全、Prompt 注入、生产发布：升级给 Argus。
-- 涉及 RAG、GraphRAG、MCP、Memory、Tool Calling：升级给 Daedalus。
-- 涉及 BIM、IFC、规范、审图逻辑：升级给 Vitruvius。
-- 任务拆解不清、依赖复杂或交付顺序冲突：升级给 Mason。
+- 涉及权限、安全、Prompt 注入、生产发布：升级给 Argus。
+- 涉及 RAG、GraphRAG、MCP、Memory、Tool Calling：升级给 Daedalus。
+- 涉及 BIM、IFC、规范、审图逻辑：升级给 Vitruvius。
+- 涉及结构力学、荷载、边界条件、FEM 或结构计算工具链：升级给 Euclid。
+- 任务拆解不清、依赖复杂或交付顺序冲突：升级给 Mason。
+- Capability 返回阻断结果或证据缺失：按 `governance/arbitration-protocol.md` 回到对应 Agent 重评。
 ## 输出
 - 架构判断。
 - 任务拆解。
-- 实现变更。
-- Review 结果。
-- 验证证据。
-- 剩余风险和发布建议。
+- 实现变更。
+- Review 结果。
+- 验证证据。
+- Claim / Evidence / Tool Result / Decision。
+- 剩余风险和发布建议。
 ## 验收标准
 - 每个任务有明确输入、输出和验证方式。
 - 实现只触碰必要范围。
-- 关键路径经过测试、构建、lint 或人工检查。
-- Argus 无阻断问题。
-- 未验证项被明确记录。
+- 关键路径经过测试、构建、lint 或人工检查。
+- Argus 无阻断问题。
+- Capability 阻断项已清零，或已明确人工升级。
+- 未验证项被明确记录。
 ## 回滚与恢复

package/workflows/rag-pipeline.md CHANGED Viewed

@@ -28,15 +28,18 @@
 - 目标问题和用户场景。
 - 数据规模、更新频率、版本和来源。
 - 期望引用、追溯和评估方式。
+- 可用 Capability，例如 `knowledge.norm_lookup`、测试 / eval runner、GraphRAG 构建检查。
 ## 执行顺序
 1. Vitruvius 拆解领域对象、术语、条文条件和待核验项。
 2. Daedalus 设计 chunk、抽取、embedding、索引、检索、重排、引用和评估。
-3. Atlas 判断知识层、平台层和 Runtime 层边界。
-4. Mason 拆解实现任务和验证路径。
-5. Hephaestus 执行受控实现或文档落地。
-6. Argus 审查数据污染、Prompt 注入、工具权限和发布风险。
+3. 使用或要求 `knowledge.norm_lookup` 等 Capability 证据校验规范版本、适用条件、来源页码和冲突关系。
+4. Atlas 判断知识层、平台层和 Runtime 层边界。
+5. Mason 拆解实现任务和验证路径。
+6. Hephaestus 执行受控实现或文档落地。
+7. Argus 审查数据污染、Prompt 注入、工具权限和发布风险。
+8. 对冲突条文、适用性不明或工具失败输出 `Claim / Evidence / Tool Result / Decision`。
 ## 输出
@@ -45,6 +48,7 @@
 - 检索和生成链路。
 - 评估指标。
 - 风险与待核验项。
+- Capability 证据和仲裁结论。
 - 后续任务。
 ## 验收标准
@@ -54,4 +58,4 @@
 - RAG / GraphRAG 有评估方式。
 - 不能自动判断的行业问题被标注。
 - 权限、数据污染和 Prompt 注入风险已审查。
+- 规范或知识结论缺少版本、来源、适用条件时不得标记为已验证。