@archsight/aios 1.3.0 → 1.3.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (67) hide show
  1. package/.claude-plugin/plugin.json +1 -1
  2. package/CHANGELOG.md +24 -0
  3. package/README.md +2 -2
  4. package/RELEASE_NOTES.md +12 -0
  5. package/adapters/workbuddy/README.md +11 -1
  6. package/agents/atlas/responsibilities.md +1 -1
  7. package/agents/atlas/system-prompt.md +1 -1
  8. package/agents/hestia/system-prompt.md +1 -1
  9. package/agents/hestia/workflow.md +2 -2
  10. package/agents/plutus/system-prompt.md +2 -2
  11. package/agents/plutus/workflow.md +2 -2
  12. package/agents/themis/responsibilities.md +1 -1
  13. package/agents/themis/system-prompt.md +2 -2
  14. package/agents/themis/workflow.md +2 -2
  15. package/bin/archsight-aios.mjs +5 -3
  16. package/gemini-extension.json +1 -1
  17. package/governance/README.md +41 -11
  18. package/governance/agent-boundary.md +1 -2
  19. package/governance/ai-review-policy.md +1 -2
  20. package/governance/arbitration-protocol.md +33 -33
  21. package/governance/context-policy.md +2 -3
  22. package/governance/delivery-policy.md +1 -2
  23. package/governance/memory-policy.md +1 -2
  24. package/governance/security-policy.md +1 -2
  25. package/memory/decision-records.md +8 -9
  26. package/package.json +1 -1
  27. package/prompts/evaluations/engineering-business-basic-advisory-validation-2026-06-16.md +3 -3
  28. package/prompts/evaluations/engineering-business-basic-fixtures.json +12 -12
  29. package/prompts/evaluations/engineering-business-basic-model-output.example.json +6 -6
  30. package/prompts/evaluations/engineering-business-basic-prompts-2026-06-16.md +1 -1
  31. package/prompts/evaluations/engineering-business-public-advisory-fixtures.json +12 -12
  32. package/prompts/prompt-registry.md +6 -6
  33. package/runtime/agent-routing.md +5 -3
  34. package/runtime/archsight-aios.manifest.json +52 -13
  35. package/runtime/skill-routing.md +14 -8
  36. package/scripts/validate-skills.mjs +2 -1
  37. package/skills/README.md +10 -7
  38. package/skills/aios/SKILL.md +79 -0
  39. package/skills/aios/agents/openai.yaml +4 -0
  40. package/skills/aios-arch/SKILL.md +14 -14
  41. package/skills/aios-ceo/SKILL.md +13 -13
  42. package/skills/aios-commercial-contract/SKILL.md +14 -14
  43. package/skills/aios-commercial-contract/prompts/basic-prompt.md +1 -1
  44. package/skills/aios-commercial-tender/SKILL.md +14 -14
  45. package/skills/aios-commercial-tender/prompts/basic-prompt.md +1 -1
  46. package/skills/aios-commercial-variation/SKILL.md +15 -15
  47. package/skills/aios-commercial-variation/prompts/basic-prompt.md +1 -1
  48. package/skills/aios-compare/SKILL.md +92 -0
  49. package/skills/aios-compare/agents/openai.yaml +4 -0
  50. package/skills/aios-construction-daily/SKILL.md +14 -14
  51. package/skills/aios-construction-daily/prompts/basic-prompt.md +1 -1
  52. package/skills/aios-construction-meeting/SKILL.md +14 -14
  53. package/skills/aios-construction-meeting/prompts/basic-prompt.md +1 -1
  54. package/skills/aios-construction-scheme/SKILL.md +10 -10
  55. package/skills/aios-construction-scheme/prompts/basic-prompt.md +1 -1
  56. package/skills/aios-plan/SKILL.md +7 -7
  57. package/skills/aios-prompt-compare/SKILL.md +4 -2
  58. package/skills/aios-prompt-compare/agents/openai.yaml +2 -2
  59. package/skills/aios-review/SKILL.md +1 -1
  60. package/skills/aios-structural/SKILL.md +7 -7
  61. package/skills/archsight-aios/SKILL.md +40 -0
  62. package/skills/archsight-aios/agents/openai.yaml +4 -0
  63. package/skills/engineering-business-starter-kit.md +7 -4
  64. package/templates/project-ai/.ai/skills.md +13 -6
  65. package/workflows/README.md +1 -1
  66. package/workflows/architecture-review.md +10 -10
  67. package/workflows/site-daily-loop.md +25 -25
@@ -9,7 +9,7 @@ description: 工程会议待办闭环工作流。用于把现场协调会、交
9
9
 
10
10
  以 Mason(工程总工)的方式把工程会议记录转化为可执行的待办闭环表,保留结论来源、责任边界和未决争议。
11
11
 
12
- 本 Skill 不替代正式会议纪要签发、监理指令、合同通知或业主审批;未签发或未确认内容必须标注为 `Need verify`。
12
+ 本 Skill 不替代正式会议纪要签发、监理指令、合同通知或业主审批;未签发或未确认内容必须标注为 `需核验`。
13
13
 
14
14
  ## AIOS 适用性
15
15
 
@@ -49,12 +49,12 @@ description: 工程会议待办闭环工作流。用于把现场协调会、交
49
49
  ## Capability 与证据
50
50
 
51
51
  - 每条结论和待办必须引用会议原文、发言人、时间戳、页码、段落或纪要编号。
52
- - 涉及规范、制度、质量安全或监管要求时,调用或要求 `knowledge.norm_lookup`;没有 Tool Result 时标注 `Need verify`。
53
- - 会议结论与合同、图纸或联系单冲突时,输出 `Decision: Hold for human` 并交给 `aios-commercial-contract` 或 `aios-commercial-variation` 复核。
52
+ - 涉及规范、制度、质量安全或监管要求时,调用或要求 `knowledge.norm_lookup`;没有工具结果时标注 `需核验`。
53
+ - 会议结论与合同、图纸或联系单冲突时,输出 `处理建议:转人工复核` 并交给 `aios-commercial-contract` 或 `aios-commercial-variation` 复核。
54
54
 
55
55
  ## 工作流
56
56
 
57
- 1. 建立会议 Source Map:记录会议日期、版本、参会方、来源文件和定位方式。
57
+ 1. 建立会议资料来源清单:记录会议日期、版本、参会方、来源文件和定位方式。
58
58
  2. 识别会议类型:协调会、交底会、质量安全会、进度会、商务会或专题会。
59
59
  3. 抽取明确结论:只记录原文确认的结论,未形成一致意见的事项归入争议。
60
60
  4. 抽取待办:责任人、协作方、截止时间、交付物、依赖和验证方式。
@@ -67,12 +67,12 @@ description: 工程会议待办闭环工作流。用于把现场协调会、交
67
67
  默认输出:
68
68
 
69
69
  1. 会议核心结论
70
- 2. Source Map
70
+ 2. 资料来源清单
71
71
  3. 待办闭环表
72
72
  4. 遗留争议与风险
73
73
  5. 潜在变更 / 签证线索
74
74
  6. 下次会议追踪清单
75
- 7. Arbitration
75
+ 7. 证据仲裁
76
76
 
77
77
  待办条目格式:
78
78
 
@@ -82,17 +82,17 @@ description: 工程会议待办闭环工作流。用于把现场协调会、交
82
82
  协作方:
83
83
  截止时间:
84
84
  交付物:
85
- Evidence:
86
- Decision:
85
+ 证据:
86
+ 处理建议:
87
87
  ```
88
88
 
89
- Arbitration 条目格式:
89
+ 证据仲裁条目格式:
90
90
 
91
91
  ```text
92
- Claim:
93
- Evidence:
94
- Tool Result:
95
- Decision:Proceed / Need verify / Hold for human
92
+ 判断事项:
93
+ 证据:
94
+ 工具结果:
95
+ 处理建议:可继续 / 需核验 / 转人工复核
96
96
  ```
97
97
 
98
98
  ## 约束
@@ -101,4 +101,4 @@ Decision:Proceed / Need verify / Hold for human
101
101
  - 不补猜责任人、期限或承诺内容。
102
102
  - 不替代正式纪要签发、监理指令或合同通知。
103
103
  - 不输出变更成立、索赔成立或责任归属结论。
104
- - 会议来源不完整时必须保留 `Need verify`。
104
+ - 会议来源不完整时必须保留 `需核验`。
@@ -33,7 +33,7 @@
33
33
 
34
34
  请按以下格式输出:
35
35
 
36
- ### 资料来源 / Source Map
36
+ ### 资料来源清单
37
37
 
38
38
  | 序号 | 资料名称 / 片段 | 会议日期 | 来源文件 / 记录人 | 当前用途 | 可信度 / 缺口 |
39
39
  |---:|---|---|---|---|---|
@@ -49,17 +49,17 @@ description: 专项施工方案证据链辅审工作流。用于从施工方案
49
49
  ## Capability 与证据
50
50
 
51
51
  - 每个危险源、控制措施和交底要点必须绑定方案原文证据。
52
- - 涉及规范条文、地方规程、强制性要求或危大工程判断时,调用或要求 `knowledge.norm_lookup`;没有 Tool Result 时标注 `Need verify`。
53
- - 涉及力学计算、承载力、稳定、变形、荷载或边界条件时,不得口算;输出 `Decision: Hold for Euclid`,并要求 `aios-structural` 或项目计算书证据。
54
- - Agent 冲突或证据缺失按 `Claim / Evidence / Tool Result / Decision` 输出。
52
+ - 涉及规范条文、地方规程、强制性要求或危大工程判断时,调用或要求 `knowledge.norm_lookup`;没有工具结果时标注 `需核验`。
53
+ - 涉及力学计算、承载力、稳定、变形、荷载或边界条件时,不得口算;输出 `处理建议:转 Euclid 结构复核`,并要求 `aios-structural` 或项目计算书证据。
54
+ - Agent 冲突或证据缺失按中文化的 `判断事项 / 证据 / 工具结果 / 处理建议` 输出。
55
55
 
56
56
  ## 工作流
57
57
 
58
- 1. 建立 Source Map:列出方案版本、附件、计算书、审批/论证文件和定位方式。
58
+ 1. 建立资料来源清单:列出方案版本、附件、计算书、审批/论证文件和定位方式。
59
59
  2. 提取工程对象和适用范围:施工部位、专业、阶段、限制条件和前置条件。
60
60
  3. 拆解关键工序:按施工顺序提取质量控制点、安全控制点、验收点和交底要点。
61
61
  4. 建立危险源清单:危险源、触发条件、方案已写措施、缺失证据和人工复核岗位。
62
- 5. 标注规范核验点:只列需核验问题,不在缺少 Tool Result 时给出合规结论。
62
+ 5. 标注规范核验点:只列需核验问题,不在缺少工具结果时给出合规结论。
63
63
  6. 标注计算书和专家复核缺口:力学参数、荷载组合、支撑体系、设备能力、地质条件等。
64
64
  7. 输出班组交底摘要:把已确认的操作红线转为可执行提醒,保留来源证据。
65
65
 
@@ -68,13 +68,13 @@ description: 专项施工方案证据链辅审工作流。用于从施工方案
68
68
  默认输出:
69
69
 
70
70
  1. 结论
71
- 2. Source Map
71
+ 2. 资料来源清单
72
72
  3. 工程概况与适用范围
73
73
  4. 关键工序与控制点
74
74
  5. 危险源与控制措施
75
75
  6. 规范 / 计算书 / 专家复核清单
76
76
  7. 班组交底要点
77
- 8. Arbitration
77
+ 8. 证据仲裁
78
78
 
79
79
  复核条目格式:
80
80
 
@@ -82,9 +82,9 @@ description: 专项施工方案证据链辅审工作流。用于从施工方案
82
82
  事项:
83
83
  类型:规范核验 / 计算书 / 专家论证 / 现场条件 / 资料缺口
84
84
  方案原文:
85
- Evidence:
86
- Tool Result:
87
- Decision:
85
+ 证据:
86
+ 工具结果:
87
+ 处理建议:
88
88
  建议复核岗位:
89
89
  ```
90
90
 
@@ -33,7 +33,7 @@
33
33
 
34
34
  请按以下格式输出:
35
35
 
36
- ### 资料来源 / Source Map
36
+ ### 资料来源清单
37
37
 
38
38
  | 序号 | 资料名称 / 片段 | 版本 / 日期 | 章节 / 页码 / 图号 | 当前用途 | 可信度 / 缺口 |
39
39
  |---:|---|---|---|---|---|
@@ -60,13 +60,13 @@ description: 工程交付规划工作流。用于把功能、bug 修复、架构
60
60
 
61
61
  必要时补充:
62
62
 
63
- - What Already Exists:已有能力和复用判断。
64
- - Fact Refresh:本轮计划依据的当前代码事实,以及被剔除或降级的旧判断。
65
- - Failure Modes:关键路径、失败方式、测试覆盖、错误处理、用户可见性、级别。
66
- - Parallel Lanes:并行 workstream、触达模块、依赖、冲突标记、后置任务。
67
- - Test Gaps:用具体数据流或命令描述测试缺口,不只写“补测试”。
68
- - Arbitration:阻断 Claim、Capability 证据、人工升级点和当前 Decision。
69
- - First Step:当前最该执行的一件小事,说明为什么优先。
63
+ - 已有能力:已有能力和复用判断。
64
+ - 事实刷新:本轮计划依据的当前代码事实,以及被剔除或降级的旧判断。
65
+ - 失败模式:关键路径、失败方式、测试覆盖、错误处理、用户可见性、级别。
66
+ - 并行工作线:并行 workstream、触达模块、依赖、冲突标记、后置任务。
67
+ - 测试缺口:用具体数据流或命令描述测试缺口,不只写“补测试”。
68
+ - 证据仲裁:阻断判断事项、Capability 证据、人工升级点和当前处理建议。
69
+ - 第一小步:当前最该执行的一件小事,说明为什么优先。
70
70
 
71
71
  任务条目建议格式:
72
72
 
@@ -1,6 +1,6 @@
1
1
  ---
2
2
  name: aios-prompt-compare
3
- description: 比较弱提示词、便携强提示词和真实 Skill 触发结果的评估技能。用于 prompt 回归、weak/basic/runtime 三栏对照、Skill 沉淀价值判断、模型输出质量复盘和 AIOS 技能包验收。
3
+ description: 内部 Prompt 测试工具。仅供开发者明确调用,用于 weak/basic/runtime 三栏评测、prompt 回归、Skill 沉淀价值判断和 AIOS 技能包验收。
4
4
  ---
5
5
 
6
6
  # AIOS Prompt Compare
@@ -9,10 +9,11 @@ description: 比较弱提示词、便携强提示词和真实 Skill 触发结果
9
9
 
10
10
  以 Daedalus(AI 研发工程师)的方式组织 Prompt / Skill 效果对比,把同一输入下的弱提示词、便携强提示词和真实 Skill 触发结果拆成三栏评估,判断哪一类输出更稳定、更可复核、更值得沉淀为 Skill。
11
11
 
12
- 本 Skill 是评估和治理入口,不替代具体业务 Skill 执行,也不直接把评测结论当作生产可用性承诺。
12
+ 本 Skill 是内部评估和治理入口,不替代具体业务 Skill 执行,也不直接把评测结论当作生产可用性承诺。普通用户比较两份文档、两个版本或两个 AI 输出哪份更专业时,应使用 `aios-compare`,不要触发本 Skill。
13
13
 
14
14
  ## 适用场景
15
15
 
16
+ - 开发者明确写出 `aios-prompt-compare`,并要做 Prompt / Skill 测试。
16
17
  - 对比 `weakPrompt`、`prompts/basic-prompt.md` 和 `$aios-*` Skill 真实运行结果。
17
18
  - 判断一段提示词是否应升级为正式 Skill。
18
19
  - 复盘同一 fixture 在不同提示词、不同 Skill 或不同模型下的输出差异。
@@ -21,6 +22,7 @@ description: 比较弱提示词、便携强提示词和真实 Skill 触发结果
21
22
 
22
23
  不适用:
23
24
 
25
+ - 普通用户比较两份文档、两个版本或两个 AI 输出哪份更专业;这类任务使用 `aios-compare`。
24
26
  - 只想直接处理工程资料时,先使用对应业务 Skill。
25
27
  - 没有同一输入或可对齐输出时,不做横向优劣判断,只记录待补材料。
26
28
  - 不能把一次模型输出胜负当作长期质量结论。
@@ -1,4 +1,4 @@
1
1
  interface:
2
2
  display_name: "AIOS Prompt Compare"
3
- short_description: "对比弱提示词、强提示词和真实 Skill 运行结果质量"
4
- default_prompt: "使用 $aios-prompt-compare 对同一输入下的弱提示词、便携强提示词和真实 Skill 触发结果进行质量、边界和证据链对比,并在报告附录保留三类原始输出。"
3
+ short_description: "内部测试工具:评测 weak/basic/runtime Prompt 与 Skill 输出"
4
+ default_prompt: "仅在开发者明确调用 aios-prompt-compare 时使用;对同一输入下的弱提示词、便携强提示词和真实 Skill 触发结果进行质量、边界和证据链评测,并在报告附录保留三类原始输出。"
@@ -47,7 +47,7 @@ description: 代码审查和风险评审工作流。用于审查 diff、PR、AI
47
47
  1. 阻断问题
48
48
  2. 非阻断建议
49
49
  3. 测试缺口
50
- 4. Tool Result / Arbitration
50
+ 4. 工具结果 / 证据仲裁
51
51
  5. 剩余风险
52
52
  6. 结论
53
53
 
@@ -32,13 +32,13 @@ description: 结构力学与数值求解评审工作流。用于评估梁、桁
32
32
  | `solver.truss_member_force` | 二维平面桁架杆件轴力求解 | L1 |
33
33
  | `knowledge.norm_lookup` | 规范条文、版本和适用条件查询 | L3 |
34
34
 
35
- 如果项目没有实现对应 Adapter,输出必须标注 `Need tool implementation`,并只给建模和验证建议,不输出确定数值结论。
35
+ 如果项目没有实现对应 Adapter,输出必须标注 `需实现工具适配`,并只给建模和验证建议,不输出确定数值结论。
36
36
 
37
37
  ## 工作流
38
38
 
39
39
  1. 明确问题类型:参数提取、建模边界、求解器调用、结果解释、规范适用性或签审风险。
40
40
  2. 校验输入完整性:单位、荷载组合、边界条件、材料属性、截面参数、适用规范和工况。
41
- 3. 将自然语言问题转换为结构化工具输入;缺字段时停止在 `Need verify`。
41
+ 3. 将自然语言问题转换为结构化工具输入;缺字段时停止在 `需核验`。
42
42
  4. 调用或要求确定性求解器证据;不得由 LLM 自行完成关键数值计算。
43
43
  5. 将工具结果转成工程说明,保留输入、公式 / 求解器版本、单位和警告。
44
44
  6. 判断是否需要 Vitruvius 做规范语义核验,或升级给人工结构工程师。
@@ -47,17 +47,17 @@ description: 结构力学与数值求解评审工作流。用于评估梁、桁
47
47
 
48
48
  1. 结论
49
49
  2. 已知条件
50
- 3. 缺失输入 / Need verify
50
+ 3. 缺失输入 / 需核验
51
51
  4. Capability 调用计划或工具结果
52
52
  5. 建模 / 计算建议
53
53
  6. 风险和人工升级点
54
54
 
55
55
  必要时补充:
56
56
 
57
- - `Claim:` 结构判断。
58
- - `Tool Result:` 求解器或规范查询返回值摘要。
59
- - `Rejected:` 被拒绝的建模或计算路径及原因。
60
- - `Need tool implementation:` 当前项目缺少的 Adapter。
57
+ - `判断事项:` 结构判断。
58
+ - `工具结果:` 求解器或规范查询返回值摘要。
59
+ - `已拒绝路径:` 被拒绝的建模或计算路径及原因。
60
+ - `需实现工具适配:` 当前项目缺少的 Adapter。
61
61
 
62
62
  ## 约束
63
63
 
@@ -0,0 +1,40 @@
1
+ ---
2
+ name: archsight-aios
3
+ description: ArchSight AIOS 总路由入口别名。用于“请用 ArchSight AIOS / AIOS 技能包分析该文档”的自然调用,规则等同于 aios。
4
+ ---
5
+
6
+ # ArchSight AIOS Router
7
+
8
+ 本 Skill 是 `aios` 总路由入口的品牌别名。用户使用 “ArchSight AIOS” 或 “AIOS 技能包” 这类自然叫法时,按本入口处理。
9
+
10
+ ## 执行方式
11
+
12
+ 优先读取并遵守相邻的 `../aios/SKILL.md`。如果宿主工具不能自动读取相邻 Skill,则按以下最小路由规则执行:
13
+
14
+ | 资料 / 任务线索 | 路由到 |
15
+ |---|---|
16
+ | 招标、投标、技术标、评分、资格、废标 | `aios-commercial-tender` |
17
+ | 合同、协议、分包、采购、付款、结算、履约、违约 | `aios-commercial-contract` |
18
+ | 日报、施工日志、周报、现场记录、进度、材料、机械、劳务 | `aios-construction-daily` |
19
+ | 会议纪要、例会、协调会、专题会、交底会、待办、责任人 | `aios-construction-meeting` |
20
+ | 变更、签证、联系单、洽商、索赔、图纸变更、工程量 | `aios-commercial-variation` |
21
+ | 专项施工方案、危大工程、深基坑、高支模、脚手架、吊装、危险源、交底、专家论证、计算书 | `aios-construction-scheme` |
22
+ | 结构计算、荷载、挠度、稳定、FEM | `aios-structural` |
23
+ | 明确调用 `aios-compare` 或要求判断两份文档 / 两个 AI 输出哪份更专业 | `aios-compare` |
24
+ | 开发者明确调用 `aios-prompt-compare` 或要求 weak / portable / skill-runtime 内部评测 | `aios-prompt-compare` |
25
+
26
+ ## 默认输出
27
+
28
+ 1. 资料类型和路由判断。
29
+ 2. 资料来源清单或资料来源说明。
30
+ 3. 对应业务 Skill 的主输出表 / 清单 / 台账。
31
+ 4. 资料缺口和需补充确认事项。
32
+ 5. 人工复核岗位。
33
+ 6. 不能由 AI 直接下结论的事项。
34
+
35
+ ## 约束
36
+
37
+ - 不输出最终法律意见、合规结论、安全结论、结构计算结论、结算金额或责任归属。
38
+ - 不把资料未提及内容补猜成事实。
39
+ - 类型不清时先做资料状态判断,不要泛泛总结。
40
+ - 涉及金额、工期、法律责任、质量安全、规范、结构计算、审批或签审时,必须保留人工复核。
@@ -0,0 +1,4 @@
1
+ interface:
2
+ display_name: "ArchSight AIOS Router"
3
+ short_description: "ArchSight AIOS 总入口别名,按资料类型路由到对应 aios-* 技能"
4
+ default_prompt: "当用户使用 ArchSight AIOS 或 AIOS 技能包这类自然叫法时,先识别资料类型,再按 aios 总路由规则选择具体 aios-* 技能;不确定时先做资料状态判断。"
@@ -17,6 +17,8 @@
17
17
 
18
18
  它适合处理施工企业常见的工程业务资料。目标不是证明 AI 能自动完成工程管理,而是帮助业务人员把资料整理成矩阵、清单、台账和复核问题,让后续人工判断更快、更稳、更可追溯。
19
19
 
20
+ 如果用户只说“请用 AIOS 技能包分析该文档”,应先通过 `aios` 或 `archsight-aios` 总入口识别资料类型,再路由到下表中的具体 Skill;不要要求业务用户记住完整 Skill 名称。
21
+
20
22
  ## 对外口径
21
23
 
22
24
  推荐表达:
@@ -51,7 +53,7 @@
51
53
 
52
54
  1. 选择对应 Skill。
53
55
  2. 粘贴资料片段和最小输入包。
54
- 3. 先生成 `Source Map`,确认资料来源和定位方式。
56
+ 3. 先生成 `资料来源清单`,确认资料来源和定位方式。
55
57
  4. 输出矩阵、清单或台账。
56
58
  5. 把缺资料、缺责任人、缺期限、缺规范证据和需专业复核事项单独列出。
57
59
  6. 由人工负责人复核后,再决定是否沉淀为部门模板、提示词或本地智能体工作流。
@@ -61,18 +63,19 @@
61
63
  基础版场景下,6 个 Skill 都应尽量保持以下结构,便于施工企业内部形成统一使用习惯:
62
64
 
63
65
  1. 输入类型和资料状态判断。
64
- 2. Source Map。
66
+ 2. 资料来源清单。
65
67
  3. 主输出表:响应矩阵 / 履约节点 / 问题台账 / 待办闭环 / 资料链 / 辅助复核清单。
66
68
  4. 需补充确认事项。
67
69
  5. 人工复核岗位。
68
70
  6. 可沉淀为部门模板的字段。
69
71
  7. 不适用或不能下结论的事项。
70
- 8. Arbitration:`Claim / Evidence / Tool Result / Decision`。
72
+ 8. 证据仲裁:`判断事项 / 证据 / 工具结果 / 处理建议`。
71
73
 
72
74
  ## Skill 路由
73
75
 
74
76
  | 场景 | 使用 Skill | 典型输出 |
75
77
  |---|---|---|
78
+ | 用户未指定资料类型,只说使用 AIOS / ArchSight AIOS 分析文档 | `aios` / `archsight-aios` | 资料类型判断、Skill 路由、资料缺口、人工复核边界 |
76
79
  | 招标文件、评分办法、技术标问题、AI 标书工具复核问题 | `aios-commercial-tender` | 问题回应矩阵、评分点响应矩阵、废标风险占位、资料缺口 |
77
80
  | 分包合同、采购合同、租赁合同、补充协议 | `aios-commercial-contract` | 合同基本事实、履约节点、付款条件、空白字段核对表 |
78
81
  | 项目日报、施工日报、周报素材、项目群日报 | `aios-construction-daily` | 管理摘要、问题台账、模板质量诊断、需确认事项 |
@@ -96,7 +99,7 @@
96
99
  一次基础使用只要满足以下标准,就可以认为 Skill 输出可用于内部讨论:
97
100
 
98
101
  - 输出能回到原始资料位置。
99
- - 缺失信息被标为 `需补充确认` 或 `Need verify`。
102
+ - 缺失信息被标为 `需补充确认` 或 `需核验`。
100
103
  - 工程、合同、造价、法务、财务、质量安全事项保留人工复核岗位。
101
104
  - 输出是表格、清单或台账,能复制进部门工作流。
102
105
  - 没有把样例输出写成最终专业结论。
@@ -4,15 +4,17 @@
4
4
 
5
5
  Skill 是“怎么做”,不是“谁来做”。本项目优先使用已启用的 ArchSight AIOS Skill,避免与通用技能包混淆。
6
6
 
7
- ArchSight AIOS 的 Skill 是面向建筑行业平台研发的治理能力;`aios-*` 前缀表示来源和命名空间,不表示当前项目属于 ArchSightLabs。
7
+ ArchSight AIOS 的 Skill 是面向建筑行业平台研发的治理能力;`aios` / `archsight-aios` 是总路由入口,其他 `aios-*` 前缀表示来源和命名空间,不表示当前项目属于 ArchSightLabs。
8
8
 
9
9
  AIOS 是建筑行业增强层,不是通用任务替代器。只有当前项目 profile、项目上下文或用户任务明确涉及 BIM / IFC / Revit / CAD、建筑规范、智能审图、施工视觉、工程知识库、GraphRAG、图纸 / 模型处理、证据链、人工复核、审计留痕或建筑行业平台时,才启用行业增强。普通非建筑任务优先使用宿主工具的通用能力,不强行套用建筑行业假设。
10
10
 
11
11
  ## Skill 路由
12
12
 
13
- | 任务 | Skill | 主 Agent |
14
- | --- | --- | --- |
15
- | 建筑行业软件 / 系统深度评价、项目立项 / 产品定位 / 商业目标 | `aios-ceo` | Janus |
13
+ | 任务 | Skill | 主 Agent |
14
+ | --- | --- | --- |
15
+ | AIOS 总入口、资料类型识别和 Skill 自动路由 | `aios` | Daedalus |
16
+ | ArchSight AIOS 总入口别名和自然语言调用 | `archsight-aios` | Daedalus |
17
+ | 建筑行业软件 / 系统深度评价、项目立项 / 产品定位 / 商业目标 | `aios-ceo` | Janus |
16
18
  | 建筑行业平台 UI / UX 设计方案 / 工作台体验 | `aios-design` | Janus |
17
19
  | 建筑行业项目架构评审 | `aios-arch` | Atlas |
18
20
  | 建筑行业项目交付计划 | `aios-plan` | Mason |
@@ -20,7 +22,8 @@ AIOS 是建筑行业增强层,不是通用任务替代器。只有当前项目
20
22
  | BIM / IFC / 建筑知识建模 | `aios-knowledge` | Vitruvius |
21
23
  | 结构力学 / 荷载 / FEM / 确定性求解链路 | `aios-structural` | Euclid |
22
24
  | 建筑行业 AI Runtime / RAG / MCP / Memory | `aios-runtime` | Daedalus |
23
- | Prompt / Skill 输出对比、weak/basic/runtime 三栏评测 | `aios-prompt-compare` | Daedalus |
25
+ | 两份文档、两个版本或两个 AI 输出专业度对比 | `aios-compare` | Daedalus |
26
+ | 内部 Prompt / Skill 测试、weak/basic/runtime 三栏评测 | `aios-prompt-compare` | Daedalus |
24
27
  | 建筑行业项目受控实现 / 测试 / 文档 / 脚本 | `aios-exec` | Hephaestus |
25
28
  | 工程招投标响应 / 评分点 / 废标风险 / 技术标资料矩阵 | `aios-commercial-tender` | Mason |
26
29
  | 工程合同履约节点 / 付款条件 / 责任边界 / 资料缺口 | `aios-commercial-contract` | Themis |
@@ -33,6 +36,8 @@ AIOS 是建筑行业增强层,不是通用任务替代器。只有当前项目
33
36
 
34
37
  默认不要求用户手动勾选 Skill。`archsight-aios init` 会生成 `.ai/profile-detection.md` 和 `.ai/project-context.md`,当前 AI 工具应结合项目事实、用户任务、资料类型和自动识别结果选择合适的 Skill。
35
38
 
39
+ - `aios`
40
+ - `archsight-aios`
36
41
  - `aios-arch`
37
42
  - `aios-ceo`
38
43
  - `aios-design`
@@ -41,6 +46,7 @@ AIOS 是建筑行业增强层,不是通用任务替代器。只有当前项目
41
46
  - `aios-knowledge`
42
47
  - `aios-structural`
43
48
  - `aios-runtime`
49
+ - `aios-compare`
44
50
  - `aios-prompt-compare`
45
51
  - `aios-exec`
46
52
  - `aios-commercial-tender`
@@ -58,7 +64,8 @@ AIOS 是建筑行业增强层,不是通用任务替代器。只有当前项目
58
64
  - 只有启用建筑、BIM、IFC、规范知识库、GraphRAG 或智能审图 profile 时,才默认启用 `aios-knowledge`。
59
65
  - 涉及结构力学、荷载、FEM、结构计算工具链或工程安全风险时,启用 `aios-structural`;关键数值必须来自确定性求解器或项目已有计算书。
60
66
  - 涉及工程招投标、合同履约、施工日报、工程会议、变更签证或专项施工方案时,可按资料类型启用工程业务管理 Skill;这些 Skill 只做证据链整理和人工复核分流,不替代正式签审。
61
- - 涉及提示词效果、weak/basic 对照、真实 Skill 输出比较或是否应沉淀为 Skill 时,启用 `aios-prompt-compare`;真实 Skill 结果必须来自宿主工具触发对应 `$aios-*` Skill 后的输出。
67
+ - 涉及两份文档、两个版本或两个 AI 输出哪份更专业、更可复核、更适合交付时,启用 `aios-compare`。
68
+ - 涉及提示词效果、weak/basic 对照、真实 Skill 输出比较或是否应沉淀为 Skill 时,只有开发者明确调用 `aios-prompt-compare` 才启用;真实 Skill 结果必须来自宿主工具触发对应 `$aios-*` Skill 后的输出。
62
69
  - 涉及规范、制度、结构计算、质量安全、金额、工期索赔或责任归属时,必须保留 `Claim / Evidence / Tool Result / Decision`;没有工具或人工证据时标注 `Need verify` 或 `Hold for human`。
63
70
  - 当前任务不涉及建筑行业语义时,不要为了“已安装 AIOS”而强制使用 `aios-*` Skill。
64
71
  - 如 Skill 来源、安装位置或同步方式无法确认,应标注待核验,不要假设已经启用。
@@ -21,4 +21,4 @@
21
21
 
22
22
  每个 workflow 应明确参与角色、输入、输出、执行顺序、验收标准和回滚策略。
23
23
 
24
- 涉及多 Agent 冲突、规范证据、结构计算、安全扫描、测试门禁或 Runtime 权限时,Workflow 还应输出 `Claim / Evidence / Tool Result / Decision`,并按 [Capability-Backed Arbitration Protocol](../governance/arbitration-protocol.md) 仲裁。
24
+ 涉及多 Agent 冲突、规范证据、结构计算、安全扫描、测试门禁或 Runtime 权限时,Workflow 面向用户应输出中文化的 `判断事项 / 证据 / 工具结果 / 处理建议`,并按 [Capability 证据仲裁协议](../governance/arbitration-protocol.md) 仲裁。
@@ -45,9 +45,9 @@
45
45
  7. Atlas 用 P0/P1/P2 或等效等级标注风险优先级,形成架构依据。
46
46
  8. Daedalus 评审 AI Runtime / RAG / Tool / Memory 相关设计。
47
47
  9. Vitruvius 评审 BIM / IFC / 建筑规范相关语义。
48
- 10. Euclid 评审结构力学、荷载、边界条件、FEM 或求解器接口相关问题;关键数值必须来自确定性求解器或标记 `Need verify`。
48
+ 10. Euclid 评审结构力学、荷载、边界条件、FEM 或求解器接口相关问题;关键数值必须来自确定性求解器或标记 `需核验`。
49
49
  11. Argus 评审安全、权限、Prompt 注入、依赖和发布风险。
50
- 12. 对 Agent 冲突输出 `Claim / Evidence / Tool Result / Decision`,按 `governance/arbitration-protocol.md` 仲裁。
50
+ 12. 对 Agent 冲突输出中文化的 `判断事项 / 证据 / 工具结果 / 处理建议`,按 `governance/arbitration-protocol.md` 仲裁。
51
51
  13. Atlas 做交付审查增强:列出本次事实刷新、历史报告过期判断、与既有报告 diff、领域风险 / 工程风险分类,以及每个高优先级发现的文件落点和验证方式。
52
52
  14. Mason 将通过评审的方案拆成可执行任务,并纳入 Failure Modes、测试缺口、并行 workstream 和冲突点。
53
53
 
@@ -57,10 +57,10 @@
57
57
  2. 架构判断
58
58
  3. 风险与边界
59
59
  4. 推荐方案
60
- 5. Rejected 方案
61
- 6. Assumption / Need verify
62
- 7. Failure Modes
63
- 8. Claim / Evidence / Tool Result / Decision
60
+ 5. 已拒绝方案
61
+ 6. 假设 / 需核验
62
+ 7. 失败模式
63
+ 8. 判断事项 / 证据 / 工具结果 / 处理建议
64
64
  9. 后续执行任务
65
65
  10. 本次事实刷新
66
66
  11. 已过期判断 / 与既有报告 diff
@@ -74,21 +74,21 @@
74
74
  - 再判断各检查项的定位:架构依据、工程计划、代码审查、测试计划或风险清单。
75
75
  - 架构依据优先采纳边界判断、风险分级、长期演进和被拒绝方案。
76
76
  - 工程计划优先采纳 Failure Modes、测试缺口、并行 workstream、冲突标记和回归命令。
77
- - 纠正文档中的细节错误,例如 Assumption 与 Need verify 数量混淆。
77
+ - 纠正文档中的细节错误,例如假设与需核验数量混淆。
78
78
  - 对“未覆盖”的判断要谨慎:如果已有评审已触及某风险但未形成完整策略,应写成“已触及但未系统展开”。
79
79
  - 如果本次是“全新独立评审”,仍应建立历史高优先级发现的回归清单;清单只用于防止漏检,不要求继承旧报告结论。
80
80
  - 抽象发现不能吞掉具体断链。若某字段、关系或元数据已经被纳入更大的 P1/P2 主题,还必须说明是否完成端到端贯通;未贯通时应保留独立风险或验收项。
81
81
  - 对 RAG / GraphRAG、规范知识库和审计系统,重点抽查 `source_version`、适用地区、专业、生效状态、复核状态、版本替代关系、证据引用和缓存/索引版本是否从摄取入口贯通到消费端。
82
- - 每个 P0/P1/P2 发现必须标注为 `领域风险`、`工程风险` 或 `混合风险`,并说明文件 / 模块、最小改动范围和验证命令;无法定位时标为 `Need verify`。
82
+ - 每个 P0/P1/P2 发现必须标注为 `领域风险`、`工程风险` 或 `混合风险`,并说明文件 / 模块、最小改动范围和验证命令;无法定位时标为 `需核验`。
83
83
  - 最终必须给出“现在最该做的一件小事”,优先选择低风险、可验证、能消除静默错误或关键漂移的动作。
84
84
 
85
85
  ## 仲裁门禁
86
86
 
87
87
  当 Atlas、Mason、Vitruvius、Euclid、Daedalus 或 Argus 的判断冲突时:
88
88
 
89
- - 先把意见转成 Claim,不直接用自然语言争论结论。
89
+ - 先把意见转成判断事项,不直接用自然语言争论结论。
90
90
  - 优先采纳确定性工具、项目事实和结构化知识证据。
91
- - 工具结果缺少输入、版本、适用条件或执行状态时,标为 `Need verify`。
91
+ - 工具结果缺少输入、版本、适用条件或执行状态时,标为 `需核验`。
92
92
  - L1 工具失败、规范适用性冲突、安全权限失败或结构输入无效时,阻断进入 Mason 拆解或 Hephaestus 执行。
93
93
  - 涉及生产授权、法规合规最终判断、结构安全结论或商业范围取舍时,升级给人类负责人。
94
94
 
@@ -26,7 +26,7 @@
26
26
  | 日报摘要提取 | Mason | `aios-construction-daily` | 提取事实摘要、异常、问题台账、计划偏差和需补充确认事项。 |
27
27
  | 会议待办闭环 | Mason | `aios-construction-meeting` | 提取会议结论、责任人、期限、争议点和下次追踪事项。 |
28
28
  | 签证资料链审查 | Argus | `aios-commercial-variation` | 对高风险事项检查联系单、纪要、图纸、日志和合同流程资料链。 |
29
- | 行业语义 / 规范核验 | Vitruvius / Athena | `aios-knowledge` / `knowledge.norm_lookup` | 对规范、制度或地方要求进行可追溯查询;缺工具时输出 `Need verify`。 |
29
+ | 行业语义 / 规范核验 | Vitruvius / Athena | `aios-knowledge` / `knowledge.norm_lookup` | 对规范、制度或地方要求进行可追溯查询;缺工具时输出 `需核验`。 |
30
30
 
31
31
  ## 输入
32
32
 
@@ -41,61 +41,61 @@
41
41
  综合简报必须包含:
42
42
 
43
43
  1. 今日管理摘要。
44
- 2. Source Map。
44
+ 2. 资料来源清单。
45
45
  3. 待办与问题追踪台账。
46
46
  4. 潜在签证 / 变更预警清单。
47
47
  5. 需人工复核与确认的盲区。
48
- 6. Arbitration:关键风险的 `Claim / Evidence / Tool Result / Decision`。
48
+ 6. 证据仲裁:关键风险的 `判断事项 / 证据 / 工具结果 / 处理建议`。
49
49
 
50
50
  ## 执行顺序
51
51
 
52
- 1. Mason 冻结输入范围,建立 Source Map,并按资料类型分派。
52
+ 1. Mason 冻结输入范围,建立资料来源清单,并按资料类型分派。
53
53
  2. 并行调用:
54
54
  - `aios-construction-daily` 输出事实摘要、问题台账和计划偏差。
55
55
  - `aios-construction-meeting` 输出会议结论、待办闭环和遗留争议。
56
- 3. Mason 合并台账,只合并带 `Evidence` 的事项;证据缺失项进入 `Need verify`。
56
+ 3. Mason 合并台账,只合并带 `证据` 的事项;证据缺失项进入 `需核验`。
57
57
  4. Mason 抽取高风险事项,例如工期延误、图纸争议、现场条件变化、质量安全异常、责任不清和资料断点。
58
58
  5. Argus 使用 `aios-commercial-variation` 对高风险事项进行资料链审查。
59
- 6. 对涉及规范、制度或地方要求的事项,调用或要求 `knowledge.norm_lookup`;没有 Tool Result 时不得写成已验证。
60
- 7. Mason 生成统一简报,保留每条关键结论的来源、子 skill 输出和当前 Decision。
59
+ 6. 对涉及规范、制度或地方要求的事项,调用或要求 `knowledge.norm_lookup`;没有工具结果时不得写成已验证。
60
+ 7. Mason 生成统一简报,保留每条关键结论的来源、子 skill 输出和当前处理建议。
61
61
 
62
62
  ## 验收标准
63
63
 
64
- - 输入资料已建立 Source Map,关键结论能追溯到原文或子 skill 输出。
64
+ - 输入资料已建立资料来源清单,关键结论能追溯到原文或子 skill 输出。
65
65
  - “已确认事实”“推断事项”“需确认事项”被明确区分。
66
- - 待办台账具备责任人、期限、交付物、证据和当前 Decision。
66
+ - 待办台账具备责任人、期限、交付物、证据和当前处理建议。
67
67
  - 潜在签证 / 变更预警只基于客观材料,不输出成立、责任或金额结论。
68
- - 涉及规范、制度或地方要求的结论有 Tool Result;没有则标 `Need verify`。
68
+ - 涉及规范、制度或地方要求的结论有工具结果;没有则标 `需核验`。
69
69
  - 最终简报可发送给项目管理团队,但不能替代正式纪要、签证、通知或审批文件。
70
70
 
71
- ## Claim / Evidence / Tool Result / Decision
71
+ ## 证据仲裁
72
72
 
73
73
  关键风险条目必须使用以下格式:
74
74
 
75
75
  ```text
76
- Claim:
77
- Evidence:
78
- Tool Result:
79
- Decision:Proceed / Need verify / Hold for human
76
+ 判断事项:
77
+ 证据:
78
+ 工具结果:
79
+ 处理建议:可继续 / 需核验 / 转人工复核
80
80
  责任人:
81
81
  下一步:
82
82
  ```
83
83
 
84
- Decision 规则:
84
+ 处理建议规则:
85
85
 
86
- - `Proceed`:证据完整,且只需进入普通跟踪或执行。
87
- - `Need verify`:缺计划基线、责任人、签认、图号、规范 Tool Result 或资料原文。
88
- - `Hold for human`:涉及金额、责任归属、工期索赔、质量安全结论、合同法律意见或正式签审。
86
+ - `可继续`:证据完整,且只需进入普通跟踪或执行。
87
+ - `需核验`:缺计划基线、责任人、签认、图号、规范工具结果或资料原文。
88
+ - `转人工复核`:涉及金额、责任归属、工期索赔、质量安全结论、合同法律意见或正式签审。
89
89
 
90
90
  ## 降级与人工接入
91
91
 
92
- - 如果输入资料极度残缺,流程停止在 Source Map 和待补充资料清单。
93
- - 如果子 skill 输出没有 Evidence,Mason 不得纳入最终确定结论,只能作为待核验线索。
92
+ - 如果输入资料极度残缺,流程停止在资料来源清单和待补充资料清单。
93
+ - 如果子 skill 输出没有证据,Mason 不得纳入最终确定结论,只能作为待核验线索。
94
94
  - 对金额、工期、质量安全、责任归属、合同争议和正式签认事项,必须交由专业岗位人工接入。
95
- - 如果规范或制度查询工具不可用,相关结论降级为 `Need verify`。
95
+ - 如果规范或制度查询工具不可用,相关结论降级为 `需核验`。
96
96
 
97
97
  ## 回滚策略
98
98
 
99
- - 如果汇总简报发现引用错误或资料版本错误,撤回该版本简报,回到 Source Map 阶段重新绑定证据。
100
- - 如果后续正式纪要、联系单或业主/监理签认推翻当前摘要,应保留旧版为历史记录,并发布修订版,标注被替换的 Claim。
101
- - 如果误把推断写成事实,应将对应条目标为 `Need verify`,并通知下游台账或签证线索使用方停止引用该结论。
99
+ - 如果汇总简报发现引用错误或资料版本错误,撤回该版本简报,回到资料来源清单阶段重新绑定证据。
100
+ - 如果后续正式纪要、联系单或业主/监理签认推翻当前摘要,应保留旧版为历史记录,并发布修订版,标注被替换的判断事项。
101
+ - 如果误把推断写成事实,应将对应条目标为 `需核验`,并通知下游台账或签证线索使用方停止引用该结论。