@archsight/aios 1.2.0 → 1.3.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (110) hide show
  1. package/.claude-plugin/plugin.json +1 -1
  2. package/CHANGELOG.md +59 -0
  3. package/OPENCODE.md +23 -0
  4. package/README.md +64 -31
  5. package/RELEASE_NOTES.md +37 -0
  6. package/adapters/workbuddy/README.md +11 -1
  7. package/agents/README.md +6 -3
  8. package/agents/atlas/responsibilities.md +1 -1
  9. package/agents/atlas/system-prompt.md +1 -1
  10. package/agents/daedalus/system-prompt.md +2 -0
  11. package/agents/hestia/constraints.md +7 -0
  12. package/agents/hestia/responsibilities.md +7 -0
  13. package/agents/hestia/role.md +12 -0
  14. package/agents/hestia/system-prompt.md +23 -0
  15. package/agents/hestia/workflow.md +8 -0
  16. package/agents/plutus/constraints.md +7 -0
  17. package/agents/plutus/responsibilities.md +7 -0
  18. package/agents/plutus/role.md +12 -0
  19. package/agents/plutus/system-prompt.md +24 -0
  20. package/agents/plutus/workflow.md +8 -0
  21. package/agents/themis/constraints.md +7 -0
  22. package/agents/themis/responsibilities.md +7 -0
  23. package/agents/themis/role.md +12 -0
  24. package/agents/themis/system-prompt.md +24 -0
  25. package/agents/themis/workflow.md +8 -0
  26. package/bin/archsight-aios.mjs +558 -25
  27. package/docs/PUBLIC_DISCOVERY.md +16 -2
  28. package/docs/business-expert-guide.md +5 -3
  29. package/docs/glossary.md +11 -3
  30. package/docs/quickstart.md +18 -4
  31. package/gemini-extension.json +1 -1
  32. package/governance/README.md +41 -11
  33. package/governance/agent-boundary.md +1 -2
  34. package/governance/ai-review-policy.md +1 -2
  35. package/governance/arbitration-protocol.md +33 -33
  36. package/governance/context-policy.md +2 -3
  37. package/governance/delivery-policy.md +1 -2
  38. package/governance/memory-policy.md +1 -2
  39. package/governance/security-policy.md +1 -2
  40. package/memory/decision-records.md +8 -9
  41. package/package.json +17 -6
  42. package/prompts/README.md +12 -0
  43. package/prompts/evaluation-policy.md +70 -0
  44. package/prompts/evaluations/engineering-business-basic-advisory-validation-2026-06-16.md +87 -0
  45. package/prompts/evaluations/engineering-business-basic-fixtures.json +375 -0
  46. package/prompts/evaluations/engineering-business-basic-model-output.example.json +179 -0
  47. package/prompts/evaluations/engineering-business-basic-prompts-2026-06-16.md +205 -0
  48. package/prompts/evaluations/engineering-business-basic-scorecard.json +238 -0
  49. package/prompts/evaluations/engineering-business-public-advisory-fixtures.json +422 -0
  50. package/prompts/evaluations/public-advisory-md/01-technical-bid.md +63 -0
  51. package/prompts/evaluations/public-advisory-md/02-contract.md +61 -0
  52. package/prompts/evaluations/public-advisory-md/03-daily.md +69 -0
  53. package/prompts/evaluations/public-advisory-md/04-meeting.md +48 -0
  54. package/prompts/evaluations/public-advisory-md/05-variation.md +63 -0
  55. package/prompts/evaluations/public-advisory-md/06-scheme.md +60 -0
  56. package/prompts/failure-cases.md +5 -1
  57. package/prompts/prompt-registry.md +10 -0
  58. package/runtime/agent-routing.md +39 -9
  59. package/runtime/archsight-aios.manifest.json +154 -51
  60. package/runtime/hermes/agent-registry.md +3 -0
  61. package/runtime/hermes/workspace-binding.md +3 -0
  62. package/runtime/skill-routing.md +23 -12
  63. package/scripts/analyze-prompt-run-results.mjs +187 -0
  64. package/scripts/build-prompt-run-pack.mjs +248 -0
  65. package/scripts/validate-prompt-fixtures.mjs +225 -0
  66. package/scripts/validate-prompt-model-outputs.mjs +201 -0
  67. package/scripts/validate-prompt-run-results.mjs +259 -0
  68. package/scripts/validate-prompt-scorecard.mjs +133 -0
  69. package/scripts/validate-skills.mjs +8 -3
  70. package/skills/README.md +12 -6
  71. package/skills/aios/SKILL.md +79 -0
  72. package/skills/aios/agents/openai.yaml +4 -0
  73. package/skills/aios-arch/SKILL.md +14 -14
  74. package/skills/aios-ceo/SKILL.md +13 -13
  75. package/skills/aios-commercial-contract/SKILL.md +32 -14
  76. package/skills/aios-commercial-contract/prompts/basic-prompt.md +83 -0
  77. package/skills/aios-commercial-tender/SKILL.md +31 -13
  78. package/skills/aios-commercial-tender/prompts/basic-prompt.md +94 -0
  79. package/skills/aios-commercial-variation/SKILL.md +33 -15
  80. package/skills/aios-commercial-variation/prompts/basic-prompt.md +99 -0
  81. package/skills/aios-compare/SKILL.md +92 -0
  82. package/skills/aios-compare/agents/openai.yaml +4 -0
  83. package/skills/aios-construction-daily/SKILL.md +32 -14
  84. package/skills/aios-construction-daily/prompts/basic-prompt.md +76 -0
  85. package/skills/aios-construction-meeting/SKILL.md +32 -14
  86. package/skills/aios-construction-meeting/prompts/basic-prompt.md +78 -0
  87. package/skills/aios-construction-scheme/SKILL.md +28 -10
  88. package/skills/aios-construction-scheme/prompts/basic-prompt.md +90 -0
  89. package/skills/aios-plan/SKILL.md +7 -7
  90. package/skills/aios-prompt-compare/SKILL.md +180 -0
  91. package/skills/aios-prompt-compare/agents/openai.yaml +4 -0
  92. package/skills/aios-review/SKILL.md +1 -1
  93. package/skills/aios-structural/SKILL.md +7 -7
  94. package/skills/archsight-aios/SKILL.md +40 -0
  95. package/skills/archsight-aios/agents/openai.yaml +4 -0
  96. package/skills/engineering-business-starter-kit.md +112 -0
  97. package/templates/README.md +16 -2
  98. package/templates/project-ai/.ai/ARCHSIGHT_AIOS_RULES.md +5 -4
  99. package/templates/project-ai/.ai/agent-routing.md +3 -1
  100. package/templates/project-ai/.ai/profile-detection.md +24 -0
  101. package/templates/project-ai/.ai/project-context.md +4 -1
  102. package/templates/project-ai/.ai/skills.md +36 -24
  103. package/templates/project-ai/AGENTS.md +6 -5
  104. package/templates/project-ai/AI_CODING_RULES.md +1 -1
  105. package/templates/project-ai/CLAUDE.md +6 -5
  106. package/templates/project-ai/GEMINI.md +6 -5
  107. package/templates/project-ai/OPENCODE.md +26 -0
  108. package/workflows/README.md +1 -1
  109. package/workflows/architecture-review.md +10 -10
  110. package/workflows/site-daily-loop.md +25 -25
@@ -0,0 +1,63 @@
1
+ ---
2
+ caseId: public-advisory-variation-evidence-route
3
+ skillId: aios-commercial-variation
4
+ documentType: variation-evidence-chain
5
+ ---
6
+
7
+ # 变更签证资料链片段
8
+
9
+ > 数据说明:以下客户、项目、人员、地点、日期、金额、编号均为虚构。
10
+
11
+ ## 基本信息
12
+
13
+ | 字段 | 内容 |
14
+ |---|---|
15
+ | 虚构客户 | 青石建工集团有限公司 |
16
+ | 虚构项目 | 云港新区星澜中心一期总承包工程 |
17
+ | 虚构施工区域 | B 标段地下室东区 |
18
+ | 虚构签证编号 | VS-2031-0425-009 |
19
+ | 虚构联系单编号 | LC-2031-0426-003 |
20
+ | 虚构发生日期 | 2031-04-25 |
21
+ | 虚构暂估金额 | 218,600 元 |
22
+ | 虚构工程量 | 42.5m3 |
23
+ | 项目经办 | 许清禾 |
24
+ | 商务复核 | 陆遥 |
25
+ | 造价复核 | 孟星河 |
26
+
27
+ ## 样表字段
28
+
29
+ | 字段 | 示例内容 |
30
+ |---|---|
31
+ | 工程名称 | 云港新区星澜中心一期总承包工程 |
32
+ | 变更项目 | 地下室东区基础垫层局部加厚 |
33
+ | 变更原因 | 现场复测后局部标高调整 |
34
+ | 单位 | m3 |
35
+ | 申报数量 | 42.5 |
36
+ | 监理核定量 | 空白 |
37
+ | 建设单位核定量 | 空白 |
38
+ | 签章日期 | 空白 |
39
+
40
+ ## 过程线索
41
+
42
+ 1. 2031-04-24 会议纪要提到地下室东区现场条件调整,但未形成正式变更指令。
43
+ 2. 2031-04-25 施工日报记录该区域有垫层处理作业,但照片说明缺失。
44
+ 3. 合同片段要求变更事项应有联系单、图纸变更依据、工程量计算和审批签认。
45
+ 4. 联系单 LC-2031-0426-003 仅有草稿编号,未见签章页。
46
+
47
+ ## 资料缺口
48
+
49
+ - 未见正式签证单。
50
+ - 未见图纸变更单。
51
+ - 未见工程量计算书。
52
+ - 未见监理审核意见。
53
+ - 未见建设单位确认。
54
+ - 未见完整签章状态。
55
+
56
+ ## 希望输出
57
+
58
+ - 资料链完整度判断。
59
+ - 样表字段结构。
60
+ - 资料链清单。
61
+ - 合同和流程依据缺口。
62
+ - 人工复核分流。
63
+ - 不要判断签证、索赔、责任或最终金额。
@@ -0,0 +1,60 @@
1
+ ---
2
+ caseId: public-advisory-scheme-review-route
3
+ skillId: aios-construction-scheme
4
+ documentType: special-construction-scheme-feedback
5
+ ---
6
+
7
+ # 专项施工方案辅助复核输入
8
+
9
+ > 数据说明:以下客户、项目、人员、地点、日期、金额、编号均为虚构。
10
+
11
+ ## 基本信息
12
+
13
+ | 字段 | 内容 |
14
+ |---|---|
15
+ | 虚构客户 | 青石建工集团有限公司 |
16
+ | 虚构项目 | 云港新区星澜中心一期总承包工程 |
17
+ | 虚构施工区域 | 3 号楼高支模区域 |
18
+ | 虚构方案编号 | SCH-2031-0427-HZM-02 |
19
+ | 虚构日期 | 2031-04-27 |
20
+ | 技术负责人 | 陈知远 |
21
+ | 方案编制 | 宋栀 |
22
+ | 复核工程师 | 纪北辰 |
23
+ | 支模高度 | 8.4m |
24
+ | 梁截面 | 300x900 |
25
+ | 专家意见 | 12 条 |
26
+
27
+ ## AI 生成反馈
28
+
29
+ 1. AI 生成方案中的参数表写支模高度 8.1m,但工程概况表写 8.4m。
30
+ 2. 梁截面在正文写 300x900,计算书目录中出现 350x800。
31
+ 3. 方案引用地方标准名称不完整,未说明适用版本。
32
+ 4. 附图说明与 3 号楼高支模区域不完全匹配。
33
+ 5. 应急措施章节较通用,未对应本区域运输通道和临边条件。
34
+
35
+ ## 专家意见摘录
36
+
37
+ | 序号 | 专家意见 | 当前资料状态 |
38
+ |---:|---|---|
39
+ | 1 | 补充架体基础处理说明 | 正文有说明,缺照片或验收记录 |
40
+ | 3 | 复核梁板立杆布置 | 有平面图,缺节点详图 |
41
+ | 6 | 完善混凝土浇筑顺序 | 有文字,缺交底流程 |
42
+ | 8 | 核对计算书参数一致性 | 发现参数不一致 |
43
+ | 11 | 明确监测和应急响应人员 | 有岗位,缺联系方式 |
44
+
45
+ ## 需复核资料
46
+
47
+ - 完整计算书。
48
+ - 附图原件。
49
+ - 专家论证记录。
50
+ - 最终审批状态。
51
+ - 方案交底记录。
52
+ - 架体验收记录。
53
+
54
+ ## 希望输出
55
+
56
+ - AI 生成失准原因复盘。
57
+ - 专家修改说明回查清单。
58
+ - 危险源和控制措施。
59
+ - 需人工复核问题清单。
60
+ - 不要确认计算正确、方案结论或审批状态。
@@ -20,4 +20,8 @@ Prompt:
20
20
  - 编造行业条文。
21
21
  - 输出不可验证计划。
22
22
  - 把可选建议当阻断项。
23
-
23
+ - 把资料未提及或字段空白写成现场事实结论。
24
+ - 把会议发言人直接写成最终责任人。
25
+ - 把签证、日报、会议纪要等过程线索写成正式结算依据。
26
+ - 把施工方案辅助复核写成方案审查结论。
27
+ - 把单次提示词输出包装成系统接入、自动审批或专业签审能力。
@@ -22,3 +22,13 @@ Prompt 必须作为可评估资产维护,而不是散落文本。
22
22
 
23
23
  Prompt 修改必须记录原因、预期行为变化和评估结果。
24
24
 
25
+ ## 已登记 Prompt
26
+
27
+ | 名称 | 版本 | 适用场景 | 输入 | 输出 | 禁止场景 | 评估方式 | 路径 |
28
+ |---|---|---|---|---|---|---|---|
29
+ | 招标文件解析与技术标响应矩阵基础提示词 | 0.1 | 工程招投标、技术标响应、AI 标书工具复核问题整理 | 招标文件、评分办法、技术标要求、人工检查问题清单 | 资料来源清单、输入类型判断、问题回应矩阵、评分点响应矩阵、资料缺口 | 中标概率、评标结论、采购承诺、串标规避建议 | 是否先判断资料状态,是否避免编造废标项和评分点 | `skills/aios-commercial-tender/prompts/basic-prompt.md` |
30
+ | 合同条款与履约节点基础提示词 | 0.1 | 工程分包、采购、租赁和补充协议履约资料整理 | 合同条款、协议片段、合同摘要 | 资料来源清单、空白字段核对表、履约节点、付款结算条件、风险提示 | 法律意见、违约定性、索赔或结算金额结论 | 是否提取可执行节点,是否保留法务和商务复核边界 | `skills/aios-commercial-contract/prompts/basic-prompt.md` |
31
+ | 项目日报问题跟踪基础提示词 | 0.1 | 施工日报、项目日报、周报素材和项目群日报整理 | 日报、周报、现场记录 | 资料来源清单、管理摘要、问题台账、模板质量诊断、需确认事项 | 工期偏差终局判断、质量安全验收结论、签证或索赔成立判断 | 是否区分现场事实和模板空白,是否避免把未提及写成不合格 | `skills/aios-construction-daily/prompts/basic-prompt.md` |
32
+ | 会议纪要待办闭环基础提示词 | 0.1 | 工程会议、协调会、专题会、交底会记录整理 | 会议纪要、会议记录、录音转写摘要 | 资料来源清单、会议结论、待办闭环、责任线索、遗留问题 | 正式责任归属、合同通知效力、审批通过结论 | 是否区分发言人与最终责任人,是否标注未明确期限和责任人 | `skills/aios-construction-meeting/prompts/basic-prompt.md` |
33
+ | 变更签证资料链基础提示词 | 0.1 | 工程变更、签证、联系单、会议纪要和合同条款链路整理 | 签证单、联系单、合同条款、现场记录、公开样表字段 | 资料来源清单、资料链完整度、字段结构、资料断点、复核分流 | 签证成立、索赔成立、责任归属、最终金额 | 是否区分过程线索和正式依据,是否避免金额和责任判断 | `skills/aios-commercial-variation/prompts/basic-prompt.md` |
34
+ | 施工方案辅助复核基础提示词 | 0.1 | 专项施工方案、技术方案、专家修改说明和 AI 方案试用反馈整理 | 施工方案片段、工程概况、安全措施、专家修改说明、计算书目录 | 资料来源清单、失准复盘、关键工序、危险源、交底要点、回查清单 | 方案合格结论、计算正确结论、专家论证通过结论 | 是否使用辅助复核口径,是否保留总工 / 专家 / 计算书复核边界 | `skills/aios-construction-scheme/prompts/basic-prompt.md` |
@@ -30,9 +30,12 @@
30
30
  | Daedalus | AI 研发工程师 | GPT / Codex | RAG、GraphRAG、MCP、Tool Calling、Agent Runtime | 不擅自扩大工具权限 |
31
31
  | Hephaestus | 受控执行官 | Codex | 代码修改、脚本执行、自动化测试、文档生成 | 不擅自加功能或重构 |
32
32
  | Euclid | 结构力学专家 | GPT / 数值计算模型 | 梁系、桁架、FEM、刚度矩阵、荷载分析 | 不在未验证公式时输出工程结论 |
33
- | Athena | 知识治理官 | GPT | 标准治理、版本管理、知识图谱治理、条文差异 | 不直接改运行系统 |
34
- | Mercury | AI 情报官 | DeepSeek / 搜索增强模型 | AI 情报、GitHub 趋势、MCP 生态、开源分析 | 不把未验证资讯当事实 |
35
- | Janus | 产品策略官 | GPT / Gemini | MVP、SaaS、用户分层、商业化路径 | 不替代工程验收 |
33
+ | Athena | 知识治理官 | GPT | 标准治理、版本管理、知识图谱治理、条文差异 | 不直接改运行系统 |
34
+ | Mercury | AI 情报官 | DeepSeek / 搜索增强模型 | AI 情报、GitHub 趋势、MCP 生态、开源分析 | 不把未验证资讯当事实 |
35
+ | Janus | 产品策略官 | GPT / Gemini | MVP、SaaS、用户分层、商业化路径 | 不替代工程验收 |
36
+ | Themis | 法务与合规官 | Claude / GPT | 合同条款、责任边界、授权流程、数据合规、法律风险提示 | 不出具法律意见或责任结论 |
37
+ | Plutus | 商务造价与财务内控官 | GPT / Gemini | 工程款、结算、签证、成本、回款、预算和财务内控线索 | 不输出最终金额、审计或税务结论 |
38
+ | Hestia | 组织行政与人事协同官 | GPT / Gemini | 行政、人事、证照、培训、会议待办和组织协同 | 不做人事任免、薪酬、劳动争议或审批结论 |
36
39
 
37
40
  ---
38
41
 
@@ -43,12 +46,17 @@
43
46
  - 工程拆解和交付组织先走 Mason。
44
47
  - 代码质量、安全和风险审查先走 Argus。
45
48
  - 建筑行业知识问题先走 Vitruvius。
46
- - RAG、MCP、Agent Runtime 问题先走 Daedalus。
47
- - 具体代码执行和脚本执行先走 Hephaestus。
49
+ - RAG、MCP、Agent Runtime 问题先走 Daedalus。
50
+ - 普通两份文档、两个版本或两个 AI 输出专业度对比先走 Daedalus,并使用 `aios-compare`。
51
+ - Prompt 效果评估、weak/basic 对照和真实 Skill 输出比较仅在开发者明确调用 `aios-prompt-compare` 时先走 Daedalus。
52
+ - 具体代码执行和脚本执行先走 Hephaestus。
48
53
  - AI 行业情报和开源趋势先走 Mercury。
49
- - 产品范围、MVP 和商业化路径先走 Janus。
50
- - AIOS 是建筑行业增强层;普通非建筑任务不强行套用 BIM、IFC、规范、审图或工程证据链假设,优先使用宿主工具的通用能力。
51
- - 是否启用行业增强,先看项目 profile、`.ai/project-context.md`、README 和当前任务事实。
54
+ - 产品范围、MVP 和商业化路径先走 Janus。
55
+ - 工程合同、法律边界、授权签章、数据外发和合规问题先走 Themis。
56
+ - 工程款、结算、签证金额、成本、回款和财务内控线索先走 Plutus。
57
+ - 行政、人事、证照、继续教育、实名制和组织协同待办先走 Hestia。
58
+ - AIOS 是建筑行业增强层;普通非建筑任务不强行套用 BIM、IFC、规范、审图或工程证据链假设,优先使用宿主工具的通用能力。
59
+ - 是否启用行业增强,先看 `.ai/profile-detection.md`、项目 profile、`.ai/project-context.md`、README 和当前任务事实。
52
60
 
53
61
  ---
54
62
 
@@ -65,7 +73,7 @@ Agent 之间的冲突不按“谁的模型更强”裁决,而按 `governance/a
65
73
  5. 专项 Agent 判断。
66
74
  6. LLM 自然语言推理。
67
75
 
68
- Runtime 可通过 `runtime/capability-registry.json` 声明 Capability。Agent 提出阻断或放行结论时,应输出 `Claim / Evidence / Tool Result / Decision`;没有工具实现或证据缺失时,只能标注 `Need verify`。
76
+ Runtime 可通过 `runtime/capability-registry.json` 声明 Capability。Agent 提出阻断或放行结论时,面向用户应输出中文化的 `判断事项 / 证据 / 工具结果 / 处理建议`;没有工具实现或证据缺失时,只能标注 `需核验`。
69
77
 
70
78
  ---
71
79
 
@@ -116,3 +124,25 @@ Runtime 可通过 `runtime/capability-registry.json` 声明 Capability。Agent
116
124
  - 涉及荷载、边界条件、截面参数或 FEM。
117
125
  - 涉及结构计算工具链输入输出。
118
126
  - 涉及结构计算结果解释,但缺少确定性求解器证据。
127
+
128
+ 需要升级到 Themis:
129
+
130
+ - 涉及合同法律条款、违约、索赔、责任归属或争议处理。
131
+ - 涉及授权、签章、通知、审批或数据合规边界。
132
+ - 涉及客户资料外发、脱敏、AI 工具上传和留存边界。
133
+
134
+ 需要升级到 Plutus:
135
+
136
+ - 涉及工程款、结算、签证、工程量、回款、成本和财务内控。
137
+ - 涉及金额或税务口径,但缺少正式凭证、签认或财务复核。
138
+
139
+ 需要升级到 Hestia:
140
+
141
+ - 涉及行政、人事、证照、继续教育、实名制或组织协同事项。
142
+ - 涉及个人信息、证件、工资或劳动关系边界。
143
+
144
+ 需要升级到 Daedalus:
145
+
146
+ - 涉及普通文档 / AI 输出专业度对比,且用户明确调用 `aios-compare`。
147
+ - 涉及提示词回归、Prompt / Skill 输出对比、weak/basic/runtime 三栏评测,且开发者明确调用 `aios-prompt-compare`。
148
+ - 涉及判断普通提示词是否应沉淀为正式 Skill。
@@ -1,8 +1,8 @@
1
1
  {
2
2
  "schema": 1,
3
3
  "name": "archsight-aios",
4
- "version": "1.2.0",
5
- "description": "ArchSight AIOS agent, skill, workflow, runtime, and project-template registry for building-industry knowledge workers and AI engineering teams.",
4
+ "version": "1.3.1",
5
+ "description": "ArchSight AIOS Agent、Skill、Workflow、Runtime 和项目模板注册表,面向建筑行业知识工作者与 AI 工程团队。",
6
6
  "agents": [
7
7
  {
8
8
  "id": "atlas",
@@ -67,18 +67,53 @@
67
67
  "sourcePath": "agents/mercury",
68
68
  "runtimePromptPath": "agents/mercury/system-prompt.md"
69
69
  },
70
- {
71
- "id": "janus",
72
- "displayName": "Janus",
73
- "role": "产品策略官",
74
- "sourcePath": "agents/janus",
75
- "runtimePromptPath": "agents/janus/system-prompt.md"
76
- }
77
- ],
78
- "skills": [
79
- {
80
- "id": "aios-ceo",
81
- "primaryAgent": "janus",
70
+ {
71
+ "id": "janus",
72
+ "displayName": "Janus",
73
+ "role": "产品策略官",
74
+ "sourcePath": "agents/janus",
75
+ "runtimePromptPath": "agents/janus/system-prompt.md"
76
+ },
77
+ {
78
+ "id": "themis",
79
+ "displayName": "Themis",
80
+ "role": "法务与合规官",
81
+ "sourcePath": "agents/themis",
82
+ "runtimePromptPath": "agents/themis/system-prompt.md"
83
+ },
84
+ {
85
+ "id": "plutus",
86
+ "displayName": "Plutus",
87
+ "role": "商务造价与财务内控官",
88
+ "sourcePath": "agents/plutus",
89
+ "runtimePromptPath": "agents/plutus/system-prompt.md"
90
+ },
91
+ {
92
+ "id": "hestia",
93
+ "displayName": "Hestia",
94
+ "role": "组织行政与人事协同官",
95
+ "sourcePath": "agents/hestia",
96
+ "runtimePromptPath": "agents/hestia/system-prompt.md"
97
+ }
98
+ ],
99
+ "skills": [
100
+ {
101
+ "id": "aios",
102
+ "primaryAgent": "daedalus",
103
+ "defaultWorkflow": "review",
104
+ "path": "skills/aios/SKILL.md",
105
+ "openaiConfigPath": "skills/aios/agents/openai.yaml"
106
+ },
107
+ {
108
+ "id": "archsight-aios",
109
+ "primaryAgent": "daedalus",
110
+ "defaultWorkflow": "review",
111
+ "path": "skills/archsight-aios/SKILL.md",
112
+ "openaiConfigPath": "skills/archsight-aios/agents/openai.yaml"
113
+ },
114
+ {
115
+ "id": "aios-ceo",
116
+ "primaryAgent": "janus",
82
117
  "defaultWorkflow": "review",
83
118
  "path": "skills/aios-ceo/SKILL.md",
84
119
  "openaiConfigPath": "skills/aios-ceo/agents/openai.yaml"
@@ -130,8 +165,22 @@
130
165
  "primaryAgent": "daedalus",
131
166
  "defaultWorkflow": "rag-pipeline",
132
167
  "path": "skills/aios-runtime/SKILL.md",
133
- "openaiConfigPath": "skills/aios-runtime/agents/openai.yaml"
134
- },
168
+ "openaiConfigPath": "skills/aios-runtime/agents/openai.yaml"
169
+ },
170
+ {
171
+ "id": "aios-prompt-compare",
172
+ "primaryAgent": "daedalus",
173
+ "defaultWorkflow": "quality-readiness",
174
+ "path": "skills/aios-prompt-compare/SKILL.md",
175
+ "openaiConfigPath": "skills/aios-prompt-compare/agents/openai.yaml"
176
+ },
177
+ {
178
+ "id": "aios-compare",
179
+ "primaryAgent": "daedalus",
180
+ "defaultWorkflow": "review",
181
+ "path": "skills/aios-compare/SKILL.md",
182
+ "openaiConfigPath": "skills/aios-compare/agents/openai.yaml"
183
+ },
135
184
  {
136
185
  "id": "aios-exec",
137
186
  "primaryAgent": "hephaestus",
@@ -148,7 +197,7 @@
148
197
  },
149
198
  {
150
199
  "id": "aios-commercial-contract",
151
- "primaryAgent": "argus",
200
+ "primaryAgent": "themis",
152
201
  "defaultWorkflow": "review",
153
202
  "path": "skills/aios-commercial-contract/SKILL.md",
154
203
  "openaiConfigPath": "skills/aios-commercial-contract/agents/openai.yaml"
@@ -169,7 +218,7 @@
169
218
  },
170
219
  {
171
220
  "id": "aios-commercial-variation",
172
- "primaryAgent": "argus",
221
+ "primaryAgent": "plutus",
173
222
  "defaultWorkflow": "site-daily-loop",
174
223
  "path": "skills/aios-commercial-variation/SKILL.md",
175
224
  "openaiConfigPath": "skills/aios-commercial-variation/agents/openai.yaml"
@@ -228,9 +277,21 @@
228
277
  "path": "workflows/site-daily-loop.md"
229
278
  }
230
279
  ],
231
- "routes": [
232
- {
233
- "taskType": "建筑行业软件 / 系统深度评价、项目立项、产品定位、商业目标、范围取舍",
280
+ "routes": [
281
+ {
282
+ "taskType": "AIOS 总入口、资料类型识别和 Skill 自动路由",
283
+ "skill": "aios",
284
+ "agent": "daedalus",
285
+ "workflow": "review"
286
+ },
287
+ {
288
+ "taskType": "ArchSight AIOS 总入口别名和自然语言调用",
289
+ "skill": "archsight-aios",
290
+ "agent": "daedalus",
291
+ "workflow": "review"
292
+ },
293
+ {
294
+ "taskType": "建筑行业软件 / 系统深度评价、项目立项、产品定位、商业目标、范围取舍",
234
295
  "skill": "aios-ceo",
235
296
  "agent": "janus",
236
297
  "workflow": "review"
@@ -283,12 +344,24 @@
283
344
  "agent": "daedalus",
284
345
  "workflow": "architecture-review"
285
346
  },
286
- {
287
- "taskType": "建筑行业知识库 / 工程知识 RAG / GraphRAG Pipeline",
288
- "skill": "aios-runtime",
289
- "agent": "daedalus",
290
- "workflow": "rag-pipeline"
291
- },
347
+ {
348
+ "taskType": "建筑行业知识库 / 工程知识 RAG / GraphRAG Pipeline",
349
+ "skill": "aios-runtime",
350
+ "agent": "daedalus",
351
+ "workflow": "rag-pipeline"
352
+ },
353
+ {
354
+ "taskType": "开发者明确调用的 weak/basic/runtime 内部 Prompt 评测",
355
+ "skill": "aios-prompt-compare",
356
+ "agent": "daedalus",
357
+ "workflow": "quality-readiness"
358
+ },
359
+ {
360
+ "taskType": "两份文档、两个版本或两个 AI 输出的专业度对比",
361
+ "skill": "aios-compare",
362
+ "agent": "daedalus",
363
+ "workflow": "review"
364
+ },
292
365
  {
293
366
  "taskType": "建筑行业项目中的受控代码修改、文档、脚本、测试",
294
367
  "skill": "aios-exec",
@@ -304,7 +377,7 @@
304
377
  {
305
378
  "taskType": "工程合同履约节点、付款条件、责任边界和资料缺口",
306
379
  "skill": "aios-commercial-contract",
307
- "agent": "argus",
380
+ "agent": "themis",
308
381
  "workflow": "review"
309
382
  },
310
383
  {
@@ -322,7 +395,7 @@
322
395
  {
323
396
  "taskType": "工程变更签证资料链、联系单、图纸变更和索赔线索",
324
397
  "skill": "aios-commercial-variation",
325
- "agent": "argus",
398
+ "agent": "plutus",
326
399
  "workflow": "site-daily-loop"
327
400
  },
328
401
  {
@@ -335,22 +408,24 @@
335
408
  "projectTemplate": {
336
409
  "path": "templates/project-ai",
337
410
  "requiredFiles": [
338
- "AGENTS.md",
339
- "AI_CODING_RULES.md",
340
- "CLAUDE.md",
341
- "GEMINI.md",
342
- ".ai/ARCHSIGHT_AIOS_RULES.md",
343
- ".ai/project-context.md",
344
- ".ai/agent-routing.md",
345
- ".ai/skills.md",
346
- ".ai/workflows.md"
347
- ]
348
- },
411
+ "AGENTS.md",
412
+ "AI_CODING_RULES.md",
413
+ "CLAUDE.md",
414
+ "GEMINI.md",
415
+ "OPENCODE.md",
416
+ ".ai/ARCHSIGHT_AIOS_RULES.md",
417
+ ".ai/project-context.md",
418
+ ".ai/agent-routing.md",
419
+ ".ai/skills.md",
420
+ ".ai/workflows.md",
421
+ ".ai/profile-detection.md"
422
+ ]
423
+ },
349
424
  "projectProfiles": [
350
425
  {
351
426
  "id": "bim-platform",
352
427
  "path": "templates/project-bim-platform",
353
- "description": "BIM / IFC / Revit / CAD / modeling platform project profile.",
428
+ "description": "BIM / IFC / Revit / CAD / 建模平台项目画像。",
354
429
  "requiredFiles": [
355
430
  ".ai/profiles/bim-platform.md"
356
431
  ]
@@ -358,7 +433,7 @@
358
433
  {
359
434
  "id": "construction-vision",
360
435
  "path": "templates/project-construction-vision",
361
- "description": "Construction vision AI, detection, segmentation, and depth-estimation project profile.",
436
+ "description": "施工视觉 AI、目标检测、图像分割和深度估计项目画像。",
362
437
  "requiredFiles": [
363
438
  ".ai/profiles/construction-vision.md"
364
439
  ]
@@ -366,7 +441,7 @@
366
441
  {
367
442
  "id": "rag-knowledge",
368
443
  "path": "templates/project-rag-knowledge",
369
- "description": "Building-code knowledge base, RAG, GraphRAG, and knowledge-graph project profile.",
444
+ "description": "建筑规范知识库、RAGGraphRAG 和知识图谱项目画像。",
370
445
  "requiredFiles": [
371
446
  ".ai/profiles/rag-knowledge.md"
372
447
  ]
@@ -376,8 +451,10 @@
376
451
  "codexSkills": "~/.codex/skills",
377
452
  "codexWorkflows": "~/.codex/workflows/aios",
378
453
  "workBuddySkills": "~/.workbuddy/skills",
454
+ "openCodeSkills": "~/.opencode/skills",
455
+ "claudeCodeSkills": "~/.claude/skills",
379
456
  "sharedAgentSkills": "~/.agents/skills",
380
- "sharedAgentWorkflows": "~/.agents/workflows/aios",
457
+ "sharedAgentWorkflows": "~/.agents/workflows/aios",
381
458
  "geminiInstructions": "~/.gemini/GEMINI.md",
382
459
  "antigravityPlugin": "~/.gemini/config/plugins/archsight-aios",
383
460
  "antigravityLegacySkills": "~/.gemini/antigravity/skills",
@@ -394,6 +471,7 @@
394
471
  "adapterPath": "runtime/capability-adapters.json"
395
472
  },
396
473
  "requiredAssets": [
474
+ "OPENCODE.md",
397
475
  "governance/arbitration-protocol.md",
398
476
  "governance/ai-review-policy.md",
399
477
  "governance/security-policy.md",
@@ -415,13 +493,38 @@
415
493
  "graph/schema.md",
416
494
  "graph/quality-policy.md",
417
495
  "vision/roadmap.md",
418
- "vision/strategy-principles.md",
419
- "prompts/prompt-registry.md",
420
- "prompts/evaluation-policy.md",
421
- "prompts/failure-cases.md",
422
- "infra/environment-policy.md",
423
- "infra/permissions.md",
424
- "infra/service-boundaries.md",
496
+ "vision/strategy-principles.md",
497
+ "prompts/prompt-registry.md",
498
+ "prompts/evaluation-policy.md",
499
+ "prompts/failure-cases.md",
500
+ "prompts/evaluations/engineering-business-basic-advisory-validation-2026-06-16.md",
501
+ "prompts/evaluations/engineering-business-basic-fixtures.json",
502
+ "prompts/evaluations/engineering-business-basic-model-output.example.json",
503
+ "prompts/evaluations/engineering-business-basic-prompts-2026-06-16.md",
504
+ "prompts/evaluations/engineering-business-basic-scorecard.json",
505
+ "prompts/evaluations/engineering-business-public-advisory-fixtures.json",
506
+ "prompts/evaluations/public-advisory-md/01-technical-bid.md",
507
+ "prompts/evaluations/public-advisory-md/02-contract.md",
508
+ "prompts/evaluations/public-advisory-md/03-daily.md",
509
+ "prompts/evaluations/public-advisory-md/04-meeting.md",
510
+ "prompts/evaluations/public-advisory-md/05-variation.md",
511
+ "prompts/evaluations/public-advisory-md/06-scheme.md",
512
+ "infra/environment-policy.md",
513
+ "infra/permissions.md",
514
+ "infra/service-boundaries.md",
515
+ "skills/engineering-business-starter-kit.md",
516
+ "skills/aios-commercial-tender/prompts/basic-prompt.md",
517
+ "skills/aios-commercial-contract/prompts/basic-prompt.md",
518
+ "skills/aios-construction-daily/prompts/basic-prompt.md",
519
+ "skills/aios-construction-meeting/prompts/basic-prompt.md",
520
+ "skills/aios-commercial-variation/prompts/basic-prompt.md",
521
+ "skills/aios-construction-scheme/prompts/basic-prompt.md",
522
+ "scripts/analyze-prompt-run-results.mjs",
523
+ "scripts/build-prompt-run-pack.mjs",
524
+ "scripts/validate-prompt-fixtures.mjs",
525
+ "scripts/validate-prompt-model-outputs.mjs",
526
+ "scripts/validate-prompt-run-results.mjs",
527
+ "scripts/validate-prompt-scorecard.mjs",
425
528
  "runtime/hermes/sync-policy.md",
426
529
  "runtime/hermes/sync-record-template.md",
427
530
  "runtime/capability-adapters.json",
@@ -35,6 +35,9 @@ Hermes Agent 是部署实例,不是角色资产源;未使用 Hermes 的项
35
35
  | Athena | `agents/athena/` | `agents/athena/system-prompt.md` |
36
36
  | Mercury | `agents/mercury/` | `agents/mercury/system-prompt.md` |
37
37
  | Janus | `agents/janus/` | `agents/janus/system-prompt.md` |
38
+ | Themis | `agents/themis/` | `agents/themis/system-prompt.md` |
39
+ | Plutus | `agents/plutus/` | `agents/plutus/system-prompt.md` |
40
+ | Hestia | `agents/hestia/` | `agents/hestia/system-prompt.md` |
38
41
 
39
42
  ## 创建规则
40
43
 
@@ -29,7 +29,10 @@ Workspace Binding 定义启用 Hermes / 飞书 Adapter 时,任务如何绑定
29
29
  ```text
30
30
  templates/project-ai/
31
31
  ├── AGENTS.md
32
+ ├── CLAUDE.md
32
33
  ├── GEMINI.md
34
+ ├── OPENCODE.md
35
+ ├── AI_CODING_RULES.md
33
36
  └── .ai/
34
37
  ├── project-context.md
35
38
  ├── agent-routing.md
@@ -15,9 +15,11 @@
15
15
 
16
16
  ## 默认路由表
17
17
 
18
- | 任务类型 | 推荐 Skill | 主 Agent | 推荐 Workflow |
19
- | --- | --- | --- | --- |
20
- | 建筑行业软件 / 系统深度评价、项目立项、产品定位、商业目标、范围取舍 | `aios-ceo` | Janus | `review` |
18
+ | 任务类型 | 推荐 Skill | 主 Agent | 推荐 Workflow |
19
+ | --- | --- | --- | --- |
20
+ | AIOS 总入口、资料类型识别和 Skill 自动路由 | `aios` | Daedalus | `review` |
21
+ | ArchSight AIOS 总入口别名和自然语言调用 | `archsight-aios` | Daedalus | `review` |
22
+ | 建筑行业软件 / 系统深度评价、项目立项、产品定位、商业目标、范围取舍 | `aios-ceo` | Janus | `review` |
21
23
  | 建筑行业平台界面方案、工作台体验、复核追溯和前端实现交接 | `aios-design` | Janus | `design-review` |
22
24
  | 建筑行业项目中的架构评审、技术选型、服务边界 | `aios-arch` | Atlas | `architecture-review` |
23
25
  | 建筑行业项目中的 Feature 拆解、交付计划、任务依赖 | `aios-plan` | Mason | `feature-development` |
@@ -27,26 +29,33 @@
27
29
  | 结构力学 / 荷载 / FEM / 确定性求解链路 | `aios-structural` | Euclid | `architecture-review` |
28
30
  | 建筑行业项目中的 Prompt / Context / Memory / MCP / Tool | `aios-runtime` | Daedalus | `architecture-review` |
29
31
  | 建筑行业知识库 / 工程知识 RAG / GraphRAG Pipeline | `aios-runtime` | Daedalus | `rag-pipeline` |
32
+ | 开发者明确调用 `aios-prompt-compare` 时,做 weak/basic/runtime 内部评测 | `aios-prompt-compare` | Daedalus | `quality-readiness` |
33
+ | 用户明确调用 `aios-compare` 时,比较两份文档、两个版本或两个 AI 输出哪份更专业 | `aios-compare` | Daedalus | `review` |
30
34
  | 建筑行业项目中的受控代码修改、文档、脚本、测试 | `aios-exec` | Hephaestus | `feature-development` |
31
35
  | 工程招投标响应、评分点、废标风险和技术标资料矩阵 | `aios-commercial-tender` | Mason | `review` |
32
- | 工程合同履约节点、付款条件、责任边界和资料缺口 | `aios-commercial-contract` | Argus | `review` |
36
+ | 工程合同履约节点、付款条件、责任边界和资料缺口 | `aios-commercial-contract` | Themis | `review` |
33
37
  | 施工日报、现场异常、项目群记录和问题追踪台账 | `aios-construction-daily` | Mason | `site-daily-loop` |
34
38
  | 工程会议纪要、待办闭环、遗留争议和下次追踪 | `aios-construction-meeting` | Mason | `site-daily-loop` |
35
- | 工程变更签证资料链、联系单、图纸变更和索赔线索 | `aios-commercial-variation` | Argus | `site-daily-loop` |
39
+ | 工程变更签证资料链、联系单、图纸变更和索赔线索 | `aios-commercial-variation` | Plutus | `site-daily-loop` |
36
40
  | 专项施工方案、危险源、交底要点和规范 / 计算书复核清单 | `aios-construction-scheme` | Vitruvius | `review` |
37
41
 
38
42
  ## 路由原则
39
43
 
40
- - 优先按任务类型选择 Skill,而不是按 Agent 名称选择。
41
- - Skill 使用 `aios-*` 前缀,避免与通用技能包混淆。
44
+ - 优先按任务类型选择 Skill,而不是按 Agent 名称选择。
45
+ - 当用户只说“请用 AIOS 技能包分析该文档”或“请用 ArchSight AIOS 分析这份资料”时,先使用 `aios` / `archsight-aios` 总入口识别资料类型,再路由到具体 `aios-*` Skill。
46
+ - Skill 使用 `aios-*` 前缀,避免与通用技能包混淆。
42
47
  - 所有 `aios-*` Skill 都服务建筑行业平台研发;差异在任务分工,而不是行业归属。
43
48
  - AIOS 是建筑行业增强层,不是通用任务替代器;普通非建筑任务优先使用宿主工具的通用能力,不强行套用 BIM、IFC、规范、审图或工程证据链假设。
44
- - 是否启用行业增强,先看项目 profile、`.ai/project-context.md`、README 和当前任务;不确定时先核验上下文,不凭 Skill 名称硬套。
49
+ - 是否启用行业增强,先看 `.ai/profile-detection.md`、项目 profile、`.ai/project-context.md`、README 和当前任务;不确定时先核验上下文,不凭 Skill 名称硬套。
45
50
  - `aios-ceo` 用于一把手视角的建筑行业软件 / 系统深度评价,把产品定位、行业专业性、工程可信度、证据链、商业验证和范围取舍放到同一决策框架里;它可以引用架构和行业语义事实作为 CEO 判断依据,但不替代 `aios-arch` 或 `aios-knowledge` 的专项设计与专业结论。
46
51
  - `aios-design` 用于实现前判断界面方案是否支撑建筑行业审查、定位、复核、追溯和交付;不替代 `frontend-generation` 的 UI 实现、布局验证和交互验证,也不替代通用 `frontend-design` 的视觉风格和前端代码美化评审。
47
52
  - `aios-arch` 应补足通用架构评审缺失的建筑行业平台视角,包括 BIM / IFC、规范知识链路、审图证据链、RAG / GraphRAG、任务编排、审计和后端运行可靠性。
48
53
  - `aios-structural` 用于结构力学、荷载、边界条件、FEM 和求解器接口评审;它不能替代结构工程师签审,关键数值必须来自 Capability 或项目已有求解器证据。
49
- - `aios-commercial-tender`、`aios-commercial-contract`、`aios-construction-daily`、`aios-construction-meeting`、`aios-commercial-variation` 和 `aios-construction-scheme` 属于工程业务管理增强;它们只处理建筑工程资料的抽取、证据链整理、风险提示和人工复核分流,不扩展为 HR、行政、财务等通用职能 Skill。
54
+ - `aios-commercial-tender`、`aios-commercial-contract`、`aios-construction-daily`、`aios-construction-meeting`、`aios-commercial-variation` 和 `aios-construction-scheme` 属于工程业务管理增强;它们只处理建筑工程资料的抽取、证据链整理、风险提示和人工复核分流,不扩展为通用 HR、行政、财务 Skill。
55
+ - 工程业务 Agent 分工:技术标以 Mason 为主;合同法律边界以 Themis 为主;变更签证、工程款、结算和成本线索以 Plutus 为主;会议纪要中的行政、人事、证照和组织协同事项由 Hestia 辅助分流;施工方案以 Vitruvius 为主,涉及结构计算时升级给 Euclid,涉及现场组织和交付时由 Mason 协同。
56
+ - 工程业务管理基础场景可先参考 `skills/engineering-business-starter-kit.md` 和各 Skill 目录下的 `prompts/basic-prompt.md`,形成矩阵、清单、台账和复核问题;涉及金额、工期、责任、合规、质量安全、结构计算或法律意见时,再按对应 Skill 的证据链和人工复核规则升级。
57
+ - `aios-compare` 用于普通两份文档 / 两个版本 / 两个 AI 输出的专业度对比;不做 weak / portable / skill-runtime 提示词评测。
58
+ - `aios-prompt-compare` 是内部测试工具,只在开发者明确调用 `aios-prompt-compare` 时使用,用于评估 weak / portable / skill-runtime 三类输出差异;其中 `skill-runtime` 必须来自真实 Skill 触发结果,不把 `SKILL.md` 当普通 prompt 粘贴运行的结果冒充为 Skill 输出。
50
59
  - Agent 可以调用多个 Skill;Skill 也可以被多个 Agent 复用。
51
60
  - 项目工作目录中的事实优先于 AIOS 的通用模板。
52
61
  - Hermes / 飞书只是可选入口和调度适配器,不替代本地验证,也不是 AIOS 的必要前提。
@@ -62,13 +71,15 @@
62
71
  - 涉及 BIM、IFC、规范条文和审图语义:升级给 Vitruvius。
63
72
  - 涉及结构力学、荷载、边界条件、FEM 或结构计算工具链:升级给 Euclid,并优先使用 `aios-structural`。
64
73
  - 涉及 RAG、GraphRAG、MCP、Tool Calling、Memory:升级给 Daedalus。
74
+ - 涉及普通两份文档或两个 AI 输出差异对比:升级给 Daedalus,并使用 `aios-compare`。
75
+ - 涉及提示词效果、weak/basic 对照、Skill 运行结果对比或是否应沉淀为 Skill:只有用户明确调用 `aios-prompt-compare` 时升级给 Daedalus 并使用该 Skill。
65
76
  - 涉及具体代码、脚本、测试、文档执行:交给 Hephaestus。
66
- - 涉及工程现场日报、会议闭环或变更签证线索:升级给 Mason 编排 `site-daily-loop`,并按资料类型调用 `aios-construction-daily`、`aios-construction-meeting` 或 `aios-commercial-variation`。
67
- - 涉及工程合同、招投标或专项施工方案:按风险类型分别交给 Argus、Mason 或 Vitruvius;涉及规范、计算或签审结论时必须保留人工复核或 Capability 证据。
77
+ - 涉及工程现场日报或会议闭环:升级给 Mason 编排 `site-daily-loop`,并按资料类型调用 `aios-construction-daily` 或 `aios-construction-meeting`;会议中出现证照、继续教育、实名制、工资或组织协同时由 Hestia 辅助分流。
78
+ - 涉及工程合同、招投标、变更签证或专项施工方案:按风险类型分别交给 Themis、Mason、Plutus、VitruviusEuclid;涉及法律、金额、工期、责任、规范、计算或签审结论时必须保留人工复核或 Capability 证据。
68
79
 
69
80
  ## 项目接入
70
81
 
71
- 业务项目接入时,应复制 `templates/project-ai/`,并在 `.ai/skills.md` 中按项目实际情况启用 Skills
82
+ 业务项目接入时,应运行 `archsight-aios init`。CLI 默认创建通用 `.ai/` 底座、自动生成 `.ai/profile-detection.md` 和预填 `.ai/project-context.md`,再由当前任务和识别结果路由到对应 Skill;不要求用户先手动勾选 Skill
72
83
 
73
84
  ## 维护规则
74
85