@archsight/aios 1.3.0 → 1.3.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (67) hide show
  1. package/.claude-plugin/plugin.json +1 -1
  2. package/CHANGELOG.md +24 -0
  3. package/README.md +2 -2
  4. package/RELEASE_NOTES.md +12 -0
  5. package/adapters/workbuddy/README.md +11 -1
  6. package/agents/atlas/responsibilities.md +1 -1
  7. package/agents/atlas/system-prompt.md +1 -1
  8. package/agents/hestia/system-prompt.md +1 -1
  9. package/agents/hestia/workflow.md +2 -2
  10. package/agents/plutus/system-prompt.md +2 -2
  11. package/agents/plutus/workflow.md +2 -2
  12. package/agents/themis/responsibilities.md +1 -1
  13. package/agents/themis/system-prompt.md +2 -2
  14. package/agents/themis/workflow.md +2 -2
  15. package/bin/archsight-aios.mjs +5 -3
  16. package/gemini-extension.json +1 -1
  17. package/governance/README.md +41 -11
  18. package/governance/agent-boundary.md +1 -2
  19. package/governance/ai-review-policy.md +1 -2
  20. package/governance/arbitration-protocol.md +33 -33
  21. package/governance/context-policy.md +2 -3
  22. package/governance/delivery-policy.md +1 -2
  23. package/governance/memory-policy.md +1 -2
  24. package/governance/security-policy.md +1 -2
  25. package/memory/decision-records.md +8 -9
  26. package/package.json +1 -1
  27. package/prompts/evaluations/engineering-business-basic-advisory-validation-2026-06-16.md +3 -3
  28. package/prompts/evaluations/engineering-business-basic-fixtures.json +12 -12
  29. package/prompts/evaluations/engineering-business-basic-model-output.example.json +6 -6
  30. package/prompts/evaluations/engineering-business-basic-prompts-2026-06-16.md +1 -1
  31. package/prompts/evaluations/engineering-business-public-advisory-fixtures.json +12 -12
  32. package/prompts/prompt-registry.md +6 -6
  33. package/runtime/agent-routing.md +5 -3
  34. package/runtime/archsight-aios.manifest.json +52 -13
  35. package/runtime/skill-routing.md +14 -8
  36. package/scripts/validate-skills.mjs +2 -1
  37. package/skills/README.md +10 -7
  38. package/skills/aios/SKILL.md +79 -0
  39. package/skills/aios/agents/openai.yaml +4 -0
  40. package/skills/aios-arch/SKILL.md +14 -14
  41. package/skills/aios-ceo/SKILL.md +13 -13
  42. package/skills/aios-commercial-contract/SKILL.md +14 -14
  43. package/skills/aios-commercial-contract/prompts/basic-prompt.md +1 -1
  44. package/skills/aios-commercial-tender/SKILL.md +14 -14
  45. package/skills/aios-commercial-tender/prompts/basic-prompt.md +1 -1
  46. package/skills/aios-commercial-variation/SKILL.md +15 -15
  47. package/skills/aios-commercial-variation/prompts/basic-prompt.md +1 -1
  48. package/skills/aios-compare/SKILL.md +92 -0
  49. package/skills/aios-compare/agents/openai.yaml +4 -0
  50. package/skills/aios-construction-daily/SKILL.md +14 -14
  51. package/skills/aios-construction-daily/prompts/basic-prompt.md +1 -1
  52. package/skills/aios-construction-meeting/SKILL.md +14 -14
  53. package/skills/aios-construction-meeting/prompts/basic-prompt.md +1 -1
  54. package/skills/aios-construction-scheme/SKILL.md +10 -10
  55. package/skills/aios-construction-scheme/prompts/basic-prompt.md +1 -1
  56. package/skills/aios-plan/SKILL.md +7 -7
  57. package/skills/aios-prompt-compare/SKILL.md +4 -2
  58. package/skills/aios-prompt-compare/agents/openai.yaml +2 -2
  59. package/skills/aios-review/SKILL.md +1 -1
  60. package/skills/aios-structural/SKILL.md +7 -7
  61. package/skills/archsight-aios/SKILL.md +40 -0
  62. package/skills/archsight-aios/agents/openai.yaml +4 -0
  63. package/skills/engineering-business-starter-kit.md +7 -4
  64. package/templates/project-ai/.ai/skills.md +13 -6
  65. package/workflows/README.md +1 -1
  66. package/workflows/architecture-review.md +10 -10
  67. package/workflows/site-daily-loop.md +25 -25
@@ -0,0 +1,79 @@
1
+ ---
2
+ name: aios
3
+ description: ArchSight AIOS 总路由入口。用户只说“请用 AIOS 技能包分析该文档”时,先识别资料类型,再路由到合同、招投标、日报、会议、变更签证、施工方案或其他对应 aios-* Skill。
4
+ ---
5
+
6
+ # AIOS Router
7
+
8
+ ## 目标
9
+
10
+ 本 Skill 是 ArchSight AIOS 的总入口,用于处理用户没有指定具体 `aios-*` Skill、只要求“用 AIOS / AIOS 技能包 / ArchSight AIOS 分析该文档”的情况。
11
+
12
+ 它不替代各专项 Skill。它的职责是:
13
+
14
+ 1. 判断资料类型和任务意图。
15
+ 2. 选择最合适的 `aios-*` Skill。
16
+ 3. 按对应 Skill 的规则输出,或在资料类型不清时先做资料状态判断。
17
+ 4. 保留证据链、资料缺口、人工复核和不能下结论的边界。
18
+
19
+ ## 触发场景
20
+
21
+ 当用户出现以下表达时,应优先使用本入口:
22
+
23
+ - 请用 AIOS 技能包分析该文档。
24
+ - 请用 AIOS 分析这份资料。
25
+ - 用 ArchSight AIOS 看一下这个文件。
26
+ - 这个工程资料用 AIOS 跑一下。
27
+ - 没有明确写出 `aios-commercial-contract`、`aios-construction-scheme` 等具体 Skill,但任务明显属于建筑工程资料整理、复核、台账或证据链场景。
28
+
29
+ ## 路由表
30
+
31
+ | 资料 / 任务线索 | 路由到 | 默认输出方向 |
32
+ |---|---|---|
33
+ | 招标文件、评分办法、技术标、商务标、资格条件、AI 技术标问题、废标风险 | `aios-commercial-tender` | 响应矩阵、评分点、资料清单、风险提示、人工复核事项 |
34
+ | 合同、协议、分包、采购、租赁、付款、结算、履约、违约、争议解决 | `aios-commercial-contract` | 合同基本事实、空白字段、履约节点、付款结算、责任边界、资料缺口 |
35
+ | 项目日报、施工日报、周报素材、现场记录、材料进场、机械、劳务、进度 | `aios-construction-daily` | 管理摘要、问题台账、异常事项、模板质量诊断、待追踪事项 |
36
+ | 会议纪要、例会、协调会、专题会、交底会、待办、责任人、截止时间 | `aios-construction-meeting` | 会议结论、待办闭环、责任线索、遗留问题、下次追踪 |
37
+ | 变更、签证、联系单、洽商、索赔、停工窝工、图纸变更、工程量变化 | `aios-commercial-variation` | 资料链、断点、流程依据、疑点、复核分流 |
38
+ | 专项施工方案、施工组织、危大工程、深基坑、高支模、脚手架、吊装、危险源、交底、专家论证、计算书 | `aios-construction-scheme` | 工程概况、关键工序、危险源、交底要点、规范 / 计算书 / 专家复核清单 |
39
+ | 结构计算、荷载、边界条件、挠度、稳定、FEM、结构求解器 | `aios-structural` | 结构力学输入检查、求解链路、转 Euclid 结构复核、人工签审边界 |
40
+ | BIM、IFC、Revit、CAD、建筑规范、审图规则、知识结构化 | `aios-knowledge` | 行业语义、规范知识、资料来源、知识结构化边界 |
41
+ | 用户明确调用 `aios-compare`,或明确要求用 AIOS 判断两份文档 / 两个版本 / 两个 AI 输出哪份更专业 | `aios-compare` | 对比范围、可比性判断、结构差异、内容差异、专业度评分、边界风险、合并建议 |
42
+ | 开发者明确调用 `aios-prompt-compare`,并要求 weak / portable / skill-runtime 或提示词沉淀评测 | `aios-prompt-compare` | 运行记录、原始输出对照、评分卡、失败模式、沉淀建议 |
43
+ | AI Runtime、RAG、GraphRAG、MCP、Tool Calling、Memory、多 Agent 编排 | `aios-runtime` | Runtime 边界、工具权限、知识管线、运行治理 |
44
+ | 建筑行业软件 / 系统深度评价、产品定位、商业验证、范围取舍 | `aios-ceo` | 一把手视角评价、阶段路线、风险和停损信号 |
45
+ | 建筑行业平台界面、工作台、BIM Viewer、审图复核、数据看板 | `aios-design` | 界面任务路径、证据定位、复核追溯、实现交接 |
46
+ | 架构、服务边界、技术选型、长期复杂度 | `aios-arch` | 架构边界、数据链路、治理风险 |
47
+ | 交付计划、任务拆解、依赖和验证顺序 | `aios-plan` | 任务、依赖、验收和交付顺序 |
48
+ | 代码 / 文档 / 脚本执行、修复、测试、构建 | `aios-exec` | 有边界执行和验证 |
49
+ | PR、diff、AI 生成代码、安全、测试缺口 | `aios-review` | 风险发现、缺失测试、发布准备度 |
50
+
51
+ ## 路由规则
52
+
53
+ 1. 先看用户是否明确指定了具体 `aios-*` Skill;如已指定,直接使用该 Skill。
54
+ 2. 未指定时,根据文件名、标题、正文高频词、表格字段和用户任务判断资料类型。
55
+ 3. 命中单一高置信场景时,按对应 Skill 的 `SKILL.md` 工作流执行。
56
+ 4. 同一资料包含多个场景时,先输出资料类型判断,再按主任务路由;必要时列出次级 Skill 作为后续复核建议。
57
+ 5. 类型不清时,不要泛泛总结;先输出“资料状态判断”和“需要用户补充的资料类型 / 目标”。
58
+ 6. 不因为用户说“AIOS”就强行套建筑行业规则;非建筑任务优先说明 AIOS 不适用,并建议使用宿主工具通用能力。
59
+
60
+ ## 输出要求
61
+
62
+ 默认输出应包括:
63
+
64
+ 1. 资料类型和路由判断。
65
+ 2. 资料来源清单或资料来源说明。
66
+ 3. 对应业务 Skill 的主输出表 / 清单 / 台账。
67
+ 4. 资料缺口和需补充确认事项。
68
+ 5. 人工复核岗位。
69
+ 6. 不能由 AI 直接下结论的事项。
70
+
71
+ 如果已路由到专项 Skill,应遵守该 Skill 的输出格式;本 Skill 不要求额外生成一份冗长的路由报告。
72
+
73
+ ## 约束
74
+
75
+ - 不输出最终法律意见、合规结论、安全结论、结构计算结论、结算金额或责任归属。
76
+ - 不把资料未提及内容补猜成事实。
77
+ - 不把“AIOS 总入口”当作通用万能助手;它只负责路由和行业增强边界。
78
+ - 涉及金额、工期、法律责任、质量安全、规范、结构计算、审批或签审时,必须保留 `需核验`、`转人工复核` 或对应专业复核岗位。
79
+ - 对结构力学、承载、稳定、变形和安全系数,不得由 LLM 口算;需要 `aios-structural`、项目计算书或确定性工具证据。
@@ -0,0 +1,4 @@
1
+ interface:
2
+ display_name: "AIOS Router"
3
+ short_description: "按资料类型自动路由到对应 ArchSight AIOS 技能"
4
+ default_prompt: "当用户只说使用 AIOS 或 AIOS 技能包分析文档时,先识别资料类型,再路由到合适的 aios-* 技能;不确定时先做资料状态判断,保留证据链、人工复核和不能下结论的边界。"
@@ -54,7 +54,7 @@ AIOS Arch 的目标是补足通用架构评审:在 AIOS 行业增强启用时
54
54
  9. 用 P0/P1/P2 或同等级别标注风险优先级;不要把所有问题写成平级 TODO。
55
55
  10. 做交付审查增强:输出事实刷新、历史结论 diff、领域风险 / 工程风险分类、任务化落点和第一步建议。
56
56
  11. 给出推荐方案,并说明被拒绝方案和原因。
57
- 12. 对多 Agent 冲突输出 `Claim / Evidence / Tool Result / Decision`,按 `governance/arbitration-protocol.md` 仲裁。
57
+ 12. 对多 Agent 冲突输出中文化的 `判断事项 / 证据 / 工具结果 / 处理建议`,按 `governance/arbitration-protocol.md` 仲裁。
58
58
  13. 给 Mason、Daedalus、Argus、Vitruvius、Euclid 或 Hephaestus 标注后续交接点;工程拆解细节交给 Mason,不在 Atlas 报告里替代交付计划。
59
59
 
60
60
  ## Step 0 范围挑战
@@ -92,7 +92,7 @@ AIOS Arch 的目标是补足通用架构评审:在 AIOS 行业增强启用时
92
92
  2. 已过期判断:列出历史报告、旧计划或用户假设中已经被当前代码事实替代的判断;没有发现也要写“未发现明显过期判断”。
93
93
  3. 与既有报告 diff:说明哪些结论继承、哪些修正、哪些新增;如果没有既有报告,写“无既有报告输入”。
94
94
  4. 风险分类:每个 P0/P1/P2 发现必须标注为 `领域风险`、`工程风险` 或 `混合风险`。
95
- 5. 可执行落点:每个 P0/P1/P2 发现必须写到文件 / 模块、最小改动范围和验证命令或测试路径;无法定位时标为 `Need verify`,不要编造路径。
95
+ 5. 可执行落点:每个 P0/P1/P2 发现必须写到文件 / 模块、最小改动范围和验证命令或测试路径;无法定位时标为 `需核验`,不要编造路径。
96
96
  6. 第一小步:最后给出“现在最该做的一件小事”,必须是低风险、可验证、能推进主风险收敛的动作。
97
97
 
98
98
  发现格式:
@@ -133,22 +133,22 @@ AIOS Arch 的目标是补足通用架构评审:在 AIOS 行业增强启用时
133
133
 
134
134
  - 范围挑战:当前范围是否被接受,哪些事项不在本轮范围内。
135
135
  - 已有能力:项目中应复用的模块、契约、测试、脚本或治理资产。
136
- - What Already Exists:已有能力是否被复用,是否存在重复建设。
136
+ - 已有能力:已有能力是否被复用,是否存在重复建设。
137
137
  - 本次事实刷新:本轮从代码、契约、测试或部署入口确认的新事实。
138
138
  - 已过期判断:历史报告或旧假设中被当前事实替代的内容。
139
139
  - 与既有报告 diff:继承、修正和新增的结论。
140
- - NOT in scope:明确不做的事项和理由。
140
+ - 不在本轮范围:明确不做的事项和理由。
141
141
  - 风险分级:P0/P1/P2 或等效优先级,说明影响和验证方式。
142
142
  - 风险分类:领域风险、工程风险或混合风险。
143
- - Failure Modes:关键路径的生产失败方式、当前覆盖和用户可见性。
144
- - Coverage Map:代码路径、用户路径、异常路径和 eval 覆盖情况。
145
- - Parallel Lanes:可并行 workstream、依赖、冲突点和合并顺序。
146
- - Implementation Tasks:由发现直接生成的任务清单,包含文件、验证和优先级。
147
- - Claim / Evidence / Tool Result / Decision:Agent 冲突、工具返回值和仲裁结论。
143
+ - 失败模式:关键路径的生产失败方式、当前覆盖和用户可见性。
144
+ - 覆盖范围图:代码路径、用户路径、异常路径和 eval 覆盖情况。
145
+ - 并行工作线:可并行 workstream、依赖、冲突点和合并顺序。
146
+ - 实施任务:由发现直接生成的任务清单,包含文件、验证和优先级。
147
+ - 判断事项 / 证据 / 工具结果 / 处理建议:Agent 冲突、工具返回值和仲裁结论。
148
148
  - 第一小步:当前最该做的一件小事。
149
- - `Rejected:` 被拒绝的备选方案及原因。
150
- - `Assumption:` 当前判断依赖的假设。
151
- - `Need verify:` 必须继续验证的点。
149
+ - `已拒绝方案:` 被拒绝的备选方案及原因。
150
+ - `假设:` 当前判断依赖的假设。
151
+ - `需核验:` 必须继续验证的点。
152
152
 
153
153
  ## 代码事实与补充检查规则
154
154
 
@@ -159,11 +159,11 @@ AIOS Arch 的目标是补足通用架构评审:在 AIOS 行业增强启用时
159
159
  - 架构依据以边界判断、风险优先级、长期演进和决策取舍为主。
160
160
  - 工程计划可以纳入范围挑战、已有能力盘点、Failure Modes、测试缺口、并行 workstream、冲突标记和回归命令。
161
161
  - 对不同评审的强弱判断必须回到代码事实、风险依据和验证路径;不要把未核验的排序包装成客观事实。
162
- - 严格区分 `Assumption``Need verify`;不要把“2 个假设 + 3 个待验证项”写成“3 个假设”。
162
+ - 严格区分 `假设``需核验`;不要把“2 个假设 + 3 个待验证项”写成“3 个假设”。
163
163
  - 如果已有评审已经触及多实例、缓存、单例或进程内状态风险,但没有展开完整策略,应表述为“已触及但未系统展开”,不要写成完全未覆盖。
164
164
  - 如果为了避免结论污染而做独立重评,仍要把历史 P0/P1 或用户点名的旧发现列为“回归防漏清单”;逐项确认“已修复 / 已吸收进更大问题 / 仍独立存在 / 无法判断”。
165
165
  - 不要把“字段存在”误判为“链路贯通”。凡是字段、关系或元数据跨越 UI、API、后台任务、领域模型、图谱/数据库、检索和报告展示,必须至少追踪一个完整路径。
166
- - 抽象发现不能吞掉具体断链。若某个断链被归入“元数据不足”“审计边界不足”等更大主题,输出中仍需保留独立的断点、影响、验收项或 `Need verify`。
166
+ - 抽象发现不能吞掉具体断链。若某个断链被归入“元数据不足”“审计边界不足”等更大主题,输出中仍需保留独立的断点、影响、验收项或 `需核验`。
167
167
  - 每个高优先级结论必须说明“是领域风险还是工程风险”:例如规范版本关系缺失属于领域风险或混合风险,后台任务进程内状态属于工程风险。
168
168
  - 报告最后必须给出可直接进入 `aios-plan` 的任务清单;每个任务来源必须能回溯到一个具体发现,不为凑数生成任务。
169
169
 
@@ -59,7 +59,7 @@ description: 一把手深度评审工作流。用于在 AIOS 建筑行业增强
59
59
  7. 部署事实:环境变量、数据库迁移、外部服务、密钥、权限、日志、监控、备份、回滚和生产启动校验。
60
60
  8. 商业事实:客户访谈、试点、付费意愿、节省时间、误判 / 漏判、复核成本、交付成本和采购路径。
61
61
 
62
- 判断必须按 `Claim / Evidence / Risk / Decision / Next action` 展开。没有证据的判断只能写成假设或待验证项。
62
+ 判断必须按 `判断事项 / 证据 / 风险 / 决策建议 / 下一步` 展开。没有证据的判断只能写成假设或待验证项。
63
63
 
64
64
  ## 工作流
65
65
 
@@ -77,10 +77,10 @@ description: 一把手深度评审工作流。用于在 AIOS 建筑行业增强
77
77
  6. 判断工程可信度:代码、数据链路、接口契约、测试、部署、安全、审计和运维是否支撑当前承诺。
78
78
  7. 判断商业目标:收入、成本、效率、风险降低或战略价值是否能对应到可观测指标。
79
79
  8. 判断范围野心:
80
- - Expand:方向对但格局太小,应提出更高价值版本。
81
- - Hold:范围合适,应提高验证和执行严谨度。
82
- - Reduce:范围过大,应收缩到最小可验证版本。
83
- - Stop:缺少真实需求或证据,应暂停立项。
80
+ - 扩大:方向对但格局太小,应提出更高价值版本。
81
+ - 保持:范围合适,应提高验证和执行严谨度。
82
+ - 收缩:范围过大,应收缩到最小可验证版本。
83
+ - 停止:缺少真实需求或证据,应暂停立项。
84
84
  9. 区分三类成熟度:工程进展、生产可信度、商业验证。三者不能互相替代。
85
85
  10. 给出阶段路线:验证阶段、MVP 阶段、产品化阶段、平台化阶段。
86
86
  11. 对技术、规范、结构计算或安全冲突引用仲裁证据,不替代专项 Agent 和 Capability 结论。
@@ -108,8 +108,8 @@ AIOS 行业增强启用后,评审建筑行业软件或系统时,至少从这
108
108
  ### Deep Review
109
109
 
110
110
  1. 结论
111
- - `Mode:` Deep Review / Brief + 立项判断 / 定位判断 / 商业判断 / 范围判断。
112
- - `Decision:` Expand / Hold / Reduce / Stop。
111
+ - `模式:` 深度评审 / 简要评审 + 立项判断 / 定位判断 / 商业判断 / 范围判断。
112
+ - `决策建议:` 扩大 / 保持 / 收缩 / 停止。
113
113
  - 一句话说明为什么。
114
114
  2. 证据摘要
115
115
  - 已读取 / 已验证的代码、文档、配置、测试、部署和业务证据。
@@ -144,12 +144,12 @@ AIOS 行业增强启用后,评审建筑行业软件或系统时,至少从这
144
144
 
145
145
  必要时补充:
146
146
 
147
- - `Mode:` Deep Review / Brief + 立项判断 / 定位判断 / 商业判断 / 范围判断。
148
- - `Decision:` Expand / Hold / Reduce / Stop。
149
- - `Assumption:` 当前判断依赖的假设。
150
- - `Need evidence:` 必须补充的客户、市场、数据或技术证据。
151
- - `Rejected:` 被拒绝的方向及原因。
152
- - `Not verified:` 不能据此声称完成或生产可用的部分。
147
+ - `模式:` 深度评审 / 简要评审 + 立项判断 / 定位判断 / 商业判断 / 范围判断。
148
+ - `决策建议:` 扩大 / 保持 / 收缩 / 停止。
149
+ - `假设:` 当前判断依赖的假设。
150
+ - `需补充证据:` 必须补充的客户、市场、数据或技术证据。
151
+ - `已拒绝方向:` 被拒绝的方向及原因。
152
+ - `未验证项:` 不能据此声称完成或生产可用的部分。
153
153
 
154
154
  ## 一把手检查项
155
155
 
@@ -48,19 +48,19 @@ description: 工程合同履约证据链工作流。用于从工程分包、采
48
48
 
49
49
  ## Capability 与证据
50
50
 
51
- - 所有抽取结论必须带 `Evidence`,至少包括来源文件、页码/章节/行号或原文短摘。
52
- - 涉及法律、地方制度、招采规则、工程规范或合同示范文本适用性时,优先调用或要求 `knowledge.norm_lookup`;没有工具结果时标注 `Need verify`。
53
- - 多 Agent 冲突、工具结果缺失或资料互相矛盾时,按 `governance/arbitration-protocol.md` 输出 `Claim / Evidence / Tool Result / Decision`。
51
+ - 所有抽取结论必须带 `证据`,至少包括来源文件、页码/章节/行号或原文短摘。
52
+ - 涉及法律、地方制度、招采规则、工程规范或合同示范文本适用性时,优先调用或要求 `knowledge.norm_lookup`;没有工具结果时标注 `需核验`。
53
+ - 多 Agent 冲突、工具结果缺失或资料互相矛盾时,按 `governance/arbitration-protocol.md` 输出中文化的 `判断事项 / 证据 / 工具结果 / 处理建议`。
54
54
 
55
55
  ## 工作流
56
56
 
57
- 1. 建立 Source Map:列出输入文件、版本、日期和可引用定位方式。
57
+ 1. 建立资料来源清单:列出输入文件、版本、日期和可引用定位方式。
58
58
  2. 识别合同事实:合同类型、双方主体、范围、金额、工期、质量目标、验收方式和争议解决条款。
59
59
  3. 抽取履约节点:把触发条件、期限、责任方、交付物和验收材料拆成表格。
60
60
  4. 抽取付款和结算条件:区分预付款、进度款、结算、质保金、发票、验收和资料前置条件。
61
61
  5. 建立责任边界:列出甲方、乙方、分包、供应商、监理、设计或总包的明确义务。
62
- 6. 标注风险和缺口:只标“建议复核 / Need verify”,不得把缺失资料推断成违约事实。
63
- 7. 对规范、制度或示范文本适用性发起 `knowledge.norm_lookup` 调用计划;没有 Tool Result 时保留为待核验。
62
+ 6. 标注风险和缺口:只标“建议复核 / 需核验”,不得把缺失资料推断成违约事实。
63
+ 7. 对规范、制度或示范文本适用性发起 `knowledge.norm_lookup` 调用计划;没有工具结果时保留为待核验。
64
64
  8. 输出人工复核分流:法务、商务、项目经理、技术负责人或业主代表。
65
65
 
66
66
  ## 输出格式
@@ -68,13 +68,13 @@ description: 工程合同履约证据链工作流。用于从工程分包、采
68
68
  默认输出:
69
69
 
70
70
  1. 结论
71
- 2. Source Map
71
+ 2. 资料来源清单
72
72
  3. 合同基本事实
73
73
  4. 履约节点表
74
74
  5. 付款与结算条件
75
75
  6. 责任边界与风险提示
76
76
  7. 待补充资料
77
- 8. Arbitration
77
+ 8. 证据仲裁
78
78
 
79
79
  履约节点条目格式:
80
80
 
@@ -84,17 +84,17 @@ description: 工程合同履约证据链工作流。用于从工程分包、采
84
84
  期限:
85
85
  责任方:
86
86
  交付物:
87
- Evidence:
87
+ 证据:
88
88
  需复核:
89
89
  ```
90
90
 
91
- Arbitration 条目格式:
91
+ 证据仲裁条目格式:
92
92
 
93
93
  ```text
94
- Claim:
95
- Evidence:
96
- Tool Result:
97
- Decision:Proceed / Need verify / Hold for human
94
+ 判断事项:
95
+ 证据:
96
+ 工具结果:
97
+ 处理建议:可继续 / 需核验 / 转人工复核
98
98
  人工复核岗位:
99
99
  ```
100
100
 
@@ -32,7 +32,7 @@
32
32
 
33
33
  请按以下格式输出:
34
34
 
35
- ### 资料来源 / Source Map
35
+ ### 资料来源清单
36
36
 
37
37
  | 序号 | 资料名称 / 片段 | 版本 / 日期 | 章节 / 页码 / 条款 | 当前用途 | 可信度 / 缺口 |
38
38
  |---:|---|---|---|---|---|
@@ -44,18 +44,18 @@ description: 工程招投标响应证据链工作流。用于从招标文件、
44
44
  1. 先判断输入类型:真实招标文件 / 评分办法、AI 生成技术标后的人工检查问题清单、工具咨询或混合资料。
45
45
  2. 若缺少真实招标原文,明确写出“缺少可验证招标依据”,只输出问题回应矩阵和响应矩阵模板,不输出真实读标结论。
46
46
  3. 输出 AI 技术标复核问题回应矩阵、评分点响应矩阵、资料缺口和人工复核事项。
47
- 4. 废标、资格条件和评分分值缺证据时标为 `Need verify`,不得补猜。
47
+ 4. 废标、资格条件和评分分值缺证据时标为 `需核验`,不得补猜。
48
48
 
49
49
  ## Capability 与证据
50
50
 
51
51
  - 每个废标风险、评分点和资格条件必须带原文定位。
52
- - 涉及法规、地方交易规则、规范标准或政策适用性时,调用或要求 `knowledge.norm_lookup`;没有 Tool Result 时标注 `Need verify`。
52
+ - 涉及法规、地方交易规则、规范标准或政策适用性时,调用或要求 `knowledge.norm_lookup`;没有工具结果时标注 `需核验`。
53
53
  - 评分预测只能基于明确评分办法和已提供资料;缺资料不得脑补。
54
- - 冲突、澄清版本不一致或关键证据缺失时输出 `Decision: Hold for human`。
54
+ - 冲突、澄清版本不一致或关键证据缺失时输出 `处理建议:转人工复核`。
55
55
 
56
56
  ## 工作流
57
57
 
58
- 1. 建立 Source Map:列出招标资料、答疑澄清、版本和定位方式。
58
+ 1. 建立资料来源清单:列出招标资料、答疑澄清、版本和定位方式。
59
59
  2. 抽取项目基本事实:招标范围、工期、质量目标、资质要求、投标截止、保证金和评标办法。
60
60
  3. 标出废标/否决项:原文条件、触发风险、所需证明材料和责任人。
61
61
  4. 抽取资格条件:资质、业绩、人员、证书、财务、信用、联合体和设备要求。
@@ -68,14 +68,14 @@ description: 工程招投标响应证据链工作流。用于从招标文件、
68
68
  默认输出:
69
69
 
70
70
  1. 结论
71
- 2. Source Map
71
+ 2. 资料来源清单
72
72
  3. 项目和资料概览
73
73
  4. 废标 / 否决风险清单
74
74
  5. 资格条件和证明材料清单
75
75
  6. 评分点响应矩阵
76
76
  7. 技术标目录建议
77
77
  8. 人工复核与澄清问题
78
- 9. Arbitration
78
+ 9. 证据仲裁
79
79
 
80
80
  响应矩阵条目格式:
81
81
 
@@ -85,17 +85,17 @@ description: 工程招投标响应证据链工作流。用于从招标文件、
85
85
  响应材料:
86
86
  已有证据:
87
87
  缺口:
88
- Evidence:
89
- Decision:
88
+ 证据:
89
+ 处理建议:
90
90
  ```
91
91
 
92
- Arbitration 条目格式:
92
+ 证据仲裁条目格式:
93
93
 
94
94
  ```text
95
- Claim:
96
- Evidence:
97
- Tool Result:
98
- Decision:Proceed / Need verify / Hold for human
95
+ 判断事项:
96
+ 证据:
97
+ 工具结果:
98
+ 处理建议:可继续 / 需核验 / 转人工复核
99
99
  ```
100
100
 
101
101
  ## 约束
@@ -104,4 +104,4 @@ Decision:Proceed / Need verify / Hold for human
104
104
  - 不把未提供的企业资质、业绩或证书当作已具备。
105
105
  - 不忽略答疑澄清版本;版本冲突必须标注。
106
106
  - 不替代投标负责人、法务、商务、造价或技术负责人审核。
107
- - 对废标项使用保守口径:缺证据时标 `Need verify`,不直接判定废标。
107
+ - 对废标项使用保守口径:缺证据时标 `需核验`,不直接判定废标。
@@ -33,7 +33,7 @@
33
33
 
34
34
  请按以下格式输出:
35
35
 
36
- ### 资料来源 / Source Map
36
+ ### 资料来源清单
37
37
 
38
38
  | 序号 | 资料名称 / 片段 | 版本 / 日期 | 章节 / 页码 / 条款 | 当前用途 | 可信度 / 缺口 |
39
39
  |---:|---|---|---|---|---|
@@ -47,14 +47,14 @@ description: 工程变更签证证据链审查工作流。用于整理联系单
47
47
 
48
48
  ## Capability 与证据
49
49
 
50
- - 每个事实链节点必须带 `Evidence`:来源文件、日期、编号、页码/章节/行号和签认状态。
51
- - 涉及合同示范文本、地方签证流程、规范或政策适用性时,调用或要求 `knowledge.norm_lookup`;没有 Tool Result 时标注 `Need verify`。
52
- - 涉及工程量、造价、工期索赔和责任归属时必须 `Hold for human`,交给造价、法务、项目经理或业主代表复核。
53
- - 资料链冲突按 `Claim / Evidence / Tool Result / Decision` 仲裁。
50
+ - 每个事实链节点必须带 `证据`:来源文件、日期、编号、页码/章节/行号和签认状态。
51
+ - 涉及合同示范文本、地方签证流程、规范或政策适用性时,调用或要求 `knowledge.norm_lookup`;没有工具结果时标注 `需核验`。
52
+ - 涉及工程量、造价、工期索赔和责任归属时必须 `转人工复核`,交给造价、法务、项目经理或业主代表复核。
53
+ - 资料链冲突按中文化的 `判断事项 / 证据 / 工具结果 / 处理建议` 仲裁。
54
54
 
55
55
  ## 工作流
56
56
 
57
- 1. 建立 Source Map:按时间顺序列出联系单、纪要、图纸、日志、照片、通知和合同条款。
57
+ 1. 建立资料来源清单:按时间顺序列出联系单、纪要、图纸、日志、照片、通知和合同条款。
58
58
  2. 定义变更事项:变更对象、发生原因、涉及范围、影响类型和当前状态。
59
59
  3. 建立事实链:事件发生、提出、确认、指令、实施、验收、计量和结算资料是否齐全。
60
60
  4. 建立合同/流程链:合同条款、通知时限、签认主体、审批路径和资料要求。
@@ -67,13 +67,13 @@ description: 工程变更签证证据链审查工作流。用于整理联系单
67
67
  默认输出:
68
68
 
69
69
  1. 结论
70
- 2. Source Map
70
+ 2. 资料来源清单
71
71
  3. 变更 / 签证事项摘要
72
72
  4. 资料链完整性清单
73
73
  5. 合同和流程依据对照
74
74
  6. 资料断点与合规风险
75
75
  7. 多岗位复核建议
76
- 8. Arbitration
76
+ 8. 证据仲裁
77
77
 
78
78
  资料链条目格式:
79
79
 
@@ -82,18 +82,18 @@ description: 工程变更签证证据链审查工作流。用于整理联系单
82
82
  资料:
83
83
  签发 / 签收:
84
84
  状态:
85
- Evidence:
85
+ 证据:
86
86
  缺口:
87
- Decision:
87
+ 处理建议:
88
88
  ```
89
89
 
90
- Arbitration 条目格式:
90
+ 证据仲裁条目格式:
91
91
 
92
92
  ```text
93
- Claim:
94
- Evidence:
95
- Tool Result:
96
- Decision:Proceed / Need verify / Hold for human
93
+ 判断事项:
94
+ 证据:
95
+ 工具结果:
96
+ 处理建议:可继续 / 需核验 / 转人工复核
97
97
  人工复核岗位:
98
98
  ```
99
99
 
@@ -103,4 +103,4 @@ Decision:Proceed / Need verify / Hold for human
103
103
  - 不把未签认资料写成已确认事实。
104
104
  - 不忽略合同通知时限、签收主体和版本冲突。
105
105
  - 不用单一会议纪要替代完整资料链。
106
- - 缺少原始证据时必须标注 `Need verify`,不得补猜。
106
+ - 缺少原始证据时必须标注 `需核验`,不得补猜。
@@ -35,7 +35,7 @@
35
35
 
36
36
  请按以下格式输出:
37
37
 
38
- ### 资料来源 / Source Map
38
+ ### 资料来源清单
39
39
 
40
40
  | 序号 | 资料名称 / 片段 | 编号 / 日期 | 签发 / 签收状态 | 当前用途 | 可信度 / 缺口 |
41
41
  |---:|---|---|---|---|---|
@@ -0,0 +1,92 @@
1
+ ---
2
+ name: aios-compare
3
+ description: 文档专业度对比技能。用于比较两份工程资料、两个 AI 输出、两个版本或两份交付稿哪份更专业、更可复核、更适合交付;不做 weak/basic/runtime 提示词评测。
4
+ ---
5
+
6
+ # AIOS Compare
7
+
8
+ ## 目标
9
+
10
+ 本 Skill 用于比较两份文档、两个版本或两个 AI 输出,帮助用户判断哪份更专业、更可复核、更适合交付,并看清差异、遗漏、风险边界和后续合并方向。
11
+
12
+ 它是“文档对比”工具,不是 `aios-prompt-compare`。如果用户要做 weak / portable / skill-runtime 三栏提示词评测,或判断提示词是否值得沉淀为 Skill,应改用 `aios-prompt-compare`。
13
+
14
+ ## 适用场景
15
+
16
+ - 比较两份 AI 输出,例如 WorkBuddy、Antigravity、Codex 对同一资料的输出。
17
+ - 比较两版文档,例如旧版 / 新版 README、方案、报告、提示词或培训材料。
18
+ - 比较同一业务资料的两个整理结果,例如合同节点表、日报问题台账、会议待办表、施工方案辅助复核清单。
19
+ - 比较客户版和内部版材料,检查外发边界、敏感信息、过度承诺和人工复核要求。
20
+ - 判断两份材料哪份更专业:看证据链、结构、行业术语、边界控制、可执行性和交付可读性,而不是只看篇幅长短。
21
+
22
+ ## 不适用场景
23
+
24
+ - 不做提示词评测三栏报告;需要 weak / portable / skill-runtime 时使用 `aios-prompt-compare`。
25
+ - 不比较不同输入材料生成的输出优劣,除非用户明确要比较“资料本身差异”。
26
+ - 不输出最终法律、安全、质量、合规、结构计算、结算金额或责任归属结论。
27
+
28
+ ## 输入
29
+
30
+ 优先收集:
31
+
32
+ - 文档 A:文件名、版本、日期、用途、正文。
33
+ - 文档 B:文件名、版本、日期、用途、正文。
34
+ - 比较目标:结构差异、事实差异、遗漏项、表达边界、可执行性、外发风险、合并建议。
35
+ - 适用场景:内部复核、客户交付、培训演示、模板沉淀或版本合并。
36
+
37
+ ## 工作流
38
+
39
+ 1. 建立 Compare Map:列出 A / B 的来源、版本、用途和是否同源。
40
+ 2. 判断是否可横向比较:同一输入、同一任务、同一目标时可比较优劣;不同输入时只比较资料差异。
41
+ 3. 对比结构:章节、表格、字段、输出粒度、是否便于复用。
42
+ 4. 对比事实和证据:是否引用来源、是否保留原文关键词、是否编造或漏掉关键事实。
43
+ 5. 对比边界:是否保留人工复核、资料缺口、不能下结论事项和敏感信息边界。
44
+ 6. 对比可执行性:是否能转成台账、清单、待办、矩阵或交底材料。
45
+ 7. 判断专业度:从证据链、结构完整度、行业表达、风险边界、可执行性、交付适配度给出分项判断。
46
+ 8. 输出合并建议:保留 A、保留 B、合并两者、补充资料或回到专项 Skill 重跑。
47
+
48
+ ## 输出格式
49
+
50
+ 默认输出:
51
+
52
+ 1. 结论摘要
53
+ 2. Compare Map
54
+ 3. 可比性判断
55
+ 4. 结构差异
56
+ 5. 内容差异
57
+ 6. 边界和风险差异
58
+ 7. 可执行性差异
59
+ 8. 专业度评分和判定
60
+ 9. 建议采用 / 合并方向
61
+ 10. 不能直接下结论的事项
62
+
63
+ 差异条目格式:
64
+
65
+ ```text
66
+ 维度:
67
+ 文档 A:
68
+ 文档 B:
69
+ 差异判断:
70
+ 影响:
71
+ 建议:
72
+ ```
73
+
74
+ 专业度评分建议维度:
75
+
76
+ ```text
77
+ 证据链:
78
+ 结构完整度:
79
+ 行业术语和表达:
80
+ 风险边界:
81
+ 可执行性:
82
+ 交付可读性:
83
+ 综合判断:
84
+ ```
85
+
86
+ ## 约束
87
+
88
+ - 不把更长当作更好;优先看证据链、结构、边界、可执行性、专业表达和用户任务匹配度。
89
+ - 不把一次 AI 输出胜负当作模型长期质量结论。
90
+ - 不把提示词评测任务误做成普通文档对比;需要三栏评测时转 `aios-prompt-compare`。
91
+ - 不在缺少同源输入时比较“谁更准”;只能说明输入不同或证据不足。
92
+ - 不替代业务专家、法务、造价、总工、监理、安全负责人或客户最终确认。
@@ -0,0 +1,4 @@
1
+ interface:
2
+ display_name: "AIOS Compare"
3
+ short_description: "比较两份文档或 AI 输出哪份更专业、更适合交付"
4
+ default_prompt: "使用 aios-compare 比较两份文档或两个 AI 输出时,先判断是否同源可比,再从证据链、结构、行业表达、遗漏、边界风险、可执行性和交付可读性判断哪份更专业;不要误用为 weak/basic/runtime 提示词评测。"
@@ -48,16 +48,16 @@ description: 现场施工日报证据链工作流。用于从施工日报、项
48
48
 
49
49
  ## Capability 与证据
50
50
 
51
- - 每条事实、异常和待办必须带 `Evidence`,至少包含日期、来源和可定位原文。
52
- - 涉及规范、强制性条文、质量安全制度或地方监管要求时,调用或要求 `knowledge.norm_lookup`;缺少工具结果时标注 `Need verify`。
53
- - 对资料不一致、缺少计划基线或缺少责任人的事项,输出 `Decision: Need verify`。
51
+ - 每条事实、异常和待办必须带 `证据`,至少包含日期、来源和可定位原文。
52
+ - 涉及规范、强制性条文、质量安全制度或地方监管要求时,调用或要求 `knowledge.norm_lookup`;缺少工具结果时标注 `需核验`。
53
+ - 对资料不一致、缺少计划基线或缺少责任人的事项,输出 `处理建议:需核验`。
54
54
 
55
55
  ## 工作流
56
56
 
57
57
  1. 建立日期和来源索引:按日期、来源、专业、区域和资料类型归类。
58
58
  2. 抽取已发生事实:进度完成、人员机械、材料进场、质量安全事件、设计/图纸问题和外部协调事项。
59
59
  3. 区分事实与推断:只把原文明确出现的内容列为事实,推断必须单独标注。
60
- 4. 对照计划基线:有计划输入时标出偏差;没有计划时不得判断“滞后 / 超前”,只能标 `Need baseline`。
60
+ 4. 对照计划基线:有计划输入时标出偏差;没有计划时不得判断“滞后 / 超前”,只能标 `需补充计划基线`。
61
61
  5. 生成问题台账:问题、影响、责任方、期限、证据、下一步。
62
62
  6. 识别签证或索赔线索:只提示“可能涉及”,交给 `aios-commercial-variation` 继续做资料链审查。
63
63
  7. 标注需人工确认事项:缺责任人、缺时间、缺图纸编号、缺签认或资料冲突。
@@ -67,12 +67,12 @@ description: 现场施工日报证据链工作流。用于从施工日报、项
67
67
  默认输出:
68
68
 
69
69
  1. 当日管理摘要
70
- 2. Source Map
70
+ 2. 资料来源清单
71
71
  3. 事实与进度记录
72
72
  4. 问题跟踪台账
73
73
  5. 潜在签证 / 变更线索
74
74
  6. 需补充确认事项
75
- 7. Arbitration
75
+ 7. 证据仲裁
76
76
 
77
77
  问题台账条目格式:
78
78
 
@@ -82,17 +82,17 @@ description: 现场施工日报证据链工作流。用于从施工日报、项
82
82
  影响:
83
83
  责任方:
84
84
  期限:
85
- Evidence:
86
- Decision:
85
+ 证据:
86
+ 处理建议:
87
87
  ```
88
88
 
89
- Arbitration 条目格式:
89
+ 证据仲裁条目格式:
90
90
 
91
91
  ```text
92
- Claim:
93
- Evidence:
94
- Tool Result:
95
- Decision:Proceed / Need verify / Hold for human
92
+ 判断事项:
93
+ 证据:
94
+ 工具结果:
95
+ 处理建议:可继续 / 需核验 / 转人工复核
96
96
  ```
97
97
 
98
98
  ## 约束
@@ -101,4 +101,4 @@ Decision:Proceed / Need verify / Hold for human
101
101
  - 不在缺少计划基线时判定工期偏差。
102
102
  - 不输出质量、安全、监理或业主验收结论。
103
103
  - 不输出签证成立、索赔成立或金额判断。
104
- - 不省略责任人、期限和证据缺口;缺失时必须标注 `Need verify`。
104
+ - 不省略责任人、期限和证据缺口;缺失时必须标注 `需核验`。
@@ -31,7 +31,7 @@
31
31
 
32
32
  请按以下格式输出:
33
33
 
34
- ### 资料来源 / Source Map
34
+ ### 资料来源清单
35
35
 
36
36
  | 序号 | 资料名称 / 片段 | 日期 | 来源人 / 文件 | 当前用途 | 可信度 / 缺口 |
37
37
  |---:|---|---|---|---|---|