@archsight/aios 1.2.0 → 1.3.1
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/.claude-plugin/plugin.json +1 -1
- package/CHANGELOG.md +59 -0
- package/OPENCODE.md +23 -0
- package/README.md +64 -31
- package/RELEASE_NOTES.md +37 -0
- package/adapters/workbuddy/README.md +11 -1
- package/agents/README.md +6 -3
- package/agents/atlas/responsibilities.md +1 -1
- package/agents/atlas/system-prompt.md +1 -1
- package/agents/daedalus/system-prompt.md +2 -0
- package/agents/hestia/constraints.md +7 -0
- package/agents/hestia/responsibilities.md +7 -0
- package/agents/hestia/role.md +12 -0
- package/agents/hestia/system-prompt.md +23 -0
- package/agents/hestia/workflow.md +8 -0
- package/agents/plutus/constraints.md +7 -0
- package/agents/plutus/responsibilities.md +7 -0
- package/agents/plutus/role.md +12 -0
- package/agents/plutus/system-prompt.md +24 -0
- package/agents/plutus/workflow.md +8 -0
- package/agents/themis/constraints.md +7 -0
- package/agents/themis/responsibilities.md +7 -0
- package/agents/themis/role.md +12 -0
- package/agents/themis/system-prompt.md +24 -0
- package/agents/themis/workflow.md +8 -0
- package/bin/archsight-aios.mjs +558 -25
- package/docs/PUBLIC_DISCOVERY.md +16 -2
- package/docs/business-expert-guide.md +5 -3
- package/docs/glossary.md +11 -3
- package/docs/quickstart.md +18 -4
- package/gemini-extension.json +1 -1
- package/governance/README.md +41 -11
- package/governance/agent-boundary.md +1 -2
- package/governance/ai-review-policy.md +1 -2
- package/governance/arbitration-protocol.md +33 -33
- package/governance/context-policy.md +2 -3
- package/governance/delivery-policy.md +1 -2
- package/governance/memory-policy.md +1 -2
- package/governance/security-policy.md +1 -2
- package/memory/decision-records.md +8 -9
- package/package.json +17 -6
- package/prompts/README.md +12 -0
- package/prompts/evaluation-policy.md +70 -0
- package/prompts/evaluations/engineering-business-basic-advisory-validation-2026-06-16.md +87 -0
- package/prompts/evaluations/engineering-business-basic-fixtures.json +375 -0
- package/prompts/evaluations/engineering-business-basic-model-output.example.json +179 -0
- package/prompts/evaluations/engineering-business-basic-prompts-2026-06-16.md +205 -0
- package/prompts/evaluations/engineering-business-basic-scorecard.json +238 -0
- package/prompts/evaluations/engineering-business-public-advisory-fixtures.json +422 -0
- package/prompts/evaluations/public-advisory-md/01-technical-bid.md +63 -0
- package/prompts/evaluations/public-advisory-md/02-contract.md +61 -0
- package/prompts/evaluations/public-advisory-md/03-daily.md +69 -0
- package/prompts/evaluations/public-advisory-md/04-meeting.md +48 -0
- package/prompts/evaluations/public-advisory-md/05-variation.md +63 -0
- package/prompts/evaluations/public-advisory-md/06-scheme.md +60 -0
- package/prompts/failure-cases.md +5 -1
- package/prompts/prompt-registry.md +10 -0
- package/runtime/agent-routing.md +39 -9
- package/runtime/archsight-aios.manifest.json +154 -51
- package/runtime/hermes/agent-registry.md +3 -0
- package/runtime/hermes/workspace-binding.md +3 -0
- package/runtime/skill-routing.md +23 -12
- package/scripts/analyze-prompt-run-results.mjs +187 -0
- package/scripts/build-prompt-run-pack.mjs +248 -0
- package/scripts/validate-prompt-fixtures.mjs +225 -0
- package/scripts/validate-prompt-model-outputs.mjs +201 -0
- package/scripts/validate-prompt-run-results.mjs +259 -0
- package/scripts/validate-prompt-scorecard.mjs +133 -0
- package/scripts/validate-skills.mjs +8 -3
- package/skills/README.md +12 -6
- package/skills/aios/SKILL.md +79 -0
- package/skills/aios/agents/openai.yaml +4 -0
- package/skills/aios-arch/SKILL.md +14 -14
- package/skills/aios-ceo/SKILL.md +13 -13
- package/skills/aios-commercial-contract/SKILL.md +32 -14
- package/skills/aios-commercial-contract/prompts/basic-prompt.md +83 -0
- package/skills/aios-commercial-tender/SKILL.md +31 -13
- package/skills/aios-commercial-tender/prompts/basic-prompt.md +94 -0
- package/skills/aios-commercial-variation/SKILL.md +33 -15
- package/skills/aios-commercial-variation/prompts/basic-prompt.md +99 -0
- package/skills/aios-compare/SKILL.md +92 -0
- package/skills/aios-compare/agents/openai.yaml +4 -0
- package/skills/aios-construction-daily/SKILL.md +32 -14
- package/skills/aios-construction-daily/prompts/basic-prompt.md +76 -0
- package/skills/aios-construction-meeting/SKILL.md +32 -14
- package/skills/aios-construction-meeting/prompts/basic-prompt.md +78 -0
- package/skills/aios-construction-scheme/SKILL.md +28 -10
- package/skills/aios-construction-scheme/prompts/basic-prompt.md +90 -0
- package/skills/aios-plan/SKILL.md +7 -7
- package/skills/aios-prompt-compare/SKILL.md +180 -0
- package/skills/aios-prompt-compare/agents/openai.yaml +4 -0
- package/skills/aios-review/SKILL.md +1 -1
- package/skills/aios-structural/SKILL.md +7 -7
- package/skills/archsight-aios/SKILL.md +40 -0
- package/skills/archsight-aios/agents/openai.yaml +4 -0
- package/skills/engineering-business-starter-kit.md +112 -0
- package/templates/README.md +16 -2
- package/templates/project-ai/.ai/ARCHSIGHT_AIOS_RULES.md +5 -4
- package/templates/project-ai/.ai/agent-routing.md +3 -1
- package/templates/project-ai/.ai/profile-detection.md +24 -0
- package/templates/project-ai/.ai/project-context.md +4 -1
- package/templates/project-ai/.ai/skills.md +36 -24
- package/templates/project-ai/AGENTS.md +6 -5
- package/templates/project-ai/AI_CODING_RULES.md +1 -1
- package/templates/project-ai/CLAUDE.md +6 -5
- package/templates/project-ai/GEMINI.md +6 -5
- package/templates/project-ai/OPENCODE.md +26 -0
- package/workflows/README.md +1 -1
- package/workflows/architecture-review.md +10 -10
- package/workflows/site-daily-loop.md +25 -25
package/docs/PUBLIC_DISCOVERY.md
CHANGED
|
@@ -4,7 +4,7 @@
|
|
|
4
4
|
|
|
5
5
|
结论:公共发现不是单一市场自动收录。AIOS 需要同时满足三类机制:
|
|
6
6
|
|
|
7
|
-
1. 本地自动发现:宿主扫描 `SKILL.md`、`skills/`、`.agents/skills/`、`.claude/skills/` 或 extension/plugin 目录。
|
|
7
|
+
1. 本地自动发现:宿主扫描 `SKILL.md`、`skills/`、`.agents/skills/`、`.claude/skills/`、`.opencode/skills/` 或 extension/plugin 目录。
|
|
8
8
|
2. 可分发安装:通过 GitHub、npm/npx、Antigravity/agy、Gemini extension 兼容入口、Claude marketplace、WorkBuddy、`skills.sh` / `npx skills` 安装。
|
|
9
9
|
3. 公共检索:依赖 GitHub topics、manifest、标准目录、README 关键词、release、安装量、star 和主动提交。
|
|
10
10
|
|
|
@@ -12,10 +12,11 @@
|
|
|
12
12
|
|
|
13
13
|
| 入口 | 文件 | 目的 |
|
|
14
14
|
| --- | --- | --- |
|
|
15
|
-
| 标准 skills 目录 | `skills/` | 让 `skills.sh`、`npx skills`、Antigravity/agy、Gemini extension 和其他标准 skill 索引器直接看到 `aios-*` Skill。 |
|
|
15
|
+
| 标准 skills 目录 | `skills/` | 让 `skills.sh`、`npx skills`、Antigravity/agy、Gemini extension、OpenCode 和其他标准 skill 索引器直接看到 `aios-*` Skill。 |
|
|
16
16
|
| Gemini extension manifest | `gemini-extension.json` | 保留 Gemini CLI extension 兼容入口和 Gallery / 第三方索引 manifest。 |
|
|
17
17
|
| Claude marketplace manifest | `.claude-plugin/marketplace.json` | 允许 Claude Code 用户通过 marketplace 方式发现本项目。 |
|
|
18
18
|
| Claude plugin manifest | `.claude-plugin/plugin.json` | 描述插件元数据,并把插件 skills 指向 `./skills/`。 |
|
|
19
|
+
| OpenCode 项目入口 | `OPENCODE.md` | 让业务项目中的 OpenCode 会话能读取公共规则和 `.ai/` 项目治理目录。 |
|
|
19
20
|
| WorkBuddy adapter | `adapters/workbuddy/README.md` | 说明如何把 `aios-*` Skill 安装到 `~/.workbuddy/skills/`。 |
|
|
20
21
|
| npm metadata | `package.json` | 提供英文检索关键词、分发文件清单和 `validate:skills` 校验入口。 |
|
|
21
22
|
| 发现校验脚本 | `scripts/validate-skills.mjs` | 校验 manifest、skill frontmatter、跨 host manifest 和 npm metadata 是否一致。 |
|
|
@@ -84,6 +85,18 @@ Codex:
|
|
|
84
85
|
npx @archsight/aios install --target codex --scope user
|
|
85
86
|
```
|
|
86
87
|
|
|
88
|
+
Claude Code 用户级 skills:
|
|
89
|
+
|
|
90
|
+
```powershell
|
|
91
|
+
npx @archsight/aios install --target claude-code --scope user
|
|
92
|
+
```
|
|
93
|
+
|
|
94
|
+
OpenCode 用户级 skills:
|
|
95
|
+
|
|
96
|
+
```powershell
|
|
97
|
+
npx @archsight/aios install --target opencode --scope user
|
|
98
|
+
```
|
|
99
|
+
|
|
87
100
|
Antigravity / agy:
|
|
88
101
|
|
|
89
102
|
```powershell
|
|
@@ -124,6 +137,7 @@ agent skills
|
|
|
124
137
|
AI agent skills
|
|
125
138
|
Codex skills
|
|
126
139
|
Claude Code skills
|
|
140
|
+
OpenCode skills
|
|
127
141
|
Gemini CLI extension
|
|
128
142
|
Antigravity CLI
|
|
129
143
|
construction AI
|
|
@@ -46,7 +46,7 @@ AIOS 不是替代专家判断,而是把专家判断变成可复用、可审查
|
|
|
46
46
|
1. 选一个具体主题,例如“地下室焊缝检测”“防火分区审查”“IFC 构件分类”。
|
|
47
47
|
2. 准备 5 到 20 个真实样例,包括正确样例和错误样例。
|
|
48
48
|
3. 写清楚术语、判断口径、通过条件和人工复核点。
|
|
49
|
-
4. 让工程团队使用 `archsight-aios init
|
|
49
|
+
4. 让工程团队使用 `archsight-aios init` 接入项目规则,并检查 `.ai/profile-detection.md` 和 `.ai/project-context.md` 的自动识别结果。
|
|
50
50
|
5. 根据 AI 输出的错误和遗漏,补充反例、规则和评估问题。
|
|
51
51
|
|
|
52
52
|
## 不应让 AIOS 做什么
|
|
@@ -58,10 +58,12 @@ AIOS 不是替代专家判断,而是把专家判断变成可复用、可审查
|
|
|
58
58
|
|
|
59
59
|
## 常见项目类型
|
|
60
60
|
|
|
61
|
-
|
|
61
|
+
默认由 `archsight-aios init` 自动识别。只有自动识别明显不符合项目实际时,再让工程团队显式覆盖 profile。
|
|
62
|
+
|
|
63
|
+
| 项目 | 自动识别或覆盖 profile |
|
|
62
64
|
| --- | --- |
|
|
63
65
|
| BIM / IFC / Revit / CAD 平台 | `bim-platform` |
|
|
64
66
|
| 施工现场图像、视频、缺陷检测 | `construction-vision` |
|
|
65
67
|
| 建筑规范知识库、RAG、GraphRAG | `rag-knowledge` |
|
|
66
68
|
|
|
67
|
-
业务专家只需要关注 `.ai/project-context.md`、`.ai/profiles/*.md` 和评估样例是否真实、准确、可复核。工程师负责把这些材料接入代码、脚本、测试和发布流程。
|
|
69
|
+
业务专家只需要关注 `.ai/profile-detection.md`、`.ai/project-context.md`、`.ai/profiles/*.md` 和评估样例是否真实、准确、可复核。工程师负责把这些材料接入代码、脚本、测试和发布流程。
|
package/docs/glossary.md
CHANGED
|
@@ -6,7 +6,7 @@ ArchSight AIOS 是一套 AI 规则、Agent、Skill、Workflow 和运行治理工
|
|
|
6
6
|
|
|
7
7
|
## Agent
|
|
8
8
|
|
|
9
|
-
Agent 是一个内部角色标签,例如建筑数字化专家、代码审查官、AI 研发工程师。Agent 定义职责、边界、输入和输出。普通使用者通常不需要记住 Agent 名字,也不需要手动指定 Agent;AIOS
|
|
9
|
+
Agent 是一个内部角色标签,例如建筑数字化专家、代码审查官、AI 研发工程师。Agent 定义职责、边界、输入和输出。普通使用者通常不需要记住 Agent 名字,也不需要手动指定 Agent;AIOS 会根据任务类型、自动识别 profile、Skill 和 Workflow 做路由。
|
|
10
10
|
|
|
11
11
|
## Skill
|
|
12
12
|
|
|
@@ -18,7 +18,7 @@ Workflow 是多步骤工作流,说明一个任务从输入、执行、检查
|
|
|
18
18
|
|
|
19
19
|
## Profile
|
|
20
20
|
|
|
21
|
-
Profile
|
|
21
|
+
Profile 是某类业务项目的补充规则。AIOS 默认把 profile 作为包内 registry 提供,`archsight-aios init` 会生成 `.ai/profile-detection.md` 做自动识别;用户通常不需要手动选择。当前包括:
|
|
22
22
|
|
|
23
23
|
- `bim-platform`
|
|
24
24
|
- `construction-vision`
|
|
@@ -26,7 +26,11 @@ Profile 是某类业务项目的补充规则。当前包括:
|
|
|
26
26
|
|
|
27
27
|
## `.ai/`
|
|
28
28
|
|
|
29
|
-
业务项目中的 AI 规则目录。它保存项目事实、AIOS
|
|
29
|
+
业务项目中的 AI 规则目录。它保存项目事实、AIOS 补充规则、自动识别结果、Agent 路由、Skills、Workflows 和行业 profile。
|
|
30
|
+
|
|
31
|
+
## `.ai/profile-detection.md`
|
|
32
|
+
|
|
33
|
+
AIOS 初始化时生成的自动识别草稿,记录命中的 profile、Skill 候选、证据关键词和人工复核边界。
|
|
30
34
|
|
|
31
35
|
## `AGENTS.md`
|
|
32
36
|
|
|
@@ -40,6 +44,10 @@ Claude Code 读取的项目入口文件。
|
|
|
40
44
|
|
|
41
45
|
Gemini 读取的项目入口文件。
|
|
42
46
|
|
|
47
|
+
## `OPENCODE.md`
|
|
48
|
+
|
|
49
|
+
OpenCode 读取的项目入口文件。
|
|
50
|
+
|
|
43
51
|
## `AI_CODING_RULES.md`
|
|
44
52
|
|
|
45
53
|
项目通用 AI 编码规则。它是项目自己的规则主体,AIOS 不应该随意覆盖它。
|
package/docs/quickstart.md
CHANGED
|
@@ -8,7 +8,7 @@
|
|
|
8
8
|
npx @archsight/aios install --target all --scope user
|
|
9
9
|
```
|
|
10
10
|
|
|
11
|
-
这一步会把 ArchSight AIOS 的 Skills、Workflows、Runtime 和模板同步到当前用户目录,让 Codex、Gemini、Antigravity 等工具可以读取。
|
|
11
|
+
这一步会把 ArchSight AIOS 的 Skills、Workflows、Runtime 和模板同步到当前用户目录,让 Codex、Claude Code、OpenCode、Gemini、Antigravity、WorkBuddy 等工具可以读取。
|
|
12
12
|
|
|
13
13
|
## 2. 检查安装
|
|
14
14
|
|
|
@@ -35,13 +35,18 @@ cd /work/your-project
|
|
|
35
35
|
npx @archsight/aios init
|
|
36
36
|
```
|
|
37
37
|
|
|
38
|
-
`init` 不指定 `--cwd` 时默认使用当前目录。已有 `AGENTS.md`、`CLAUDE.md`、`GEMINI.md` 或 `AI_CODING_RULES.md` 的项目不会被覆盖。
|
|
38
|
+
`init` 不指定 `--cwd` 时默认使用当前目录。已有 `AGENTS.md`、`CLAUDE.md`、`GEMINI.md`、`OPENCODE.md` 或 `AI_CODING_RULES.md` 的项目不会被覆盖。
|
|
39
39
|
|
|
40
|
-
## 4.
|
|
40
|
+
## 4. 查看自动识别结果
|
|
41
41
|
|
|
42
|
-
|
|
42
|
+
`init` 默认会自动生成 `.ai/profile-detection.md` 和预填 `.ai/project-context.md`。你可以直接打开这两个文件检查 AIOS 是否识别到了合适的 profile、Skill 候选、技术栈和常用命令。
|
|
43
|
+
|
|
44
|
+
通常不需要手动选择 profile。如果自动识别不符合项目实际,可以用下面的命令覆盖:
|
|
43
45
|
|
|
44
46
|
```bash
|
|
47
|
+
npx @archsight/aios init --profile auto
|
|
48
|
+
npx @archsight/aios init --profile none
|
|
49
|
+
npx @archsight/aios init --profile all
|
|
45
50
|
npx @archsight/aios init --profile bim-platform
|
|
46
51
|
npx @archsight/aios init --profile construction-vision
|
|
47
52
|
npx @archsight/aios init --profile rag-knowledge
|
|
@@ -55,6 +60,7 @@ npx @archsight/aios init --profile rag-knowledge
|
|
|
55
60
|
AGENTS.md
|
|
56
61
|
CLAUDE.md
|
|
57
62
|
GEMINI.md
|
|
63
|
+
OPENCODE.md
|
|
58
64
|
AI_CODING_RULES.md
|
|
59
65
|
.ai/
|
|
60
66
|
```
|
|
@@ -84,6 +90,14 @@ npm test
|
|
|
84
90
|
|
|
85
91
|
### 我应该用哪个 profile?
|
|
86
92
|
|
|
93
|
+
默认不用选。先运行:
|
|
94
|
+
|
|
95
|
+
```bash
|
|
96
|
+
npx @archsight/aios init
|
|
97
|
+
```
|
|
98
|
+
|
|
99
|
+
然后看 `.ai/profile-detection.md` 的识别结果。只有自动识别明显不符合项目实际时,再显式覆盖:
|
|
100
|
+
|
|
87
101
|
- BIM / Revit / CAD / IFC 平台:`bim-platform`
|
|
88
102
|
- 施工视觉 AI、检测、分割、深度估计:`construction-vision`
|
|
89
103
|
- 规范知识库、RAG、GraphRAG:`rag-knowledge`
|
package/gemini-extension.json
CHANGED
|
@@ -1,6 +1,6 @@
|
|
|
1
1
|
{
|
|
2
2
|
"name": "archsight-aios",
|
|
3
|
-
"version": "1.
|
|
3
|
+
"version": "1.3.1",
|
|
4
4
|
"description": "面向建筑行业知识工作从业者与 AI 研发团队的 Skills、Workflow 与多 Agent 工具包 / Building-industry AI agent skills for BIM, IFC, RAG, GraphRAG, project evidence work, code review, and runtime governance.",
|
|
5
5
|
"contextFileName": "GEMINI.md"
|
|
6
6
|
}
|
package/governance/README.md
CHANGED
|
@@ -1,18 +1,48 @@
|
|
|
1
|
-
#
|
|
1
|
+
# 治理规则
|
|
2
2
|
|
|
3
3
|
`governance/` 保存 AI 工程治理规则。
|
|
4
4
|
|
|
5
|
-
|
|
5
|
+
## 文件索引
|
|
6
6
|
|
|
7
|
-
|
|
8
|
-
|
|
9
|
-
|
|
10
|
-
|
|
11
|
-
|
|
12
|
-
|
|
13
|
-
|
|
14
|
-
|
|
7
|
+
| 中文名称 | 文件 | 作用 |
|
|
8
|
+
| --- | --- | --- |
|
|
9
|
+
| AI 编码规范 | [coding-rules.md](coding-rules.md) | 统一代码生成、修改、验证和交付边界。 |
|
|
10
|
+
| AI 评审策略 | [ai-review-policy.md](ai-review-policy.md) | 约束 AI 生成内容、代码审查和风险评审。 |
|
|
11
|
+
| 安全策略 | [security-policy.md](security-policy.md) | 管理权限、密钥、外发、注入和安全敏感操作。 |
|
|
12
|
+
| Agent 边界策略 | [agent-boundary.md](agent-boundary.md) | 区分 Agent、Skill、Workflow 和 Runtime 的职责边界。 |
|
|
13
|
+
| Capability 证据仲裁协议 | [arbitration-protocol.md](arbitration-protocol.md) | 用证据等级、工具结果和人工升级处理多 Agent 冲突。 |
|
|
14
|
+
| 交付策略 | [delivery-policy.md](delivery-policy.md) | 约束发布、回滚、验收和交付声明。 |
|
|
15
|
+
| 上下文策略 | [context-policy.md](context-policy.md) | 控制上下文读取范围、成本、污染和泄露风险。 |
|
|
16
|
+
| 记忆策略 | [memory-policy.md](memory-policy.md) | 管理长期记忆、项目事实和可复用经验的边界。 |
|
|
15
17
|
|
|
16
18
|
治理目标是防止 agent 乱调用、prompt 泄露、上下文爆炸、AI 瞎改代码、权限失控和未经评审的自动交付。
|
|
17
19
|
|
|
18
|
-
|
|
20
|
+
## 统一输出口径
|
|
21
|
+
|
|
22
|
+
面向用户、客户或业务人员的输出默认使用中文字段,不直接输出英文模板标签。
|
|
23
|
+
|
|
24
|
+
推荐字段:
|
|
25
|
+
|
|
26
|
+
```text
|
|
27
|
+
判断事项:
|
|
28
|
+
证据:
|
|
29
|
+
工具结果:
|
|
30
|
+
处理建议:可继续 / 需核验 / 转人工复核
|
|
31
|
+
```
|
|
32
|
+
|
|
33
|
+
资料整理类输出使用:
|
|
34
|
+
|
|
35
|
+
```text
|
|
36
|
+
资料来源清单
|
|
37
|
+
证据仲裁
|
|
38
|
+
需核验
|
|
39
|
+
转人工复核
|
|
40
|
+
```
|
|
41
|
+
|
|
42
|
+
内部 runtime、schema、Capability ID、命令、文件名和代码标识符可以保留英文;但最终说明应优先给出中文解释。
|
|
43
|
+
|
|
44
|
+
## 仲裁原则
|
|
45
|
+
|
|
46
|
+
多 Agent 产生逻辑冲突时,优先按 [Capability 证据仲裁协议](arbitration-protocol.md) 的证据等级处理:确定性工具、项目事实和结构化知识优先于 Agent 自然语言判断;涉及生产授权、法规合规最终结论、结构安全结论和商业范围取舍时升级给人类负责人。
|
|
47
|
+
|
|
48
|
+
证据不足时,不把推断写成结论;应标为 `需核验`,或在责任、金额、质量安全、结构安全、法律合规、审批签审等高风险事项上标为 `转人工复核`。
|
|
@@ -1,4 +1,4 @@
|
|
|
1
|
-
# Capability
|
|
1
|
+
# Capability 证据仲裁协议
|
|
2
2
|
|
|
3
3
|
状态:治理基线草案
|
|
4
4
|
适用范围:ArchSight AIOS 多 Agent 冲突仲裁、工具证据裁决和人工升级
|
|
@@ -11,7 +11,7 @@
|
|
|
11
11
|
|
|
12
12
|
核心原则:
|
|
13
13
|
|
|
14
|
-
> Agent
|
|
14
|
+
> Agent 可以提出判断事项,但不能只凭自然语言推理裁决事实。事实裁决必须回到项目证据、结构化知识、确定性工具或人工授权。
|
|
15
15
|
|
|
16
16
|
适用场景:
|
|
17
17
|
|
|
@@ -34,30 +34,30 @@
|
|
|
34
34
|
| L4 | 专项 Agent 判断 | Atlas 的架构判断、Mason 的交付判断、Vitruvius 的领域判断、Euclid 的建模判断。 |
|
|
35
35
|
| L5 | LLM 自然语言推理 | 只能作为假设、解释或建议,不能单独作为阻断或放行依据。 |
|
|
36
36
|
|
|
37
|
-
工具结果优先,但不得盲信工具结果。L1/L3 证据必须带有输入、版本、适用条件和执行状态;缺失时只能进入
|
|
37
|
+
工具结果优先,但不得盲信工具结果。L1/L3 证据必须带有输入、版本、适用条件和执行状态;缺失时只能进入 `需核验`。
|
|
38
38
|
|
|
39
39
|
---
|
|
40
40
|
|
|
41
|
-
##
|
|
41
|
+
## 三、判断事项契约
|
|
42
42
|
|
|
43
|
-
Agent
|
|
43
|
+
Agent 之间发生冲突时,不能只输出“我不同意”。每个参与方必须把意见转成判断事项:
|
|
44
44
|
|
|
45
45
|
```text
|
|
46
|
-
|
|
47
|
-
|
|
48
|
-
|
|
49
|
-
|
|
50
|
-
|
|
51
|
-
|
|
52
|
-
|
|
53
|
-
|
|
54
|
-
|
|
55
|
-
|
|
56
|
-
|
|
57
|
-
|
|
46
|
+
判断事项:
|
|
47
|
+
编号:
|
|
48
|
+
负责 Agent:
|
|
49
|
+
类型:架构 / 交付 / 行业语义 / 结构 / 安全 / runtime / 商业
|
|
50
|
+
表述:
|
|
51
|
+
证据等级:L0 / L1 / L2 / L3 / L4 / L5
|
|
52
|
+
证据:
|
|
53
|
+
假设:
|
|
54
|
+
需核验:
|
|
55
|
+
是否阻断:是 / 否
|
|
56
|
+
严重级别:P0 / P1 / P2
|
|
57
|
+
请求动作:继续 / 修订 / 收缩 / 停止 / 人工升级
|
|
58
58
|
```
|
|
59
59
|
|
|
60
|
-
|
|
60
|
+
判断事项必须明确区分事实、判断、假设和待验证项。没有证据的判断事项默认不具备阻断权。
|
|
61
61
|
|
|
62
62
|
---
|
|
63
63
|
|
|
@@ -122,32 +122,32 @@ any -> human_escalation
|
|
|
122
122
|
|
|
123
123
|
---
|
|
124
124
|
|
|
125
|
-
##
|
|
125
|
+
## 七、决策记录
|
|
126
126
|
|
|
127
127
|
每次仲裁必须沉淀为可复核记录。最小字段:
|
|
128
128
|
|
|
129
129
|
```text
|
|
130
|
-
|
|
131
|
-
|
|
132
|
-
|
|
133
|
-
|
|
134
|
-
|
|
135
|
-
|
|
136
|
-
|
|
137
|
-
|
|
138
|
-
|
|
139
|
-
|
|
140
|
-
|
|
130
|
+
决策记录:
|
|
131
|
+
编号:
|
|
132
|
+
日期:
|
|
133
|
+
冲突:
|
|
134
|
+
判断事项:
|
|
135
|
+
证据:
|
|
136
|
+
工具结果:
|
|
137
|
+
决策:继续 / 修订 / 收缩 / 停止 / 升级人工
|
|
138
|
+
已拒绝方案:
|
|
139
|
+
负责人:
|
|
140
|
+
后续动作:
|
|
141
141
|
```
|
|
142
142
|
|
|
143
|
-
|
|
143
|
+
决策记录可以写入 ADR、memory、PR 描述、issue 或项目 `.ai/` 目录,具体位置由项目接入规则决定。
|
|
144
144
|
|
|
145
145
|
---
|
|
146
146
|
|
|
147
147
|
## 八、落地要求
|
|
148
148
|
|
|
149
|
-
- Workflow
|
|
149
|
+
- Workflow 面向用户的输出必须包含中文化的 `判断事项 / 证据 / 工具结果 / 处理建议`。
|
|
150
150
|
- Skill 需要声明可用 Capability、权限边界和证据契约。
|
|
151
151
|
- Runtime Adapter 只负责调用工具和回传证据,不替代 Agent 判断。
|
|
152
152
|
- 工具调用失败时必须暴露失败原因、输入摘要和可恢复路径。
|
|
153
|
-
- 没有 Capability 实现时,必须标为
|
|
153
|
+
- 没有 Capability 实现时,必须标为 `已声明接口` 或 `需核验`,不得伪造工具结果。
|
|
@@ -7,14 +7,14 @@
|
|
|
7
7
|
## 格式
|
|
8
8
|
|
|
9
9
|
```text
|
|
10
|
-
|
|
11
|
-
|
|
12
|
-
|
|
13
|
-
|
|
14
|
-
|
|
15
|
-
|
|
16
|
-
|
|
17
|
-
|
|
10
|
+
标题:
|
|
11
|
+
日期:
|
|
12
|
+
背景:
|
|
13
|
+
决策:
|
|
14
|
+
已拒绝方案:
|
|
15
|
+
影响:
|
|
16
|
+
验证:
|
|
17
|
+
负责人:
|
|
18
18
|
```
|
|
19
19
|
|
|
20
20
|
## 写入条件
|
|
@@ -23,4 +23,3 @@ Owner:
|
|
|
23
23
|
- 拒绝了一个未来可能反复被提出的方案。
|
|
24
24
|
- 改变了 Agent、Skill、Workflow 或 Runtime 边界。
|
|
25
25
|
- 发布、权限或数据策略发生变化。
|
|
26
|
-
|
package/package.json
CHANGED
|
@@ -1,6 +1,6 @@
|
|
|
1
1
|
{
|
|
2
2
|
"name": "@archsight/aios",
|
|
3
|
-
"version": "1.
|
|
3
|
+
"version": "1.3.1",
|
|
4
4
|
"description": "面向建筑行业知识工作从业者与 AI 研发团队的 Skills、Workflow 与多 Agent 工具包 / Building-industry AI agent skills for BIM, IFC, RAG, GraphRAG, project evidence work, code review, and runtime governance.",
|
|
5
5
|
"type": "module",
|
|
6
6
|
"homepage": "https://github.com/ArchSightLabs/archsight-aios#readme",
|
|
@@ -32,6 +32,7 @@
|
|
|
32
32
|
"antigravity",
|
|
33
33
|
"claude-code",
|
|
34
34
|
"workbuddy",
|
|
35
|
+
"opencode",
|
|
35
36
|
"skills-sh",
|
|
36
37
|
"mcp",
|
|
37
38
|
"runtime-governance",
|
|
@@ -47,6 +48,15 @@
|
|
|
47
48
|
"install:user": "node ./bin/archsight-aios.mjs install --target all --scope user",
|
|
48
49
|
"smoke:project": "node ./bin/archsight-aios.mjs validate --temp",
|
|
49
50
|
"validate:skills": "node ./scripts/validate-skills.mjs",
|
|
51
|
+
"validate:prompts": "node ./scripts/validate-prompt-fixtures.mjs",
|
|
52
|
+
"validate:prompt-run-pack": "node ./scripts/build-prompt-run-pack.mjs --check",
|
|
53
|
+
"validate:public-advisory-run-pack": "node ./scripts/build-prompt-run-pack.mjs --fixture prompts/evaluations/engineering-business-public-advisory-fixtures.json --check",
|
|
54
|
+
"validate:prompt-run-results": "node ./scripts/validate-prompt-run-results.mjs --check-template",
|
|
55
|
+
"validate:prompt-outputs": "node ./scripts/validate-prompt-model-outputs.mjs",
|
|
56
|
+
"validate:prompt-scorecard": "node ./scripts/validate-prompt-scorecard.mjs",
|
|
57
|
+
"build:prompt-run-pack": "node ./scripts/build-prompt-run-pack.mjs --out prompts/evaluations/engineering-business-basic-run-pack.generated.json",
|
|
58
|
+
"build:public-advisory-run-pack": "node ./scripts/build-prompt-run-pack.mjs --fixture prompts/evaluations/engineering-business-public-advisory-fixtures.json --out prompts/evaluations/engineering-business-public-advisory-run-pack.generated.json",
|
|
59
|
+
"analyze:prompt-run-results": "node ./scripts/analyze-prompt-run-results.mjs",
|
|
50
60
|
"test": "node ./tests/cli.test.mjs"
|
|
51
61
|
},
|
|
52
62
|
"engines": {
|
|
@@ -81,10 +91,11 @@
|
|
|
81
91
|
"SECURITY.md",
|
|
82
92
|
"CODE_OF_CONDUCT.md",
|
|
83
93
|
"README.md",
|
|
84
|
-
"AI_CODING_RULES.md",
|
|
85
|
-
"AGENTS.md",
|
|
86
|
-
"CLAUDE.md",
|
|
87
|
-
"GEMINI.md"
|
|
88
|
-
|
|
94
|
+
"AI_CODING_RULES.md",
|
|
95
|
+
"AGENTS.md",
|
|
96
|
+
"CLAUDE.md",
|
|
97
|
+
"GEMINI.md",
|
|
98
|
+
"OPENCODE.md"
|
|
99
|
+
],
|
|
89
100
|
"license": "Apache-2.0"
|
|
90
101
|
}
|
package/prompts/README.md
CHANGED
|
@@ -11,3 +11,15 @@ Prompt 会腐化,因此不能只保存文本本身,必须保存评估和维
|
|
|
11
11
|
- [Prompt Registry](prompt-registry.md)
|
|
12
12
|
- [Prompt Evaluation Policy](evaluation-policy.md)
|
|
13
13
|
- [Prompt Failure Cases](failure-cases.md)
|
|
14
|
+
|
|
15
|
+
工程业务管理基础提示词随对应 `aios-*` Skill 分发,入口见 [Prompt Registry](prompt-registry.md) 和 [工程业务管理基础技能包](../skills/engineering-business-starter-kit.md)。
|
|
16
|
+
对比验证记录见 [工程业务管理基础提示词对比验证](evaluations/engineering-business-basic-prompts-2026-06-16.md)。
|
|
17
|
+
advisory 来源信号复核见 [工程业务基础提示词 advisory 复核说明](evaluations/engineering-business-basic-advisory-validation-2026-06-16.md)。
|
|
18
|
+
结构化评分卡见 [工程业务管理基础提示词评分卡](evaluations/engineering-business-basic-scorecard.json),可用 `npm run validate:prompt-scorecard` 校验。
|
|
19
|
+
weak/basic 运行包可用 `npm run build:prompt-run-pack` 生成,生成前可用 `npm run validate:prompt-run-pack` 校验。
|
|
20
|
+
weak/basic 运行结果模板可用 `node ./scripts/validate-prompt-run-results.mjs --init <file>` 生成,模板和真实结果可用 `npm run validate:prompt-run-results` 或 `--file` 校验。
|
|
21
|
+
weak/basic 运行结果报告可用 `npm run analyze:prompt-run-results -- --file <results> --out <report>` 生成。
|
|
22
|
+
输出结构样例见 [工程业务管理基础模型输出样例](evaluations/engineering-business-basic-model-output.example.json),可用 `npm run validate:prompt-outputs` 校验。
|
|
23
|
+
公开 advisory 验证案例见 [公开 advisory fixture](evaluations/engineering-business-public-advisory-fixtures.json) 和 [Markdown 归一化输入](evaluations/public-advisory-md/)。这些 Markdown 文件保留虚构客户、项目、人员、地点、日期、金额和编号,用于验证抽取效果;原始 PDF / DOCX / 图片解析另行测试。
|
|
24
|
+
|
|
25
|
+
需要比较弱提示词、便携强提示词和真实 Skill 触发结果时,使用 `aios-prompt-compare`。其中真实 Skill 结果必须来自宿主工具实际触发对应 `$aios-*` Skill 后的输出,不把 `SKILL.md` 当普通 prompt 粘贴运行的结果视为正式 Skill 结果。
|
|
@@ -16,3 +16,73 @@
|
|
|
16
16
|
3. 比较输出质量、风险和遵循度。
|
|
17
17
|
4. 记录失效案例。
|
|
18
18
|
|
|
19
|
+
## 工程业务基础提示词回归
|
|
20
|
+
|
|
21
|
+
工程业务管理基础提示词使用 `prompts/evaluations/engineering-business-basic-fixtures.json` 作为脱敏回归基线。
|
|
22
|
+
|
|
23
|
+
公开 advisory 验证案例使用 `prompts/evaluations/engineering-business-public-advisory-fixtures.json`,具体输入统一放在 `prompts/evaluations/public-advisory-md/*.md`。这些公开案例只使用 Markdown 归一化输入:客户、项目、人员、地点、日期、金额和编号都是虚构值;它们用于验证提示词、agent 路由、字段抽取和输出边界,不验证 PDF / DOCX / 图片解析链路。
|
|
24
|
+
|
|
25
|
+
修改 `skills/aios-*/prompts/basic-prompt.md` 后,运行:
|
|
26
|
+
|
|
27
|
+
```bash
|
|
28
|
+
npm run validate:prompts
|
|
29
|
+
```
|
|
30
|
+
|
|
31
|
+
该检查不替代真实模型输出评估,但能保证 6 类基础场景、抽象来源信号、必备输出结构、禁止结论和敏感信息边界没有被破坏。
|
|
32
|
+
|
|
33
|
+
普通提示词与基础提示词的结构化比较保存在 `prompts/evaluations/engineering-business-basic-scorecard.json`。修改 fixture、基础提示词或评分维度后,运行:
|
|
34
|
+
|
|
35
|
+
```bash
|
|
36
|
+
npm run validate:prompt-scorecard
|
|
37
|
+
```
|
|
38
|
+
|
|
39
|
+
评分卡用于固定比较维度、权重、普通提示词失败模式和基础提示词改进点;它是脱敏 fixture 级别的设计评估,不替代真实模型批量输出评测。
|
|
40
|
+
|
|
41
|
+
若需要批量运行 weak/basic 对照输入,先生成运行包:
|
|
42
|
+
|
|
43
|
+
```bash
|
|
44
|
+
npm run validate:prompt-run-pack
|
|
45
|
+
npm run build:prompt-run-pack
|
|
46
|
+
npm run validate:public-advisory-run-pack
|
|
47
|
+
npm run build:public-advisory-run-pack
|
|
48
|
+
```
|
|
49
|
+
|
|
50
|
+
基础运行包包含 6 个 case 的普通提示词和基础提示词两组输入,共 12 条 run item。公开 advisory 运行包同样生成 12 条 run item,但 `sampleInput` 来自 Markdown 归一化输入正文。该步骤只组织脱敏 / 虚构输入和 prompt 文本,不调用模型。
|
|
51
|
+
|
|
52
|
+
若要评估“普通提示词、便携强提示词、真实 Skill 结果”三类差异,使用 `aios-prompt-compare`。其中 weak/basic 可以沿用 run pack;`skill-runtime` 需要由宿主工具真实触发对应 `$aios-*` Skill 后归档,再按同一 scorecard 做三栏比较。不要把 `SKILL.md` 直接作为普通 prompt 粘贴运行的输出称为真实 Skill 结果。
|
|
53
|
+
|
|
54
|
+
weak/basic 成对运行后,用 run results 文件归档 12 条结果:
|
|
55
|
+
|
|
56
|
+
```bash
|
|
57
|
+
npm run validate:prompt-run-results
|
|
58
|
+
node ./scripts/validate-prompt-run-results.mjs --init prompts/evaluations/<your-run-results-file>.json
|
|
59
|
+
node ./scripts/validate-prompt-run-results.mjs --file prompts/evaluations/<your-run-results-file>.json
|
|
60
|
+
```
|
|
61
|
+
|
|
62
|
+
run results 校验会要求基础提示词输出包含必备章节且不出现禁止结论;普通提示词输出允许暴露缺陷,并输出 weak diagnostics 供对比复盘。
|
|
63
|
+
|
|
64
|
+
校验通过后,生成运行结果分析报告:
|
|
65
|
+
|
|
66
|
+
```bash
|
|
67
|
+
npm run analyze:prompt-run-results -- --file prompts/evaluations/<your-run-results-file>.json --out prompts/evaluations/<your-analysis-report>.md
|
|
68
|
+
```
|
|
69
|
+
|
|
70
|
+
分析报告汇总基础提示词通过门禁数量、普通提示词诊断数量、scorecard 判定和逐 case 差异,供后续决定是否调整基础提示词或 fixture。
|
|
71
|
+
|
|
72
|
+
若已经有模型输出文件,使用同一 fixture 校验输出结构:
|
|
73
|
+
|
|
74
|
+
```bash
|
|
75
|
+
npm run validate:prompt-outputs
|
|
76
|
+
node ./scripts/validate-prompt-model-outputs.mjs --file prompts/evaluations/<your-output-file>.json
|
|
77
|
+
```
|
|
78
|
+
|
|
79
|
+
若需要归档一次真实输出,先生成待填写模板:
|
|
80
|
+
|
|
81
|
+
```bash
|
|
82
|
+
node ./scripts/validate-prompt-model-outputs.mjs --init prompts/evaluations/<your-output-file>.json
|
|
83
|
+
```
|
|
84
|
+
|
|
85
|
+
模板中的 `output` 默认为空,不会通过校验;填入脱敏后的真实模型输出后,再用 `--file` 检查。
|
|
86
|
+
真实输出文件需要填写可追溯的 `model`、可解析的 `ranAt`,且 `promptVersion` 必须匹配当前 fixture 版本。
|
|
87
|
+
|
|
88
|
+
默认文件 `engineering-business-basic-model-output.example.json` 只是输出骨架样例,用于验证格式和检查器本身,不代表真实模型评测结果。
|