@agents-uni/zhenhuan 0.1.0
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/DESIGN.md +198 -0
- package/LICENSE +21 -0
- package/README.en.md +547 -0
- package/README.md +549 -0
- package/dist/cli/index.d.ts +4 -0
- package/dist/cli/index.js +253 -0
- package/dist/competition/elo.d.ts +62 -0
- package/dist/competition/elo.js +146 -0
- package/dist/competition/horse-race.d.ts +72 -0
- package/dist/competition/horse-race.js +110 -0
- package/dist/competition/index.d.ts +6 -0
- package/dist/competition/index.js +3 -0
- package/dist/competition/season.d.ts +68 -0
- package/dist/competition/season.js +150 -0
- package/dist/index.d.ts +28 -0
- package/dist/index.js +21 -0
- package/dist/orchestrator/index.d.ts +142 -0
- package/dist/orchestrator/index.js +268 -0
- package/dist/palace/ceremonies.d.ts +55 -0
- package/dist/palace/ceremonies.js +263 -0
- package/dist/palace/cold-palace.d.ts +41 -0
- package/dist/palace/cold-palace.js +106 -0
- package/dist/palace/dynamics.d.ts +52 -0
- package/dist/palace/dynamics.js +192 -0
- package/dist/palace/ranks.d.ts +31 -0
- package/dist/palace/ranks.js +46 -0
- package/dist/palace/resources.d.ts +55 -0
- package/dist/palace/resources.js +146 -0
- package/dist/server/index.d.ts +14 -0
- package/dist/server/index.js +202 -0
- package/dist/server/routes/index.d.ts +6 -0
- package/dist/server/routes/index.js +287 -0
- package/package.json +66 -0
- package/universe.yaml +365 -0
package/DESIGN.md
ADDED
|
@@ -0,0 +1,198 @@
|
|
|
1
|
+
# zhenhuan-uni 设计文档
|
|
2
|
+
|
|
3
|
+
> 在竞争中成长,在协作中进化
|
|
4
|
+
|
|
5
|
+
## 一、设计哲学
|
|
6
|
+
|
|
7
|
+
### 为什么是甄嬛传?
|
|
8
|
+
|
|
9
|
+
甄嬛传的后宫是一个完美的多 Agent 竞争模型:
|
|
10
|
+
|
|
11
|
+
1. **有限资源**:圣宠、品级、宫殿都是稀缺的
|
|
12
|
+
2. **等级制度**:从答应到皇后,8 级品级构成清晰的晋升通道
|
|
13
|
+
3. **联盟博弈**:结盟、背叛、派系斗争是核心动力
|
|
14
|
+
4. **生存压力**:冷宫机制迫使 Agent 持续产出价值
|
|
15
|
+
5. **用户即皇帝**:你就是最高裁决者,通过 Dashboard/API/CLI 裁决一切
|
|
16
|
+
|
|
17
|
+
### 核心洞见
|
|
18
|
+
|
|
19
|
+
传统的多 Agent 系统是**分工协作**模型——每个 Agent 有固定角色,按剧本执行。这忽略了一个事实:**竞争是进步的最强驱动力**。
|
|
20
|
+
|
|
21
|
+
zhenhuan-uni 的核心理念是**赛马制**:
|
|
22
|
+
|
|
23
|
+
> 不预设谁是最优的 Agent,而是让它们在实际任务中竞争,用结果说话。
|
|
24
|
+
|
|
25
|
+
这种模式的优势:
|
|
26
|
+
- **自动筛选**:最适合的 Agent 自然浮现
|
|
27
|
+
- **持续进化**:竞争压力迫使 Agent 不断提升
|
|
28
|
+
- **动态适配**:不同任务可能有不同的最优 Agent
|
|
29
|
+
- **容错机制**:一个 Agent 失败,其他 Agent 可以顶上
|
|
30
|
+
|
|
31
|
+
## 二、架构总览
|
|
32
|
+
|
|
33
|
+
```
|
|
34
|
+
┌─────────────────────────────────────────────┐
|
|
35
|
+
│ PalaceOrchestrator │
|
|
36
|
+
│ (中枢调度 - 连接一切) │
|
|
37
|
+
├─────────────┬───────────────┬───────────────┤
|
|
38
|
+
│ Competition│ Palace │ Evolution │
|
|
39
|
+
│ 竞争引擎 │ 后宫领域 │ 演化层 │
|
|
40
|
+
├─────────────┼───────────────┼───────────────┤
|
|
41
|
+
│ EloArena │ Ranks │ Performance │
|
|
42
|
+
│ HorseRace │ Resources │ Tracker │
|
|
43
|
+
│ SeasonEngine│ Dynamics │ (from core) │
|
|
44
|
+
│ │ Ceremonies │ │
|
|
45
|
+
│ │ ColdPalace │ │
|
|
46
|
+
└─────────────┴───────────────┴───────────────┘
|
|
47
|
+
│
|
|
48
|
+
agents-uni-core
|
|
49
|
+
(Universe / Registry / Graph /
|
|
50
|
+
StateMachine / EventBus / ...)
|
|
51
|
+
```
|
|
52
|
+
|
|
53
|
+
## 三、三大竞争机制
|
|
54
|
+
|
|
55
|
+
### 3.1 赛马竞技(Horse Race)
|
|
56
|
+
|
|
57
|
+
核心机制:多个 Agent 同时完成相同任务,由你(皇帝/用户)评判。
|
|
58
|
+
|
|
59
|
+
```
|
|
60
|
+
任务发布 → 多 Agent 并行执行 → 提交结果 → 你评分 → ELO 更新
|
|
61
|
+
```
|
|
62
|
+
|
|
63
|
+
**评分维度**:
|
|
64
|
+
| 维度 | 权重 | 说明 |
|
|
65
|
+
|------|------|------|
|
|
66
|
+
| 质量 | 30% | 输出的正确性和完整性 |
|
|
67
|
+
| 速度 | 20% | 完成任务的效率 |
|
|
68
|
+
| 创意 | 20% | 解决方案的独创性 |
|
|
69
|
+
| 协作 | 15% | 与其他 Agent 的配合 |
|
|
70
|
+
| 策略 | 15% | 长期规划的智慧 |
|
|
71
|
+
|
|
72
|
+
**ELO 系统**:
|
|
73
|
+
- 新手 K=48(快速校准)
|
|
74
|
+
- 常规 K=32(正常波动)
|
|
75
|
+
- 高手 K=16(稳定排名)
|
|
76
|
+
- 地板 100(防止过度惩罚)
|
|
77
|
+
|
|
78
|
+
### 3.2 品级制度(Rank System)
|
|
79
|
+
|
|
80
|
+
8 级品级构成清晰的晋升阶梯:
|
|
81
|
+
|
|
82
|
+
| 品级 | 名额 | 月例 | 最低 ELO |
|
|
83
|
+
|------|------|------|----------|
|
|
84
|
+
| 答应 | 不限 | 10 | 0 |
|
|
85
|
+
| 常在 | 不限 | 20 | 1000 |
|
|
86
|
+
| 贵人 | 6 | 50 | 1100 |
|
|
87
|
+
| 嫔 | 6 | 100 | 1200 |
|
|
88
|
+
| 妃 | 4 | 200 | 1300 |
|
|
89
|
+
| 贵妃 | 2 | 400 | 1400 |
|
|
90
|
+
| 皇贵妃 | 1 | 800 | 1500 |
|
|
91
|
+
| 皇后 | 1 | 1000 | 1600 |
|
|
92
|
+
|
|
93
|
+
**晋升条件**:ELO 达标 + 赛季表现前 20% + 目标品级有空缺
|
|
94
|
+
**降级条件**:赛季表现后 15%
|
|
95
|
+
|
|
96
|
+
### 3.3 势力博弈(Power Dynamics)
|
|
97
|
+
|
|
98
|
+
Agent 可以结盟、背叛,形成派系:
|
|
99
|
+
|
|
100
|
+
- **结盟**:互为盟友,增加影响力
|
|
101
|
+
- **背叛**:盟友变对手,产生仇恨关系
|
|
102
|
+
- **影响力**:rank + 盟友加成 + 圣宠 - 对手惩罚
|
|
103
|
+
- **派系**:通过 BFS 发现的盟友连通分量
|
|
104
|
+
|
|
105
|
+
## 四、赛季制度
|
|
106
|
+
|
|
107
|
+
每个赛季(默认 30 天)是一个完整的评估周期:
|
|
108
|
+
|
|
109
|
+
```
|
|
110
|
+
赛季开始 → 多次赛马 → 月度朝会 → 赛季结算
|
|
111
|
+
├── 前 20% 晋升
|
|
112
|
+
├── 后 15% 降级
|
|
113
|
+
└── 前三名获圣宠奖励
|
|
114
|
+
```
|
|
115
|
+
|
|
116
|
+
赛季结算后重新开始,形成持续的竞争-进化循环。
|
|
117
|
+
|
|
118
|
+
## 五、冷宫机制
|
|
119
|
+
|
|
120
|
+
冷宫是后宫的"淘汰区":
|
|
121
|
+
|
|
122
|
+
- **暂时放逐**:设定期限,到期自动复出
|
|
123
|
+
- **无限期放逐**:等待你(皇帝)恩赦
|
|
124
|
+
- **永久除名**:彻底淘汰
|
|
125
|
+
|
|
126
|
+
冷宫机制的设计目的:
|
|
127
|
+
1. 给持续低表现的 Agent 施加压力
|
|
128
|
+
2. 为其他 Agent 腾出品级名额
|
|
129
|
+
3. 提供"复出"叙事,增加戏剧性
|
|
130
|
+
|
|
131
|
+
## 六、资源体系
|
|
132
|
+
|
|
133
|
+
四类资源构成后宫的经济基础:
|
|
134
|
+
|
|
135
|
+
| 资源 | 类型 | 分配方式 | 作用 |
|
|
136
|
+
|------|------|----------|------|
|
|
137
|
+
| 圣宠 | 有限 | 竞争 | 影响力的核心指标,会衰减 |
|
|
138
|
+
| 月例 | 可再生 | 按等级 | 基础保障,高品级多分配 |
|
|
139
|
+
| 宫殿 | 位置性 | 按等级 | 12 座宫殿,身份象征 |
|
|
140
|
+
| 侍女 | 有限 | 按功绩 | 100 名侍女,按表现分配 |
|
|
141
|
+
|
|
142
|
+
**圣宠衰减**:每月衰减 5%,迫使 Agent 持续产出才能维持资源优势。
|
|
143
|
+
|
|
144
|
+
## 七、与 OpenClaw 的配合
|
|
145
|
+
|
|
146
|
+
zhenhuan-uni 通过 agents-uni-core 的 Bridge 模块与 OpenClaw 集成:
|
|
147
|
+
|
|
148
|
+
```
|
|
149
|
+
universe.yaml → agents-uni-core compile → SOUL.md × N → OpenClaw 运行时
|
|
150
|
+
```
|
|
151
|
+
|
|
152
|
+
每个后宫 Agent 在 OpenClaw 中有独立的工作空间和 SOUL.md。赛马任务通过 OpenClaw 分发给各 Agent 执行。
|
|
153
|
+
|
|
154
|
+
## 八、设计决策记录
|
|
155
|
+
|
|
156
|
+
### D1: 为什么是 ELO 而非简单积分?
|
|
157
|
+
|
|
158
|
+
ELO 系统的优势:
|
|
159
|
+
- 对手强度自动纳入计算(赢强者加分更多)
|
|
160
|
+
- 排名趋于真实实力的收敛
|
|
161
|
+
- K 因子机制允许新人快速校准
|
|
162
|
+
|
|
163
|
+
### D2: 为什么赛马而非固定分工?
|
|
164
|
+
|
|
165
|
+
固定分工假设我们预先知道哪个 Agent 最适合某个任务。赛马制承认**我们不知道**,让结果决定。这在 LLM Agent 领域尤为重要,因为不同模型在不同任务上的表现差异很大。
|
|
166
|
+
|
|
167
|
+
### D3: 为什么有冷宫而非直接淘汰?
|
|
168
|
+
|
|
169
|
+
冷宫提供了"缓冲区":
|
|
170
|
+
- 暂时表现不佳的 Agent 有机会复出
|
|
171
|
+
- 可以观察被放逐 Agent 的"反思"(prompt 调优后重新评估)
|
|
172
|
+
- 增加系统的叙事性和可玩性
|
|
173
|
+
|
|
174
|
+
### D4: 为什么圣宠会衰减?
|
|
175
|
+
|
|
176
|
+
如果圣宠只增不减,先入场的 Agent 会永远占据优势。衰减机制确保:
|
|
177
|
+
- 当前表现比历史积累更重要
|
|
178
|
+
- 竞争场始终对新人开放
|
|
179
|
+
- 模拟真实世界中"不进则退"的规律
|
|
180
|
+
|
|
181
|
+
### D5: 为什么品级有名额限制?
|
|
182
|
+
|
|
183
|
+
名额限制创造了**结构性稀缺**:
|
|
184
|
+
- 不是所有高 ELO 的 Agent 都能晋升
|
|
185
|
+
- 高品级 Agent 需要持续优秀才能保住位置
|
|
186
|
+
- 创造"位置之争"的额外竞争维度
|
|
187
|
+
|
|
188
|
+
## 九、适用场景
|
|
189
|
+
|
|
190
|
+
zhenhuan-uni 最适合以下场景:
|
|
191
|
+
|
|
192
|
+
| 场景 | 说明 |
|
|
193
|
+
|------|------|
|
|
194
|
+
| **模型选择** | 多个 LLM 模型同时回答,ELO 排名自动选出最优 |
|
|
195
|
+
| **创意竞争** | 同一个创意任务多人竞标,评审选出最佳方案 |
|
|
196
|
+
| **Prompt 优化** | 同一个 Agent 不同 prompt 版本赛马比较 |
|
|
197
|
+
| **团队绩效** | 模拟真实团队竞争压力,激发 Agent 潜力 |
|
|
198
|
+
| **A/B 测试** | 用赛马机制实现持续的 A/B 测试框架 |
|
package/LICENSE
ADDED
|
@@ -0,0 +1,21 @@
|
|
|
1
|
+
MIT License
|
|
2
|
+
|
|
3
|
+
Copyright (c) 2026 agents-uni
|
|
4
|
+
|
|
5
|
+
Permission is hereby granted, free of charge, to any person obtaining a copy
|
|
6
|
+
of this software and associated documentation files (the "Software"), to deal
|
|
7
|
+
in the Software without restriction, including without limitation the rights
|
|
8
|
+
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
|
|
9
|
+
copies of the Software, and to permit persons to whom the Software is
|
|
10
|
+
furnished to do so, subject to the following conditions:
|
|
11
|
+
|
|
12
|
+
The above copyright notice and this permission notice shall be included in all
|
|
13
|
+
copies or substantial portions of the Software.
|
|
14
|
+
|
|
15
|
+
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
|
|
16
|
+
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
|
|
17
|
+
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
|
|
18
|
+
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
|
|
19
|
+
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
|
|
20
|
+
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
|
|
21
|
+
SOFTWARE.
|