claude-memory-layer 1.0.0
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/.claude-plugin/commands/memory-forget.md +42 -0
- package/.claude-plugin/commands/memory-history.md +34 -0
- package/.claude-plugin/commands/memory-import.md +56 -0
- package/.claude-plugin/commands/memory-list.md +37 -0
- package/.claude-plugin/commands/memory-search.md +36 -0
- package/.claude-plugin/commands/memory-stats.md +34 -0
- package/.claude-plugin/hooks.json +59 -0
- package/.claude-plugin/plugin.json +24 -0
- package/.history/package_20260201112328.json +45 -0
- package/.history/package_20260201113602.json +45 -0
- package/.history/package_20260201113713.json +45 -0
- package/.history/package_20260201114110.json +45 -0
- package/Memo.txt +558 -0
- package/README.md +520 -0
- package/context.md +636 -0
- package/dist/.claude-plugin/commands/memory-forget.md +42 -0
- package/dist/.claude-plugin/commands/memory-history.md +34 -0
- package/dist/.claude-plugin/commands/memory-import.md +56 -0
- package/dist/.claude-plugin/commands/memory-list.md +37 -0
- package/dist/.claude-plugin/commands/memory-search.md +36 -0
- package/dist/.claude-plugin/commands/memory-stats.md +34 -0
- package/dist/.claude-plugin/hooks.json +59 -0
- package/dist/.claude-plugin/plugin.json +24 -0
- package/dist/cli/index.js +3539 -0
- package/dist/cli/index.js.map +7 -0
- package/dist/core/index.js +4408 -0
- package/dist/core/index.js.map +7 -0
- package/dist/hooks/session-end.js +2971 -0
- package/dist/hooks/session-end.js.map +7 -0
- package/dist/hooks/session-start.js +2969 -0
- package/dist/hooks/session-start.js.map +7 -0
- package/dist/hooks/stop.js +3123 -0
- package/dist/hooks/stop.js.map +7 -0
- package/dist/hooks/user-prompt-submit.js +2960 -0
- package/dist/hooks/user-prompt-submit.js.map +7 -0
- package/dist/services/memory-service.js +2931 -0
- package/dist/services/memory-service.js.map +7 -0
- package/package.json +45 -0
- package/plan.md +1642 -0
- package/scripts/build.ts +102 -0
- package/spec.md +624 -0
- package/specs/citations-system/context.md +243 -0
- package/specs/citations-system/plan.md +495 -0
- package/specs/citations-system/spec.md +371 -0
- package/specs/endless-mode/context.md +305 -0
- package/specs/endless-mode/plan.md +620 -0
- package/specs/endless-mode/spec.md +455 -0
- package/specs/entity-edge-model/context.md +401 -0
- package/specs/entity-edge-model/plan.md +459 -0
- package/specs/entity-edge-model/spec.md +391 -0
- package/specs/evidence-aligner-v2/context.md +401 -0
- package/specs/evidence-aligner-v2/plan.md +303 -0
- package/specs/evidence-aligner-v2/spec.md +312 -0
- package/specs/mcp-desktop-integration/context.md +278 -0
- package/specs/mcp-desktop-integration/plan.md +550 -0
- package/specs/mcp-desktop-integration/spec.md +494 -0
- package/specs/post-tool-use-hook/context.md +319 -0
- package/specs/post-tool-use-hook/plan.md +469 -0
- package/specs/post-tool-use-hook/spec.md +364 -0
- package/specs/private-tags/context.md +288 -0
- package/specs/private-tags/plan.md +412 -0
- package/specs/private-tags/spec.md +345 -0
- package/specs/progressive-disclosure/context.md +346 -0
- package/specs/progressive-disclosure/plan.md +663 -0
- package/specs/progressive-disclosure/spec.md +415 -0
- package/specs/task-entity-system/context.md +297 -0
- package/specs/task-entity-system/plan.md +301 -0
- package/specs/task-entity-system/spec.md +314 -0
- package/specs/vector-outbox-v2/context.md +470 -0
- package/specs/vector-outbox-v2/plan.md +562 -0
- package/specs/vector-outbox-v2/spec.md +466 -0
- package/specs/web-viewer-ui/context.md +384 -0
- package/specs/web-viewer-ui/plan.md +797 -0
- package/specs/web-viewer-ui/spec.md +516 -0
- package/src/cli/index.ts +570 -0
- package/src/core/canonical-key.ts +186 -0
- package/src/core/citation-generator.ts +63 -0
- package/src/core/consolidated-store.ts +279 -0
- package/src/core/consolidation-worker.ts +384 -0
- package/src/core/context-formatter.ts +276 -0
- package/src/core/continuity-manager.ts +336 -0
- package/src/core/edge-repo.ts +324 -0
- package/src/core/embedder.ts +124 -0
- package/src/core/entity-repo.ts +342 -0
- package/src/core/event-store.ts +672 -0
- package/src/core/evidence-aligner.ts +635 -0
- package/src/core/graduation.ts +365 -0
- package/src/core/index.ts +32 -0
- package/src/core/matcher.ts +210 -0
- package/src/core/metadata-extractor.ts +203 -0
- package/src/core/privacy/filter.ts +179 -0
- package/src/core/privacy/index.ts +20 -0
- package/src/core/privacy/tag-parser.ts +145 -0
- package/src/core/progressive-retriever.ts +415 -0
- package/src/core/retriever.ts +235 -0
- package/src/core/task/blocker-resolver.ts +325 -0
- package/src/core/task/index.ts +9 -0
- package/src/core/task/task-matcher.ts +238 -0
- package/src/core/task/task-projector.ts +345 -0
- package/src/core/task/task-resolver.ts +414 -0
- package/src/core/types.ts +841 -0
- package/src/core/vector-outbox.ts +295 -0
- package/src/core/vector-store.ts +182 -0
- package/src/core/vector-worker.ts +488 -0
- package/src/core/working-set-store.ts +244 -0
- package/src/hooks/post-tool-use.ts +127 -0
- package/src/hooks/session-end.ts +78 -0
- package/src/hooks/session-start.ts +57 -0
- package/src/hooks/stop.ts +78 -0
- package/src/hooks/user-prompt-submit.ts +54 -0
- package/src/mcp/handlers.ts +212 -0
- package/src/mcp/index.ts +47 -0
- package/src/mcp/tools.ts +78 -0
- package/src/server/api/citations.ts +101 -0
- package/src/server/api/events.ts +101 -0
- package/src/server/api/index.ts +18 -0
- package/src/server/api/search.ts +98 -0
- package/src/server/api/sessions.ts +111 -0
- package/src/server/api/stats.ts +97 -0
- package/src/server/index.ts +91 -0
- package/src/services/memory-service.ts +626 -0
- package/src/services/session-history-importer.ts +367 -0
- package/tests/canonical-key.test.ts +101 -0
- package/tests/evidence-aligner.test.ts +152 -0
- package/tests/matcher.test.ts +112 -0
- package/tsconfig.json +24 -0
- package/vitest.config.ts +15 -0
|
@@ -0,0 +1,345 @@
|
|
|
1
|
+
# Private Tags Specification
|
|
2
|
+
|
|
3
|
+
> **Version**: 1.0.0
|
|
4
|
+
> **Status**: Draft
|
|
5
|
+
> **Created**: 2026-02-01
|
|
6
|
+
> **Reference**: claude-mem (thedotmack/claude-mem)
|
|
7
|
+
|
|
8
|
+
## 1. 개요
|
|
9
|
+
|
|
10
|
+
### 1.1 문제 정의
|
|
11
|
+
|
|
12
|
+
현재 프라이버시 필터링의 한계:
|
|
13
|
+
|
|
14
|
+
1. **패턴 기반만 지원**: `password`, `api_key` 등 고정 패턴만 필터링
|
|
15
|
+
2. **사용자 제어 부족**: 특정 내용을 명시적으로 제외할 방법 없음
|
|
16
|
+
3. **컨텍스트 무시**: 의도적으로 공유하고 싶지 않은 대화 부분 지정 불가
|
|
17
|
+
|
|
18
|
+
### 1.2 해결 방향
|
|
19
|
+
|
|
20
|
+
**명시적 `<private>` 태그 지원**:
|
|
21
|
+
- 사용자가 직접 비공개 영역 지정
|
|
22
|
+
- 태그 내 내용은 메모리에 저장되지 않음
|
|
23
|
+
- 패턴 기반 필터링과 병행
|
|
24
|
+
|
|
25
|
+
## 2. 핵심 개념
|
|
26
|
+
|
|
27
|
+
### 2.1 태그 문법
|
|
28
|
+
|
|
29
|
+
```markdown
|
|
30
|
+
이것은 저장됩니다.
|
|
31
|
+
|
|
32
|
+
<private>
|
|
33
|
+
이 부분은 메모리에 저장되지 않습니다.
|
|
34
|
+
API_KEY=sk-xxxx
|
|
35
|
+
SECRET_TOKEN=abc123
|
|
36
|
+
</private>
|
|
37
|
+
|
|
38
|
+
이것도 저장됩니다.
|
|
39
|
+
```
|
|
40
|
+
|
|
41
|
+
### 2.2 태그 변형
|
|
42
|
+
|
|
43
|
+
```typescript
|
|
44
|
+
// 지원하는 태그 형식
|
|
45
|
+
const PRIVATE_TAG_PATTERNS = [
|
|
46
|
+
/<private>[\s\S]*?<\/private>/gi, // 기본
|
|
47
|
+
/<private\s*\/>[\s\S]*?<\/private>/gi, // self-closing 시작
|
|
48
|
+
/\[private\][\s\S]*?\[\/private\]/gi, // 대괄호 형식
|
|
49
|
+
/<!--\s*private\s*-->[\s\S]*?<!--\s*\/private\s*-->/gi // HTML 주석 형식
|
|
50
|
+
];
|
|
51
|
+
```
|
|
52
|
+
|
|
53
|
+
### 2.3 중첩 처리
|
|
54
|
+
|
|
55
|
+
```markdown
|
|
56
|
+
<private>
|
|
57
|
+
외부 비공개
|
|
58
|
+
<private>
|
|
59
|
+
중첩된 비공개 (지원하지 않음 - 외부 태그만 처리)
|
|
60
|
+
</private>
|
|
61
|
+
내용 계속
|
|
62
|
+
</private>
|
|
63
|
+
```
|
|
64
|
+
|
|
65
|
+
## 3. 처리 로직
|
|
66
|
+
|
|
67
|
+
### 3.1 파싱 알고리즘
|
|
68
|
+
|
|
69
|
+
```typescript
|
|
70
|
+
interface PrivateSection {
|
|
71
|
+
start: number;
|
|
72
|
+
end: number;
|
|
73
|
+
content: string;
|
|
74
|
+
}
|
|
75
|
+
|
|
76
|
+
function findPrivateSections(text: string): PrivateSection[] {
|
|
77
|
+
const sections: PrivateSection[] = [];
|
|
78
|
+
const regex = /<private>([\s\S]*?)<\/private>/gi;
|
|
79
|
+
|
|
80
|
+
let match;
|
|
81
|
+
while ((match = regex.exec(text)) !== null) {
|
|
82
|
+
sections.push({
|
|
83
|
+
start: match.index,
|
|
84
|
+
end: match.index + match[0].length,
|
|
85
|
+
content: match[1]
|
|
86
|
+
});
|
|
87
|
+
}
|
|
88
|
+
|
|
89
|
+
return sections;
|
|
90
|
+
}
|
|
91
|
+
|
|
92
|
+
function removePrivateSections(text: string): string {
|
|
93
|
+
return text.replace(/<private>[\s\S]*?<\/private>/gi, '[PRIVATE]');
|
|
94
|
+
}
|
|
95
|
+
```
|
|
96
|
+
|
|
97
|
+
### 3.2 저장 전 필터링
|
|
98
|
+
|
|
99
|
+
```typescript
|
|
100
|
+
async function storeWithPrivacyFilter(content: string): Promise<string> {
|
|
101
|
+
// 1. <private> 태그 제거
|
|
102
|
+
let filtered = removePrivateSections(content);
|
|
103
|
+
|
|
104
|
+
// 2. 패턴 기반 필터링 (기존)
|
|
105
|
+
filtered = maskSensitivePatterns(filtered);
|
|
106
|
+
|
|
107
|
+
// 3. 빈 줄 정리
|
|
108
|
+
filtered = filtered.replace(/\n{3,}/g, '\n\n');
|
|
109
|
+
|
|
110
|
+
return filtered;
|
|
111
|
+
}
|
|
112
|
+
```
|
|
113
|
+
|
|
114
|
+
### 3.3 마커 옵션
|
|
115
|
+
|
|
116
|
+
```typescript
|
|
117
|
+
interface PrivacyConfig {
|
|
118
|
+
privateTag: {
|
|
119
|
+
enabled: boolean;
|
|
120
|
+
marker: '[PRIVATE]' | '[REDACTED]' | ''; // 대체 텍스트
|
|
121
|
+
preserveStructure: boolean; // 줄바꿈 유지 여부
|
|
122
|
+
};
|
|
123
|
+
}
|
|
124
|
+
|
|
125
|
+
// preserveStructure: true
|
|
126
|
+
"Before\n<private>\nSecret\nData\n</private>\nAfter"
|
|
127
|
+
→ "Before\n[PRIVATE]\n\n\nAfter"
|
|
128
|
+
|
|
129
|
+
// preserveStructure: false
|
|
130
|
+
"Before\n<private>\nSecret\nData\n</private>\nAfter"
|
|
131
|
+
→ "Before\n[PRIVATE]\nAfter"
|
|
132
|
+
```
|
|
133
|
+
|
|
134
|
+
## 4. 데이터 스키마
|
|
135
|
+
|
|
136
|
+
### 4.1 이벤트 메타데이터
|
|
137
|
+
|
|
138
|
+
```typescript
|
|
139
|
+
const EventPayloadSchema = z.object({
|
|
140
|
+
content: z.string(),
|
|
141
|
+
// 프라이버시 메타데이터 추가
|
|
142
|
+
privacy: z.object({
|
|
143
|
+
hasPrivateSections: z.boolean(),
|
|
144
|
+
privateCount: z.number(),
|
|
145
|
+
originalLength: z.number(),
|
|
146
|
+
filteredLength: z.number()
|
|
147
|
+
}).optional()
|
|
148
|
+
});
|
|
149
|
+
```
|
|
150
|
+
|
|
151
|
+
### 4.2 통계
|
|
152
|
+
|
|
153
|
+
```typescript
|
|
154
|
+
interface PrivacyStats {
|
|
155
|
+
totalPrivateSections: number;
|
|
156
|
+
totalCharactersFiltered: number;
|
|
157
|
+
sessionsWithPrivate: number;
|
|
158
|
+
}
|
|
159
|
+
```
|
|
160
|
+
|
|
161
|
+
## 5. 사용 시나리오
|
|
162
|
+
|
|
163
|
+
### 5.1 API 키 보호
|
|
164
|
+
|
|
165
|
+
```markdown
|
|
166
|
+
User: 이 API 키로 요청해줘
|
|
167
|
+
|
|
168
|
+
<private>
|
|
169
|
+
OPENAI_API_KEY=sk-proj-xxxxxxxxxxxxxxxxxxxx
|
|
170
|
+
</private>
|
|
171
|
+
|
|
172
|
+
응답 형식은 JSON으로 해줘.
|
|
173
|
+
```
|
|
174
|
+
|
|
175
|
+
**저장 결과**:
|
|
176
|
+
```
|
|
177
|
+
User: 이 API 키로 요청해줘
|
|
178
|
+
|
|
179
|
+
[PRIVATE]
|
|
180
|
+
|
|
181
|
+
응답 형식은 JSON으로 해줘.
|
|
182
|
+
```
|
|
183
|
+
|
|
184
|
+
### 5.2 민감한 비즈니스 로직
|
|
185
|
+
|
|
186
|
+
```markdown
|
|
187
|
+
User: 다음 알고리즘을 최적화해줘
|
|
188
|
+
|
|
189
|
+
<private>
|
|
190
|
+
// 회사 기밀 알고리즘
|
|
191
|
+
function proprietaryAlgorithm() {
|
|
192
|
+
// ...
|
|
193
|
+
}
|
|
194
|
+
</private>
|
|
195
|
+
|
|
196
|
+
특히 시간 복잡도를 개선하고 싶어.
|
|
197
|
+
```
|
|
198
|
+
|
|
199
|
+
### 5.3 개인 정보
|
|
200
|
+
|
|
201
|
+
```markdown
|
|
202
|
+
User: 이메일 템플릿 작성해줘
|
|
203
|
+
|
|
204
|
+
<private>
|
|
205
|
+
받는 사람: john.doe@company.com
|
|
206
|
+
참조: secret-team@company.com
|
|
207
|
+
</private>
|
|
208
|
+
|
|
209
|
+
공식적인 톤으로 작성해줘.
|
|
210
|
+
```
|
|
211
|
+
|
|
212
|
+
## 6. 검색 영향
|
|
213
|
+
|
|
214
|
+
### 6.1 벡터 검색
|
|
215
|
+
|
|
216
|
+
- `[PRIVATE]` 마커는 임베딩에 포함
|
|
217
|
+
- 원본 private 내용은 검색 불가
|
|
218
|
+
- 주변 컨텍스트는 검색 가능
|
|
219
|
+
|
|
220
|
+
### 6.2 전문 검색 (FTS)
|
|
221
|
+
|
|
222
|
+
```sql
|
|
223
|
+
-- [PRIVATE] 마커 제외 검색
|
|
224
|
+
SELECT * FROM events_fts
|
|
225
|
+
WHERE content MATCH :query
|
|
226
|
+
AND content NOT LIKE '%[PRIVATE]%';
|
|
227
|
+
|
|
228
|
+
-- 또는 마커 포함 결과도 표시
|
|
229
|
+
SELECT * FROM events_fts
|
|
230
|
+
WHERE content MATCH :query;
|
|
231
|
+
```
|
|
232
|
+
|
|
233
|
+
## 7. UI 표시
|
|
234
|
+
|
|
235
|
+
### 7.1 CLI 출력
|
|
236
|
+
|
|
237
|
+
```
|
|
238
|
+
$ code-memory history
|
|
239
|
+
|
|
240
|
+
[2026-02-01 14:00] User Prompt
|
|
241
|
+
이 API 키로 요청해줘
|
|
242
|
+
[🔒 PRIVATE CONTENT REDACTED]
|
|
243
|
+
응답 형식은 JSON으로 해줘.
|
|
244
|
+
```
|
|
245
|
+
|
|
246
|
+
### 7.2 Web Viewer
|
|
247
|
+
|
|
248
|
+
```html
|
|
249
|
+
<div class="event-content">
|
|
250
|
+
<p>이 API 키로 요청해줘</p>
|
|
251
|
+
<div class="private-marker">
|
|
252
|
+
<span class="icon">🔒</span>
|
|
253
|
+
<span>Private content (not stored)</span>
|
|
254
|
+
</div>
|
|
255
|
+
<p>응답 형식은 JSON으로 해줘.</p>
|
|
256
|
+
</div>
|
|
257
|
+
```
|
|
258
|
+
|
|
259
|
+
## 8. 설정
|
|
260
|
+
|
|
261
|
+
### 8.1 설정 스키마
|
|
262
|
+
|
|
263
|
+
```typescript
|
|
264
|
+
const PrivacyConfigSchema = z.object({
|
|
265
|
+
// 기존 패턴 기반 필터링
|
|
266
|
+
excludePatterns: z.array(z.string()).default([
|
|
267
|
+
'password', 'secret', 'api_key', 'token', 'bearer'
|
|
268
|
+
]),
|
|
269
|
+
|
|
270
|
+
// 새로운 태그 기반 필터링
|
|
271
|
+
privateTags: z.object({
|
|
272
|
+
enabled: z.boolean().default(true),
|
|
273
|
+
marker: z.enum(['[PRIVATE]', '[REDACTED]', '']).default('[PRIVATE]'),
|
|
274
|
+
preserveLineCount: z.boolean().default(false),
|
|
275
|
+
supportedFormats: z.array(z.enum([
|
|
276
|
+
'xml', // <private>
|
|
277
|
+
'bracket', // [private]
|
|
278
|
+
'comment' // <!-- private -->
|
|
279
|
+
])).default(['xml'])
|
|
280
|
+
}),
|
|
281
|
+
|
|
282
|
+
// 자동 감지
|
|
283
|
+
autoDetect: z.object({
|
|
284
|
+
enabled: z.boolean().default(true),
|
|
285
|
+
patterns: z.array(z.string()) // 정규식
|
|
286
|
+
}).optional()
|
|
287
|
+
});
|
|
288
|
+
```
|
|
289
|
+
|
|
290
|
+
### 8.2 설정 예시
|
|
291
|
+
|
|
292
|
+
```json
|
|
293
|
+
{
|
|
294
|
+
"privacy": {
|
|
295
|
+
"excludePatterns": ["password", "secret", "api_key"],
|
|
296
|
+
"privateTags": {
|
|
297
|
+
"enabled": true,
|
|
298
|
+
"marker": "[PRIVATE]",
|
|
299
|
+
"supportedFormats": ["xml", "bracket"]
|
|
300
|
+
}
|
|
301
|
+
}
|
|
302
|
+
}
|
|
303
|
+
```
|
|
304
|
+
|
|
305
|
+
## 9. 경계 케이스
|
|
306
|
+
|
|
307
|
+
### 9.1 불완전한 태그
|
|
308
|
+
|
|
309
|
+
```markdown
|
|
310
|
+
<private>
|
|
311
|
+
시작은 있지만 끝이 없음
|
|
312
|
+
```
|
|
313
|
+
→ 끝까지 private로 처리? 또는 무시?
|
|
314
|
+
|
|
315
|
+
**결정**: 불완전한 태그는 무시 (보수적 접근)
|
|
316
|
+
|
|
317
|
+
### 9.2 코드 블록 내 태그
|
|
318
|
+
|
|
319
|
+
```markdown
|
|
320
|
+
```python
|
|
321
|
+
# 예시 코드
|
|
322
|
+
print("<private>not actually private</private>")
|
|
323
|
+
```
|
|
324
|
+
```
|
|
325
|
+
|
|
326
|
+
**결정**: 코드 블록 내 태그는 무시 (리터럴로 취급)
|
|
327
|
+
|
|
328
|
+
### 9.3 빈 태그
|
|
329
|
+
|
|
330
|
+
```markdown
|
|
331
|
+
<private></private>
|
|
332
|
+
<private> </private>
|
|
333
|
+
```
|
|
334
|
+
|
|
335
|
+
**결정**: 빈 태그는 완전히 제거 (마커도 남기지 않음)
|
|
336
|
+
|
|
337
|
+
## 10. 성공 기준
|
|
338
|
+
|
|
339
|
+
- [ ] `<private>` 태그 내 내용이 메모리에 저장되지 않음
|
|
340
|
+
- [ ] `[PRIVATE]` 마커로 대체됨
|
|
341
|
+
- [ ] 기존 패턴 기반 필터링과 병행 동작
|
|
342
|
+
- [ ] 불완전한 태그 안전하게 처리
|
|
343
|
+
- [ ] 코드 블록 내 태그 무시
|
|
344
|
+
- [ ] 통계에 필터링 정보 포함
|
|
345
|
+
- [ ] CLI와 Web UI에서 적절히 표시
|
|
@@ -0,0 +1,346 @@
|
|
|
1
|
+
# Progressive Disclosure Context
|
|
2
|
+
|
|
3
|
+
> **Version**: 1.0.0
|
|
4
|
+
> **Created**: 2026-02-01
|
|
5
|
+
|
|
6
|
+
## 1. 배경
|
|
7
|
+
|
|
8
|
+
### 1.1 claude-mem의 접근 방식
|
|
9
|
+
|
|
10
|
+
claude-mem은 토큰 효율성을 위해 3-Layer Progressive Disclosure 패턴을 사용:
|
|
11
|
+
|
|
12
|
+
```
|
|
13
|
+
Layer 1: Search Index (~50-100 tokens per result)
|
|
14
|
+
↓ (필터링)
|
|
15
|
+
Layer 2: Timeline (~200 tokens)
|
|
16
|
+
↓ (선택)
|
|
17
|
+
Layer 3: Full Details (~500-1000 tokens per result)
|
|
18
|
+
```
|
|
19
|
+
|
|
20
|
+
**주요 특징**:
|
|
21
|
+
- "필터링 후 상세 조회" 전략
|
|
22
|
+
- 약 10배 토큰 절약
|
|
23
|
+
- 사용자/AI가 필요한 것만 확장
|
|
24
|
+
|
|
25
|
+
**구현 방식**:
|
|
26
|
+
- MCP 도구로 각 레이어 노출
|
|
27
|
+
- `search` → `timeline` → `get_observations` 순서
|
|
28
|
+
- `__IMPORTANT` 도구로 워크플로우 문서화
|
|
29
|
+
|
|
30
|
+
### 1.2 현재 code-memory의 상황
|
|
31
|
+
|
|
32
|
+
현재 검색은 단일 레이어:
|
|
33
|
+
|
|
34
|
+
```typescript
|
|
35
|
+
// 현재 Retriever.search()
|
|
36
|
+
async search(query: string): Promise<SearchResult[]> {
|
|
37
|
+
const vectorResults = await this.vectorStore.search(query, { topK: 5 });
|
|
38
|
+
const events = await this.enrichWithEvents(vectorResults);
|
|
39
|
+
return events; // 전체 내용 반환
|
|
40
|
+
}
|
|
41
|
+
```
|
|
42
|
+
|
|
43
|
+
**문제점**:
|
|
44
|
+
1. 모든 결과의 전체 내용을 가져옴
|
|
45
|
+
2. 컨텍스트 크기가 토큰 제한에 쉽게 도달
|
|
46
|
+
3. 관련성 낮은 내용도 포함됨
|
|
47
|
+
|
|
48
|
+
### 1.3 토큰 비용 분석
|
|
49
|
+
|
|
50
|
+
| 시나리오 | 현재 방식 | Progressive 방식 |
|
|
51
|
+
|----------|----------|-----------------|
|
|
52
|
+
| 5개 결과, 1개만 관련 | ~5,000 tokens | ~600 tokens |
|
|
53
|
+
| 10개 결과, 2개만 관련 | ~10,000 tokens | ~1,200 tokens |
|
|
54
|
+
| 20개 결과, 3개만 관련 | ~20,000 tokens | ~2,000 tokens |
|
|
55
|
+
|
|
56
|
+
**절약 효과**: 평균 80-90% 토큰 감소
|
|
57
|
+
|
|
58
|
+
## 2. MCP 도구 설계 참고
|
|
59
|
+
|
|
60
|
+
### 2.1 claude-mem의 MCP 도구
|
|
61
|
+
|
|
62
|
+
```typescript
|
|
63
|
+
// claude-mem MCP tools (추정)
|
|
64
|
+
{
|
|
65
|
+
tools: [
|
|
66
|
+
{
|
|
67
|
+
name: 'search',
|
|
68
|
+
description: 'Search memories, returns index only',
|
|
69
|
+
input_schema: {
|
|
70
|
+
query: 'string',
|
|
71
|
+
filters: { type: 'string', date: 'string' }
|
|
72
|
+
},
|
|
73
|
+
output: 'SearchIndexItem[]'
|
|
74
|
+
},
|
|
75
|
+
{
|
|
76
|
+
name: 'timeline',
|
|
77
|
+
description: 'Get timeline context around observations',
|
|
78
|
+
input_schema: {
|
|
79
|
+
observation_ids: 'string[]',
|
|
80
|
+
window_size: 'number'
|
|
81
|
+
},
|
|
82
|
+
output: 'TimelineItem[]'
|
|
83
|
+
},
|
|
84
|
+
{
|
|
85
|
+
name: 'get_observations',
|
|
86
|
+
description: 'Get full observation details by IDs',
|
|
87
|
+
input_schema: {
|
|
88
|
+
ids: 'string[]'
|
|
89
|
+
},
|
|
90
|
+
output: 'Observation[]'
|
|
91
|
+
},
|
|
92
|
+
{
|
|
93
|
+
name: '__IMPORTANT',
|
|
94
|
+
description: 'Workflow documentation for Claude',
|
|
95
|
+
// Claude가 이 도구를 보고 검색 워크플로우를 이해
|
|
96
|
+
}
|
|
97
|
+
]
|
|
98
|
+
}
|
|
99
|
+
```
|
|
100
|
+
|
|
101
|
+
### 2.2 워크플로우 문서화
|
|
102
|
+
|
|
103
|
+
```markdown
|
|
104
|
+
# Memory Search Workflow
|
|
105
|
+
|
|
106
|
+
1. **Always start with `search`** to get compact index
|
|
107
|
+
2. **Review scores** before expanding
|
|
108
|
+
3. **Use `timeline`** if context is needed
|
|
109
|
+
4. **Only call `get_observations`** for selected IDs
|
|
110
|
+
5. **Never** fetch all details at once
|
|
111
|
+
```
|
|
112
|
+
|
|
113
|
+
## 3. 기존 코드와의 관계
|
|
114
|
+
|
|
115
|
+
### 3.1 retriever.ts
|
|
116
|
+
|
|
117
|
+
현재 Retriever 구조:
|
|
118
|
+
|
|
119
|
+
```typescript
|
|
120
|
+
export class Retriever {
|
|
121
|
+
async search(query: string): Promise<SearchResult[]> {
|
|
122
|
+
// 1. 벡터 검색
|
|
123
|
+
const vectorResults = await this.vectorStore.search(query);
|
|
124
|
+
|
|
125
|
+
// 2. 이벤트 enrichment (전체 로드)
|
|
126
|
+
const enriched = await Promise.all(
|
|
127
|
+
vectorResults.map(async (r) => {
|
|
128
|
+
const event = await this.eventStore.findById(r.id);
|
|
129
|
+
return { ...r, content: event.payload.content }; // 전체 내용
|
|
130
|
+
})
|
|
131
|
+
);
|
|
132
|
+
|
|
133
|
+
return enriched;
|
|
134
|
+
}
|
|
135
|
+
}
|
|
136
|
+
```
|
|
137
|
+
|
|
138
|
+
**수정 방향**:
|
|
139
|
+
- `search()` → `searchIndex()` (Layer 1)
|
|
140
|
+
- `getTimeline()` 추가 (Layer 2)
|
|
141
|
+
- `getDetails()` 추가 (Layer 3)
|
|
142
|
+
- `smartSearch()` 추가 (자동 확장)
|
|
143
|
+
|
|
144
|
+
### 3.2 matcher.ts
|
|
145
|
+
|
|
146
|
+
현재 Matcher는 confidence 기반 분류:
|
|
147
|
+
|
|
148
|
+
```typescript
|
|
149
|
+
export function matchSearchResults(results: SearchResult[]): MatchResult {
|
|
150
|
+
const high = results.filter(r => r.score >= 0.92);
|
|
151
|
+
const suggested = results.filter(r => r.score >= 0.75 && r.score < 0.92);
|
|
152
|
+
|
|
153
|
+
return { high, suggested, none: [] };
|
|
154
|
+
}
|
|
155
|
+
```
|
|
156
|
+
|
|
157
|
+
**확장 방향**:
|
|
158
|
+
- 기존 Matcher 로직을 확장 규칙에 통합
|
|
159
|
+
- `high` → 자동 확장 대상
|
|
160
|
+
- `suggested` → Layer 1만 표시
|
|
161
|
+
|
|
162
|
+
### 3.3 vector-store.ts
|
|
163
|
+
|
|
164
|
+
현재 VectorStore 검색:
|
|
165
|
+
|
|
166
|
+
```typescript
|
|
167
|
+
async search(query: string, options: { topK: number }): Promise<VectorSearchResult[]> {
|
|
168
|
+
const queryVector = await this.embedder.embed(query);
|
|
169
|
+
return this.db.search(queryVector, options.topK);
|
|
170
|
+
}
|
|
171
|
+
```
|
|
172
|
+
|
|
173
|
+
**변경 불필요** - 기존 벡터 검색 그대로 사용
|
|
174
|
+
|
|
175
|
+
### 3.4 event-store.ts
|
|
176
|
+
|
|
177
|
+
필요한 추가 메서드:
|
|
178
|
+
|
|
179
|
+
```typescript
|
|
180
|
+
// 주변 이벤트 조회 (타임라인용)
|
|
181
|
+
async findSurrounding(
|
|
182
|
+
sessionId: string,
|
|
183
|
+
timestamp: Date,
|
|
184
|
+
windowSize: number
|
|
185
|
+
): Promise<Event[]> {
|
|
186
|
+
return this.db.query(`
|
|
187
|
+
SELECT * FROM events
|
|
188
|
+
WHERE session_id = ?
|
|
189
|
+
AND timestamp BETWEEN
|
|
190
|
+
datetime(?, '-${windowSize} hours') AND
|
|
191
|
+
datetime(?, '+${windowSize} hours')
|
|
192
|
+
ORDER BY timestamp
|
|
193
|
+
`, [sessionId, timestamp, timestamp]);
|
|
194
|
+
}
|
|
195
|
+
```
|
|
196
|
+
|
|
197
|
+
## 4. 설계 결정 사항
|
|
198
|
+
|
|
199
|
+
### 4.1 왜 3개 레이어인가?
|
|
200
|
+
|
|
201
|
+
**대안 1: 2개 레이어 (Index + Detail)**
|
|
202
|
+
- 단점: 시간 맥락 파악 어려움
|
|
203
|
+
- 단점: 모호한 결과 처리 어려움
|
|
204
|
+
|
|
205
|
+
**대안 2: 4개 이상 레이어**
|
|
206
|
+
- 단점: 복잡도 증가
|
|
207
|
+
- 단점: 실용적 이점 미미
|
|
208
|
+
|
|
209
|
+
**선택: 3개 레이어**
|
|
210
|
+
- Layer 1: What (무엇이 있는지)
|
|
211
|
+
- Layer 2: When (언제 발생했는지)
|
|
212
|
+
- Layer 3: How (구체적으로 어떻게)
|
|
213
|
+
|
|
214
|
+
### 4.2 자동 확장 vs 수동 확장
|
|
215
|
+
|
|
216
|
+
**자동 확장 장점**:
|
|
217
|
+
- 사용자 경험 향상
|
|
218
|
+
- "자세히 알려줘" 명령 불필요
|
|
219
|
+
- 높은 신뢰도 결과 즉시 제공
|
|
220
|
+
|
|
221
|
+
**자동 확장 단점**:
|
|
222
|
+
- 토큰 예측 어려움
|
|
223
|
+
- 때로는 불필요한 확장
|
|
224
|
+
|
|
225
|
+
**결론: 하이브리드 접근**
|
|
226
|
+
- 높은 신뢰도 → 자동 확장
|
|
227
|
+
- 중간 신뢰도 → Index만 제공 + 힌트
|
|
228
|
+
- 낮은 신뢰도 → Index만 제공
|
|
229
|
+
|
|
230
|
+
### 4.3 요약 생성 전략
|
|
231
|
+
|
|
232
|
+
**Option 1: LLM 요약**
|
|
233
|
+
- 장점: 고품질 요약
|
|
234
|
+
- 단점: 비용, 지연시간
|
|
235
|
+
|
|
236
|
+
**Option 2: 규칙 기반 추출**
|
|
237
|
+
- 장점: 빠름, 무료
|
|
238
|
+
- 단점: 품질 제한
|
|
239
|
+
|
|
240
|
+
**선택: 규칙 기반 + 캐싱**
|
|
241
|
+
- 첫 문장 추출
|
|
242
|
+
- 코드 블록 축약
|
|
243
|
+
- 결과 캐싱
|
|
244
|
+
|
|
245
|
+
### 4.4 토큰 추정 방식
|
|
246
|
+
|
|
247
|
+
```typescript
|
|
248
|
+
// 간단한 추정 (정확도 ~85%)
|
|
249
|
+
function estimateTokens(text: string): number {
|
|
250
|
+
return Math.ceil(text.length / 4);
|
|
251
|
+
}
|
|
252
|
+
|
|
253
|
+
// 또는 정확한 추정 (tiktoken 사용)
|
|
254
|
+
import { encoding_for_model } from 'tiktoken';
|
|
255
|
+
const enc = encoding_for_model('gpt-4');
|
|
256
|
+
function estimateTokens(text: string): number {
|
|
257
|
+
return enc.encode(text).length;
|
|
258
|
+
}
|
|
259
|
+
```
|
|
260
|
+
|
|
261
|
+
**결론**: 간단한 추정 사용 (성능 우선)
|
|
262
|
+
|
|
263
|
+
## 5. 성능 고려사항
|
|
264
|
+
|
|
265
|
+
### 5.1 검색 지연시간
|
|
266
|
+
|
|
267
|
+
| 레이어 | 목표 지연시간 | 병목 |
|
|
268
|
+
|--------|-------------|------|
|
|
269
|
+
| Layer 1 | < 100ms | 벡터 검색 |
|
|
270
|
+
| Layer 2 | < 200ms | DB 쿼리 |
|
|
271
|
+
| Layer 3 | < 500ms | 다중 조회 |
|
|
272
|
+
|
|
273
|
+
**최적화 전략**:
|
|
274
|
+
- Layer 1: 벡터 인덱스 최적화
|
|
275
|
+
- Layer 2: 세션별 인덱스 활용
|
|
276
|
+
- Layer 3: 배치 조회
|
|
277
|
+
|
|
278
|
+
### 5.2 캐싱 전략
|
|
279
|
+
|
|
280
|
+
```typescript
|
|
281
|
+
// 레이어별 캐시 TTL
|
|
282
|
+
const CACHE_CONFIG = {
|
|
283
|
+
layer1: {
|
|
284
|
+
ttl: 60 * 1000, // 1분 (검색 결과는 자주 변함)
|
|
285
|
+
maxSize: 100
|
|
286
|
+
},
|
|
287
|
+
layer2: {
|
|
288
|
+
ttl: 5 * 60 * 1000, // 5분 (타임라인은 안정적)
|
|
289
|
+
maxSize: 500
|
|
290
|
+
},
|
|
291
|
+
layer3: {
|
|
292
|
+
ttl: 30 * 60 * 1000, // 30분 (상세 내용은 거의 안 변함)
|
|
293
|
+
maxSize: 200
|
|
294
|
+
}
|
|
295
|
+
};
|
|
296
|
+
```
|
|
297
|
+
|
|
298
|
+
### 5.3 메모리 사용
|
|
299
|
+
|
|
300
|
+
- Layer 1 캐시: ~10KB per entry × 100 = ~1MB
|
|
301
|
+
- Layer 2 캐시: ~2KB per entry × 500 = ~1MB
|
|
302
|
+
- Layer 3 캐시: ~10KB per entry × 200 = ~2MB
|
|
303
|
+
- **총 메모리**: ~4MB (허용 범위)
|
|
304
|
+
|
|
305
|
+
## 6. UI/UX 고려사항
|
|
306
|
+
|
|
307
|
+
### 6.1 CLI 출력 포맷
|
|
308
|
+
|
|
309
|
+
```
|
|
310
|
+
🔍 Search Results (5 matches)
|
|
311
|
+
|
|
312
|
+
#1 [mem_abc] DuckDB 스키마 설계 논의 (0.94)
|
|
313
|
+
#2 [mem_def] 타입 시스템 리팩토링 (0.87)
|
|
314
|
+
#3 [mem_ghi] 벡터 저장소 설정 (0.82)
|
|
315
|
+
|
|
316
|
+
💡 Tip: Use "show mem_abc" for details
|
|
317
|
+
|
|
318
|
+
---
|
|
319
|
+
|
|
320
|
+
📅 Timeline (auto-expanded for high confidence)
|
|
321
|
+
|
|
322
|
+
14:00 → User asked about schema design
|
|
323
|
+
14:05 → **[mem_abc]** Discussed DuckDB approach
|
|
324
|
+
14:15 → Follow-up on indexing
|
|
325
|
+
```
|
|
326
|
+
|
|
327
|
+
### 6.2 확장 힌트
|
|
328
|
+
|
|
329
|
+
```typescript
|
|
330
|
+
function formatExpansionHint(result: ProgressiveSearchResult): string {
|
|
331
|
+
if (result.meta.expandedCount === 0) {
|
|
332
|
+
return `Use "show [id]" to see details`;
|
|
333
|
+
}
|
|
334
|
+
if (result.meta.expansionReason === 'ambiguous_multiple_high') {
|
|
335
|
+
return `Multiple matches found. Use "show [id]" for specific details`;
|
|
336
|
+
}
|
|
337
|
+
return '';
|
|
338
|
+
}
|
|
339
|
+
```
|
|
340
|
+
|
|
341
|
+
## 7. 참고 자료
|
|
342
|
+
|
|
343
|
+
- **claude-mem README**: Progressive disclosure pattern, MCP tools
|
|
344
|
+
- **OpenAI Cookbook**: Token counting and optimization
|
|
345
|
+
- **AXIOMMIND**: Principle 7 (Standard JSON) - 포맷 일관성
|
|
346
|
+
- **기존 specs**: retriever.ts, matcher.ts 구현
|