claude-memory-layer 1.0.24 → 1.0.26
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/.claude/settings.local.json +15 -1
- package/dist/cli/index.js +156 -972
- package/dist/cli/index.js.map +4 -4
- package/dist/core/index.js +33 -67
- package/dist/core/index.js.map +3 -3
- package/dist/hooks/post-tool-use.js +183 -968
- package/dist/hooks/post-tool-use.js.map +4 -4
- package/dist/hooks/semantic-daemon.js +150 -966
- package/dist/hooks/semantic-daemon.js.map +4 -4
- package/dist/hooks/session-end.js +150 -966
- package/dist/hooks/session-end.js.map +4 -4
- package/dist/hooks/session-start.js +152 -966
- package/dist/hooks/session-start.js.map +4 -4
- package/dist/hooks/stop.js +158 -966
- package/dist/hooks/stop.js.map +4 -4
- package/dist/hooks/user-prompt-submit.js +152 -968
- package/dist/hooks/user-prompt-submit.js.map +4 -4
- package/dist/server/api/index.js +151 -967
- package/dist/server/api/index.js.map +4 -4
- package/dist/server/index.js +151 -967
- package/dist/server/index.js.map +4 -4
- package/dist/services/memory-service.js +150 -966
- package/dist/services/memory-service.js.map +4 -4
- package/memory/_index.md +2 -0
- package/memory/agent_response/uncategorized/2026-03-04.md +276 -1
- package/memory/agent_response/uncategorized/2026-03-05.md +48 -0
- package/memory/session_summary/uncategorized/2026-03-04.md +20 -1
- package/memory/tool_observation/uncategorized/2026-03-04.md +245 -1
- package/memory/tool_observation/uncategorized/2026-03-05.md +29 -0
- package/memory/user_prompt/uncategorized/2026-03-04.md +193 -1
- package/package.json +1 -2
- package/specs/memory-utilization-improvements/context.md +145 -0
- package/specs/memory-utilization-improvements/plan.md +361 -0
- package/specs/memory-utilization-improvements/spec.md +361 -0
- package/specs/optional-duckdb/context.md +77 -0
- package/specs/optional-duckdb/plan.md +142 -0
- package/specs/optional-duckdb/spec.md +35 -0
- package/src/core/db-wrapper.ts +18 -73
- package/src/core/sqlite-event-store.ts +32 -4
- package/src/hooks/post-tool-use.ts +25 -0
- package/src/hooks/session-start.ts +4 -0
- package/src/hooks/stop.ts +14 -0
- package/src/server/api/utils.ts +1 -1
- package/src/services/memory-service.ts +62 -58
|
@@ -0,0 +1,361 @@
|
|
|
1
|
+
# Plan: Memory Utilization Improvements
|
|
2
|
+
|
|
3
|
+
## 전체 목표
|
|
4
|
+
|
|
5
|
+
f4d5c120 실데이터 분석을 기반으로, 메모리 검색 → Trace 기록 → Graduation → Helpfulness의
|
|
6
|
+
cascade failure를 단계적으로 수정한다.
|
|
7
|
+
|
|
8
|
+
---
|
|
9
|
+
|
|
10
|
+
## Phase 1: Critical Fix (1주차)
|
|
11
|
+
|
|
12
|
+
### Task 1.1 — Retrieval Trace 동기 기록 수정 (IMP-01)
|
|
13
|
+
|
|
14
|
+
**목표**: 검색 실행 시 trace가 항상 DB에 기록되도록
|
|
15
|
+
|
|
16
|
+
**작업 단계**:
|
|
17
|
+
|
|
18
|
+
1. `src/hooks/user-prompt-submit.ts` 읽기
|
|
19
|
+
- trace 기록 코드 위치 확인
|
|
20
|
+
- stdout 출력과의 순서 관계 파악
|
|
21
|
+
|
|
22
|
+
2. `src/core/sqlite-event-store.ts` 읽기
|
|
23
|
+
- `recordRetrievalTrace()` 구현 확인
|
|
24
|
+
- async vs sync 여부 확인
|
|
25
|
+
|
|
26
|
+
3. 수정:
|
|
27
|
+
```typescript
|
|
28
|
+
// Before (추정):
|
|
29
|
+
const memories = await retrieve(query);
|
|
30
|
+
process.stdout.write(formatOutput(memories));
|
|
31
|
+
await store.recordRetrievalTrace({ ... }); // ← hook 종료 후 실행될 수 있음
|
|
32
|
+
|
|
33
|
+
// After:
|
|
34
|
+
const memories = await retrieve(query);
|
|
35
|
+
store.recordRetrievalTraceSync({ ... }); // ← 동기 실행
|
|
36
|
+
process.stdout.write(formatOutput(memories));
|
|
37
|
+
```
|
|
38
|
+
|
|
39
|
+
4. 검증:
|
|
40
|
+
```bash
|
|
41
|
+
# 세션 시작 후 user_prompt 입력
|
|
42
|
+
# 이후 확인:
|
|
43
|
+
sqlite3 ~/.claude-code/memory/projects/f4d5c120/events.sqlite \
|
|
44
|
+
"SELECT COUNT(*) FROM retrieval_traces WHERE created_at > datetime('now', '-1 hour');"
|
|
45
|
+
```
|
|
46
|
+
|
|
47
|
+
**완료 조건**: 검색이 실행된 모든 turn에서 trace 레코드 존재
|
|
48
|
+
|
|
49
|
+
---
|
|
50
|
+
|
|
51
|
+
### Task 1.2 — Tool Observation 필터링 (IMP-02)
|
|
52
|
+
|
|
53
|
+
**목표**: 저장 이벤트의 tool observation 비율을 93% → 30% 이하로
|
|
54
|
+
|
|
55
|
+
**작업 단계**:
|
|
56
|
+
|
|
57
|
+
1. `src/hooks/post-tool-use.ts` 읽기
|
|
58
|
+
- 현재 저장 조건 파악
|
|
59
|
+
- 기존 제외 목록 확인 (TodoRead, TodoWrite)
|
|
60
|
+
|
|
61
|
+
2. `src/core/metadata-extractor.ts` 읽기
|
|
62
|
+
- 중요도 판별 로직 존재 여부 확인
|
|
63
|
+
|
|
64
|
+
3. 필터 로직 추가:
|
|
65
|
+
```typescript
|
|
66
|
+
function shouldStoreToolObservation(toolName: string, input: unknown, output: string): boolean {
|
|
67
|
+
// 항상 저장
|
|
68
|
+
if (['Write', 'Edit', 'MultiEdit'].includes(toolName)) return true;
|
|
69
|
+
|
|
70
|
+
// 항상 제외
|
|
71
|
+
if (['Read', 'Glob', 'TodoRead', 'TodoWrite'].includes(toolName)) return false;
|
|
72
|
+
|
|
73
|
+
// Bash: 오류 또는 중요 키워드
|
|
74
|
+
if (toolName === 'Bash') {
|
|
75
|
+
const exitCode = extractExitCode(output);
|
|
76
|
+
if (exitCode !== 0) return true;
|
|
77
|
+
return IMPORTANT_KEYWORDS.some(kw => output.toLowerCase().includes(kw));
|
|
78
|
+
}
|
|
79
|
+
|
|
80
|
+
// Grep: 결과 10줄 초과 시
|
|
81
|
+
if (toolName === 'Grep') {
|
|
82
|
+
return output.split('\n').length > 10;
|
|
83
|
+
}
|
|
84
|
+
|
|
85
|
+
return false;
|
|
86
|
+
}
|
|
87
|
+
```
|
|
88
|
+
|
|
89
|
+
4. 기존 L0 데이터는 변경하지 않음 (append-only 원칙 유지)
|
|
90
|
+
|
|
91
|
+
**완료 조건**: 새 세션의 tool observation 비율 < 40%
|
|
92
|
+
|
|
93
|
+
---
|
|
94
|
+
|
|
95
|
+
## Phase 2: Quality (2주차)
|
|
96
|
+
|
|
97
|
+
### Task 2.1 — 세션 요약 신뢰성 (IMP-03)
|
|
98
|
+
|
|
99
|
+
**목표**: 세션 요약 생성률 5% → 80% 이상
|
|
100
|
+
|
|
101
|
+
**작업 단계**:
|
|
102
|
+
|
|
103
|
+
1. `src/hooks/session-start.ts` 읽기
|
|
104
|
+
- 백필 로직 (`backfillPreviousSession`) 확인
|
|
105
|
+
- 현재 요약 생성 여부 파악
|
|
106
|
+
|
|
107
|
+
2. `src/hooks/stop.ts` 읽기
|
|
108
|
+
- 요약 생성 로직 위치
|
|
109
|
+
- 실패 시 에러 처리 방식
|
|
110
|
+
|
|
111
|
+
3. session-start에 규칙 기반 요약 생성 추가:
|
|
112
|
+
```typescript
|
|
113
|
+
async function generateRuleBasedSummary(sessionId: string): Promise<string> {
|
|
114
|
+
const events = await store.getSessionEvents(sessionId);
|
|
115
|
+
const prompts = events.filter(e => e.eventType === 'user_prompt');
|
|
116
|
+
const tools = [...new Set(events.filter(e => e.eventType === 'tool_observation')
|
|
117
|
+
.map(e => e.metadata?.toolName))];
|
|
118
|
+
const errors = events.filter(e =>
|
|
119
|
+
e.eventType === 'tool_observation' && e.metadata?.exitCode !== 0
|
|
120
|
+
);
|
|
121
|
+
|
|
122
|
+
return [
|
|
123
|
+
`[${formatDate(events[0].timestamp)}] ${prompts.length}턴 세션.`,
|
|
124
|
+
prompts.length > 0 ? `주요 작업: ${prompts[0].content.slice(0, 100)}` : '',
|
|
125
|
+
tools.length > 0 ? `사용 툴: ${tools.join(', ')}` : '',
|
|
126
|
+
errors.length > 0 ? `오류 발생: ${errors.length}건` : '',
|
|
127
|
+
].filter(Boolean).join(' ');
|
|
128
|
+
}
|
|
129
|
+
```
|
|
130
|
+
|
|
131
|
+
4. session-start 백필 시 호출:
|
|
132
|
+
```typescript
|
|
133
|
+
if (events.length >= 3 && !existingSummary) {
|
|
134
|
+
const summary = await generateRuleBasedSummary(prevSessionId);
|
|
135
|
+
await store.storeEvent({ eventType: 'session_summary', content: summary, ... });
|
|
136
|
+
}
|
|
137
|
+
```
|
|
138
|
+
|
|
139
|
+
**완료 조건**: 백필 실행 후 기존 세션 중 80% 이상에 요약 생성
|
|
140
|
+
|
|
141
|
+
---
|
|
142
|
+
|
|
143
|
+
### Task 2.2 — Graduation Repair CLI (IMP-04)
|
|
144
|
+
|
|
145
|
+
**목표**: 기존 L0 이벤트 중 자격 있는 것들을 L1으로 승격
|
|
146
|
+
|
|
147
|
+
**작업 단계**:
|
|
148
|
+
|
|
149
|
+
1. `src/core/graduation.ts` 읽기
|
|
150
|
+
- 현재 L0→L1 승격 기준 파악
|
|
151
|
+
- `recordAccess()` 호출 위치
|
|
152
|
+
|
|
153
|
+
2. 시간 기반 승격 규칙 추가:
|
|
154
|
+
```typescript
|
|
155
|
+
// 7일 이상 된 user_prompt 이벤트 중 내용이 충분한 것
|
|
156
|
+
const GRADUATION_RULES_L1 = {
|
|
157
|
+
minAge: 7 * 24 * 60 * 60 * 1000, // 7일
|
|
158
|
+
minContentLength: 100,
|
|
159
|
+
eventTypes: ['user_prompt', 'session_summary'],
|
|
160
|
+
};
|
|
161
|
+
```
|
|
162
|
+
|
|
163
|
+
3. CLI 커맨드 추가:
|
|
164
|
+
```
|
|
165
|
+
claude-memory graduation --repair [--project <hash>] [--dry-run]
|
|
166
|
+
```
|
|
167
|
+
출력 예시:
|
|
168
|
+
```
|
|
169
|
+
Analyzing 1587 events...
|
|
170
|
+
Eligible for L1: 43 events (user_prompt: 38, session_summary: 5)
|
|
171
|
+
Eligible for L2: 0 events
|
|
172
|
+
[--dry-run: no changes made]
|
|
173
|
+
Run without --dry-run to apply.
|
|
174
|
+
```
|
|
175
|
+
|
|
176
|
+
**완료 조건**: `--dry-run` 후 승격 후보 확인, 실제 실행 후 L1 이벤트 발생
|
|
177
|
+
|
|
178
|
+
---
|
|
179
|
+
|
|
180
|
+
### Task 2.3 — Embedding 모델 모니터링 (IMP-05)
|
|
181
|
+
|
|
182
|
+
**목표**: 모델 오류 시 자동 폴백 + 대시보드에 상태 표시
|
|
183
|
+
|
|
184
|
+
**작업 단계**:
|
|
185
|
+
|
|
186
|
+
1. `src/hooks/semantic-daemon.ts` 읽기
|
|
187
|
+
- 현재 모델 로딩/폴백 로직
|
|
188
|
+
- 오류 핸들링 방식
|
|
189
|
+
|
|
190
|
+
2. 헬스체크 강화:
|
|
191
|
+
```typescript
|
|
192
|
+
class SemanticDaemon {
|
|
193
|
+
private modelHealth: 'primary' | 'fallback' | 'keyword-only' = 'primary';
|
|
194
|
+
|
|
195
|
+
async embed(text: string): Promise<number[]> {
|
|
196
|
+
try {
|
|
197
|
+
return await this.primaryModel.embed(text);
|
|
198
|
+
} catch (e) {
|
|
199
|
+
if (this.modelHealth === 'primary') {
|
|
200
|
+
this.modelHealth = 'fallback';
|
|
201
|
+
logger.warn('[embedding] switched to fallback model');
|
|
202
|
+
}
|
|
203
|
+
try {
|
|
204
|
+
return await this.fallbackModel.embed(text);
|
|
205
|
+
} catch (e2) {
|
|
206
|
+
this.modelHealth = 'keyword-only';
|
|
207
|
+
return []; // 키워드 전용 모드
|
|
208
|
+
}
|
|
209
|
+
}
|
|
210
|
+
}
|
|
211
|
+
}
|
|
212
|
+
```
|
|
213
|
+
|
|
214
|
+
3. `/api/stats` 응답에 모델 상태 추가:
|
|
215
|
+
```json
|
|
216
|
+
{
|
|
217
|
+
"embeddingModel": {
|
|
218
|
+
"current": "fallback",
|
|
219
|
+
"primaryErrors": 12,
|
|
220
|
+
"fallbackErrors": 0,
|
|
221
|
+
"successRate": 0.99
|
|
222
|
+
}
|
|
223
|
+
}
|
|
224
|
+
```
|
|
225
|
+
|
|
226
|
+
**완료 조건**: 모델 오류 시 자동 폴백 + 대시보드에 상태 표시
|
|
227
|
+
|
|
228
|
+
---
|
|
229
|
+
|
|
230
|
+
## Phase 3: Feedback Loop (3주차)
|
|
231
|
+
|
|
232
|
+
### Task 3.1 — Helpfulness 자동 평가 (IMP-06)
|
|
233
|
+
|
|
234
|
+
**목표**: sessions_helpfulness 테이블에 실제 데이터 축적 시작
|
|
235
|
+
|
|
236
|
+
**작업 단계**:
|
|
237
|
+
|
|
238
|
+
1. `src/hooks/stop.ts` 읽기
|
|
239
|
+
- 세션 종료 시 처리 로직
|
|
240
|
+
- agent_response 이벤트 저장 방식
|
|
241
|
+
|
|
242
|
+
2. 휴리스틱 평가 로직:
|
|
243
|
+
```typescript
|
|
244
|
+
async function evaluateHelpfulness(sessionId: string) {
|
|
245
|
+
const traces = await store.getSessionRetrievalTraces(sessionId);
|
|
246
|
+
const responses = await store.getSessionEvents(sessionId, 'agent_response');
|
|
247
|
+
const responseText = responses.map(r => r.content).join(' ');
|
|
248
|
+
|
|
249
|
+
for (const trace of traces) {
|
|
250
|
+
for (const eventId of trace.selectedEventIds) {
|
|
251
|
+
const event = await store.getEvent(eventId);
|
|
252
|
+
// canonicalKey나 내용의 핵심 명사가 응답에 포함되는지 확인
|
|
253
|
+
const mentioned = responseText.includes(event.canonicalKey?.split('/').pop() ?? '');
|
|
254
|
+
const score = mentioned ? 0.8 : 0.3;
|
|
255
|
+
|
|
256
|
+
await store.recordHelpfulness({
|
|
257
|
+
sessionId,
|
|
258
|
+
eventId,
|
|
259
|
+
helpfulness: score,
|
|
260
|
+
evaluatedAt: new Date(),
|
|
261
|
+
});
|
|
262
|
+
}
|
|
263
|
+
}
|
|
264
|
+
}
|
|
265
|
+
```
|
|
266
|
+
|
|
267
|
+
3. `matcher.ts`에 helpfulness 가중치 추가:
|
|
268
|
+
```typescript
|
|
269
|
+
const helpfulnessScore = await store.getAvgHelpfulness(eventId) ?? 0.5;
|
|
270
|
+
finalScore = baseScore * 0.9 + helpfulnessScore * 0.1;
|
|
271
|
+
```
|
|
272
|
+
|
|
273
|
+
**완료 조건**: 각 세션 종료 후 sessions_helpfulness에 레코드 생성
|
|
274
|
+
|
|
275
|
+
---
|
|
276
|
+
|
|
277
|
+
### Task 3.2 — 컨텍스트 포맷 개선 (IMP-07)
|
|
278
|
+
|
|
279
|
+
**목표**: Claude가 메모리를 명확하게 인식하고 활용할 수 있는 포맷
|
|
280
|
+
|
|
281
|
+
**작업 단계**:
|
|
282
|
+
|
|
283
|
+
1. `src/hooks/user-prompt-submit.ts`의 stdout 출력 포맷 확인
|
|
284
|
+
|
|
285
|
+
2. 새 포맷으로 변경:
|
|
286
|
+
```
|
|
287
|
+
<memory_context>
|
|
288
|
+
[2026-02-25 | 신뢰도: 높음]
|
|
289
|
+
주제: LLM function call generalization
|
|
290
|
+
내용: generalize_with_llm() 함수를 사용해 상품 추천 로직 개선. 응답 속도 40% 향상.
|
|
291
|
+
---
|
|
292
|
+
[2026-02-26 | 신뢰도: 중간]
|
|
293
|
+
주제: ONNX embedding 오류 처리
|
|
294
|
+
내용: RotaryEmbedding 노드 오류 시 fallback 모델로 자동 전환 구현.
|
|
295
|
+
</memory_context>
|
|
296
|
+
```
|
|
297
|
+
|
|
298
|
+
3. `suggested` confidence 이벤트는 별도 섹션으로 분리:
|
|
299
|
+
```
|
|
300
|
+
<memory_hints optional="true">
|
|
301
|
+
(참고) 이전에 유사한 작업을 한 적 있음: ...
|
|
302
|
+
</memory_hints>
|
|
303
|
+
```
|
|
304
|
+
|
|
305
|
+
**완료 조건**: 메모리 포함 시 Claude 응답에서 메모리 내용 참조 증가 확인
|
|
306
|
+
|
|
307
|
+
---
|
|
308
|
+
|
|
309
|
+
## 검증 계획
|
|
310
|
+
|
|
311
|
+
각 Phase 완료 후 f4d5c120 프로젝트로 아래 지표 확인:
|
|
312
|
+
|
|
313
|
+
```bash
|
|
314
|
+
# Phase 1 완료 후
|
|
315
|
+
sqlite3 ~/.claude-code/memory/projects/f4d5c120/events.sqlite << 'EOF'
|
|
316
|
+
SELECT
|
|
317
|
+
'retrieval_traces' as metric,
|
|
318
|
+
COUNT(*) as value
|
|
319
|
+
FROM retrieval_traces
|
|
320
|
+
UNION ALL
|
|
321
|
+
SELECT
|
|
322
|
+
'tool_obs_ratio',
|
|
323
|
+
ROUND(100.0 * SUM(CASE WHEN event_type='tool_observation' THEN 1 END) / COUNT(*), 1)
|
|
324
|
+
FROM events
|
|
325
|
+
WHERE created_at > datetime('now', '-3 days');
|
|
326
|
+
EOF
|
|
327
|
+
|
|
328
|
+
# Phase 2 완료 후
|
|
329
|
+
SELECT
|
|
330
|
+
'l0_count', COUNT(*) FROM events WHERE level = 0
|
|
331
|
+
UNION ALL
|
|
332
|
+
SELECT
|
|
333
|
+
'l1_plus_count', COUNT(*) FROM events WHERE level >= 1
|
|
334
|
+
UNION ALL
|
|
335
|
+
SELECT
|
|
336
|
+
'session_summary_count', COUNT(*) FROM events WHERE event_type = 'session_summary';
|
|
337
|
+
|
|
338
|
+
# Phase 3 완료 후
|
|
339
|
+
SELECT
|
|
340
|
+
'helpfulness_records', COUNT(*) FROM sessions_helpfulness
|
|
341
|
+
UNION ALL
|
|
342
|
+
SELECT
|
|
343
|
+
'avg_helpfulness', ROUND(AVG(helpfulness), 2) FROM sessions_helpfulness;
|
|
344
|
+
```
|
|
345
|
+
|
|
346
|
+
---
|
|
347
|
+
|
|
348
|
+
## 담당 파일 목록
|
|
349
|
+
|
|
350
|
+
| 파일 | 변경 이유 | Phase |
|
|
351
|
+
|------|---------|-------|
|
|
352
|
+
| `src/hooks/user-prompt-submit.ts` | Trace 동기 기록, 컨텍스트 포맷 | 1, 3 |
|
|
353
|
+
| `src/hooks/post-tool-use.ts` | Tool observation 필터링 | 1 |
|
|
354
|
+
| `src/core/sqlite-event-store.ts` | recordRetrievalTraceSync 추가 | 1 |
|
|
355
|
+
| `src/hooks/session-start.ts` | 세션 요약 백필 | 2 |
|
|
356
|
+
| `src/hooks/stop.ts` | Helpfulness 평가 추가 | 2, 3 |
|
|
357
|
+
| `src/core/graduation.ts` | 시간 기반 승격 규칙 | 2 |
|
|
358
|
+
| `src/core/matcher.ts` | Helpfulness 가중치 | 3 |
|
|
359
|
+
| `src/hooks/semantic-daemon.ts` | 모델 헬스체크 강화 | 2 |
|
|
360
|
+
| `src/server/api/stats.ts` | 모델 상태 지표 추가 | 2 |
|
|
361
|
+
| `src/cli/index.ts` | graduation --repair 커맨드 | 2 |
|