npm - @vibescope/mcp-server - Versions diffs - 0.2.8 → 0.3.0 - Mend

@vibescope/mcp-server 0.2.8 → 0.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (97) hide show

package/CHANGELOG.md +84 -84
package/README.md +194 -194
package/dist/api-client.d.ts +41 -5
package/dist/api-client.js +34 -0
package/dist/cli.d.ts +1 -1
package/dist/cli.js +30 -38
package/dist/handlers/discovery.js +2 -0
package/dist/handlers/roles.js +1 -8
package/dist/handlers/session.d.ts +11 -0
package/dist/handlers/session.js +124 -32
package/dist/handlers/tasks.d.ts +8 -0
package/dist/handlers/tasks.js +163 -3
package/dist/handlers/tool-docs.js +840 -828
package/dist/handlers/validation.js +71 -15
package/dist/index.js +73 -73
package/dist/setup.js +6 -6
package/dist/templates/agent-guidelines.js +185 -185
package/dist/templates/help-content.d.ts +24 -0
package/dist/templates/help-content.js +1728 -0
package/dist/tools.js +132 -87
package/dist/utils.d.ts +15 -11
package/dist/utils.js +53 -28
package/docs/TOOLS.md +2406 -2053
package/package.json +1 -1
package/scripts/generate-docs.ts +212 -212
package/scripts/version-bump.ts +203 -203
package/src/api-client.test.ts +723 -723
package/src/api-client.ts +2561 -2499
package/src/cli.test.ts +24 -8
package/src/cli.ts +204 -212
package/src/handlers/__test-setup__.ts +236 -236
package/src/handlers/__test-utils__.ts +87 -87
package/src/handlers/blockers.test.ts +468 -468
package/src/handlers/blockers.ts +163 -163
package/src/handlers/bodies-of-work.test.ts +704 -704
package/src/handlers/bodies-of-work.ts +526 -526
package/src/handlers/connectors.test.ts +834 -834
package/src/handlers/connectors.ts +229 -229
package/src/handlers/cost.test.ts +462 -462
package/src/handlers/cost.ts +285 -285
package/src/handlers/decisions.test.ts +382 -382
package/src/handlers/decisions.ts +153 -153
package/src/handlers/deployment.test.ts +551 -551
package/src/handlers/deployment.ts +541 -541
package/src/handlers/discovery.test.ts +206 -206
package/src/handlers/discovery.ts +392 -390
package/src/handlers/fallback.test.ts +537 -537
package/src/handlers/fallback.ts +194 -194
package/src/handlers/file-checkouts.test.ts +750 -750
package/src/handlers/file-checkouts.ts +185 -185
package/src/handlers/findings.test.ts +633 -633
package/src/handlers/findings.ts +239 -239
package/src/handlers/git-issues.test.ts +631 -631
package/src/handlers/git-issues.ts +136 -136
package/src/handlers/ideas.test.ts +644 -644
package/src/handlers/ideas.ts +207 -207
package/src/handlers/index.ts +84 -84
package/src/handlers/milestones.test.ts +475 -475
package/src/handlers/milestones.ts +180 -180
package/src/handlers/organizations.test.ts +826 -826
package/src/handlers/organizations.ts +315 -315
package/src/handlers/progress.test.ts +269 -269
package/src/handlers/progress.ts +77 -77
package/src/handlers/project.test.ts +546 -546
package/src/handlers/project.ts +239 -239
package/src/handlers/requests.test.ts +303 -303
package/src/handlers/requests.ts +99 -99
package/src/handlers/roles.test.ts +305 -303
package/src/handlers/roles.ts +219 -226
package/src/handlers/session.test.ts +998 -875
package/src/handlers/session.ts +839 -738
package/src/handlers/sprints.test.ts +732 -732
package/src/handlers/sprints.ts +537 -537
package/src/handlers/tasks.test.ts +931 -907
package/src/handlers/tasks.ts +1121 -945
package/src/handlers/tool-categories.test.ts +66 -66
package/src/handlers/tool-docs.ts +1109 -1096
package/src/handlers/types.test.ts +259 -259
package/src/handlers/types.ts +175 -175
package/src/handlers/validation.test.ts +582 -582
package/src/handlers/validation.ts +159 -97
package/src/index.test.ts +674 -0
package/src/index.ts +792 -792
package/src/setup.test.ts +233 -233
package/src/setup.ts +404 -403
package/src/templates/agent-guidelines.ts +210 -210
package/src/templates/help-content.ts +1751 -0
package/src/token-tracking.test.ts +463 -463
package/src/token-tracking.ts +166 -166
package/src/tools.test.ts +416 -0
package/src/tools.ts +3607 -3562
package/src/utils.test.ts +785 -683
package/src/utils.ts +469 -436
package/src/validators.test.ts +223 -223
package/src/validators.ts +249 -249
package/tsconfig.json +16 -16
package/vitest.config.ts +14 -14

package/src/token-tracking.test.ts CHANGED Viewed

@@ -1,463 +1,463 @@
-import { describe, it, expect, beforeEach, vi } from 'vitest';
-import {
-	estimateTokens,
-	createTokenUsage,
-	trackTokenUsage,
-	setCurrentModel,
-	resetTokenUsage,
-	getTokenUsageSummary,
-	type TokenUsage,
-} from './token-tracking.js';
-// ============================================================================
-// estimateTokens Tests
-// ============================================================================
-describe('estimateTokens', () => {
-	it('should return 1 for empty object', () => {
-		// "{}" is 2 chars, ceil(2/4) = 1
-		expect(estimateTokens({})).toBe(1);
-	});
-	it('should return 1 for empty array', () => {
-		// "[]" is 2 chars, ceil(2/4) = 1
-		expect(estimateTokens([])).toBe(1);
-	});
-	it('should return 1 for empty string', () => {
-		// '""' is 2 chars, ceil(2/4) = 1
-		expect(estimateTokens('')).toBe(1);
-	});
-	it('should return 1 for null', () => {
-		// "null" is 4 chars, ceil(4/4) = 1
-		expect(estimateTokens(null)).toBe(1);
-	});
-	it('should return 1 for boolean', () => {
-		// "true" is 4 chars, ceil(4/4) = 1
-		expect(estimateTokens(true)).toBe(1);
-		// "false" is 5 chars, ceil(5/4) = 2
-		expect(estimateTokens(false)).toBe(2);
-	});
-	it('should estimate tokens for simple object', () => {
-		const obj = { name: 'test' };
-		// {"name":"test"} is 15 chars, ceil(15/4) = 4
-		expect(estimateTokens(obj)).toBe(4);
-	});
-	it('should estimate tokens for array of strings', () => {
-		const arr = ['one', 'two', 'three'];
-		// ["one","two","three"] is 21 chars, ceil(21/4) = 6
-		expect(estimateTokens(arr)).toBe(6);
-	});
-	it('should estimate tokens for nested object', () => {
-		const obj = {
-			user: {
-				name: 'John',
-				age: 30,
-			},
-			active: true,
-		};
-		// Complex object - just verify it returns a reasonable positive number
-		const tokens = estimateTokens(obj);
-		expect(tokens).toBeGreaterThan(0);
-		expect(tokens).toBeLessThan(100); // Sanity check
-	});
-	it('should estimate tokens for large object', () => {
-		const obj = {
-			tasks: Array(100)
-				.fill(null)
-				.map((_, i) => ({
-					id: `task-${i}`,
-					title: `Task number ${i}`,
-					status: 'pending',
-				})),
-		};
-		const tokens = estimateTokens(obj);
-		// Should be a large number for 100 tasks
-		expect(tokens).toBeGreaterThan(500);
-	});
-	it('should handle numbers', () => {
-		// "12345" is 5 chars, ceil(5/4) = 2
-		expect(estimateTokens(12345)).toBe(2);
-		// "3.14159" is 7 chars, ceil(7/4) = 2
-		expect(estimateTokens(3.14159)).toBe(2);
-	});
-	it('should handle undefined by treating as null', () => {
-		// JSON.stringify(undefined) returns undefined, not a string
-		// Our function handles this gracefully
-		const tokens = estimateTokens(undefined);
-		expect(tokens).toBeGreaterThanOrEqual(1);
-	});
-	it('should handle circular reference gracefully and log warning', () => {
-		const warnSpy = vi.spyOn(console, 'warn').mockImplementation(() => {});
-		const obj: Record<string, unknown> = { name: 'test' };
-		obj.self = obj; // Create circular reference
-		// Should not throw, should return minimal estimate
-		const tokens = estimateTokens(obj);
-		expect(tokens).toBe(1);
-		// Should log a warning about the serialization failure
-		expect(warnSpy).toHaveBeenCalledTimes(1);
-		expect(warnSpy).toHaveBeenCalledWith(
-			expect.stringContaining('[Vibescope] Token estimation failed:')
-		);
-		warnSpy.mockRestore();
-	});
-	it('should handle objects with toJSON method', () => {
-		const obj = {
-			data: 'test',
-			toJSON() {
-				return { serialized: true };
-			},
-		};
-		// toJSON returns {"serialized":true} which is 18 chars, ceil(18/4) = 5
-		expect(estimateTokens(obj)).toBe(5);
-	});
-});
-// ============================================================================
-// createTokenUsage Tests
-// ============================================================================
-describe('createTokenUsage', () => {
-	it('should create fresh token usage object', () => {
-		const usage = createTokenUsage();
-		expect(usage.callCount).toBe(0);
-		expect(usage.totalTokens).toBe(0);
-		expect(usage.byTool).toEqual({});
-		expect(usage.byModel).toEqual({});
-		expect(usage.currentModel).toBeNull();
-	});
-	it('should create independent instances', () => {
-		const usage1 = createTokenUsage();
-		const usage2 = createTokenUsage();
-		usage1.callCount = 5;
-		usage1.byTool['test'] = { calls: 1, tokens: 10 };
-		expect(usage2.callCount).toBe(0);
-		expect(usage2.byTool).toEqual({});
-	});
-});
-// ============================================================================
-// trackTokenUsage Tests
-// ============================================================================
-describe('trackTokenUsage', () => {
-	let usage: TokenUsage;
-	beforeEach(() => {
-		usage = createTokenUsage();
-	});
-	it('should increment call count', () => {
-		trackTokenUsage(usage, 'test_tool', {}, {});
-		expect(usage.callCount).toBe(1);
-		trackTokenUsage(usage, 'test_tool', {}, {});
-		expect(usage.callCount).toBe(2);
-	});
-	it('should accumulate total tokens', () => {
-		trackTokenUsage(usage, 'tool1', { key: 'value' }, { result: 'ok' });
-		const firstTotal = usage.totalTokens;
-		expect(firstTotal).toBeGreaterThan(0);
-		trackTokenUsage(usage, 'tool2', { key: 'value' }, { result: 'ok' });
-		expect(usage.totalTokens).toBeGreaterThan(firstTotal);
-	});
-	it('should track by tool name', () => {
-		trackTokenUsage(usage, 'add_task', { title: 'Test' }, { success: true });
-		trackTokenUsage(usage, 'add_task', { title: 'Test 2' }, { success: true });
-		trackTokenUsage(usage, 'complete_task', { id: '123' }, { success: true });
-		expect(usage.byTool['add_task'].calls).toBe(2);
-		expect(usage.byTool['complete_task'].calls).toBe(1);
-		expect(usage.byTool['add_task'].tokens).toBeGreaterThan(0);
-	});
-	it('should track by model when set', () => {
-		setCurrentModel(usage, 'opus');
-		trackTokenUsage(usage, 'tool1', { data: 'input' }, { data: 'output' });
-		expect(usage.byModel['opus']).toBeDefined();
-		expect(usage.byModel['opus'].input).toBeGreaterThan(0);
-		expect(usage.byModel['opus'].output).toBeGreaterThan(0);
-	});
-	it('should not track by model when not set', () => {
-		trackTokenUsage(usage, 'tool1', { data: 'input' }, { data: 'output' });
-		expect(Object.keys(usage.byModel)).toHaveLength(0);
-	});
-	it('should track multiple models separately', () => {
-		setCurrentModel(usage, 'opus');
-		trackTokenUsage(usage, 'tool1', { x: 1 }, { y: 2 });
-		setCurrentModel(usage, 'sonnet');
-		trackTokenUsage(usage, 'tool2', { x: 1 }, { y: 2 });
-		trackTokenUsage(usage, 'tool3', { x: 1 }, { y: 2 });
-		expect(Object.keys(usage.byModel)).toHaveLength(2);
-		expect(usage.byModel['opus']).toBeDefined();
-		expect(usage.byModel['sonnet']).toBeDefined();
-	});
-	it('should handle empty args and response', () => {
-		trackTokenUsage(usage, 'empty_tool', {}, {});
-		expect(usage.callCount).toBe(1);
-		expect(usage.totalTokens).toBeGreaterThanOrEqual(2); // At least 2 for {} + {}
-		expect(usage.byTool['empty_tool'].calls).toBe(1);
-	});
-	it('should handle large args and response', () => {
-		const largeArgs = { items: Array(1000).fill('item') };
-		const largeResponse = { results: Array(1000).fill({ ok: true }) };
-		trackTokenUsage(usage, 'large_tool', largeArgs, largeResponse);
-		expect(usage.totalTokens).toBeGreaterThan(1000);
-	});
-});
-// ============================================================================
-// setCurrentModel Tests
-// ============================================================================
-describe('setCurrentModel', () => {
-	it('should set the current model', () => {
-		const usage = createTokenUsage();
-		setCurrentModel(usage, 'opus');
-		expect(usage.currentModel).toBe('opus');
-		setCurrentModel(usage, 'sonnet');
-		expect(usage.currentModel).toBe('sonnet');
-	});
-	it('should allow clearing the model with null', () => {
-		const usage = createTokenUsage();
-		setCurrentModel(usage, 'opus');
-		expect(usage.currentModel).toBe('opus');
-		setCurrentModel(usage, null);
-		expect(usage.currentModel).toBeNull();
-	});
-});
-// ============================================================================
-// resetTokenUsage Tests
-// ============================================================================
-describe('resetTokenUsage', () => {
-	it('should reset all tracking data', () => {
-		const usage = createTokenUsage();
-		// Add some data
-		setCurrentModel(usage, 'opus');
-		trackTokenUsage(usage, 'tool1', { a: 1 }, { b: 2 });
-		trackTokenUsage(usage, 'tool2', { c: 3 }, { d: 4 });
-		expect(usage.callCount).toBe(2);
-		expect(usage.totalTokens).toBeGreaterThan(0);
-		expect(Object.keys(usage.byTool)).toHaveLength(2);
-		// Reset
-		resetTokenUsage(usage);
-		expect(usage.callCount).toBe(0);
-		expect(usage.totalTokens).toBe(0);
-		expect(usage.byTool).toEqual({});
-		expect(usage.byModel).toEqual({});
-		expect(usage.currentModel).toBeNull();
-	});
-	it('should allow tracking after reset', () => {
-		const usage = createTokenUsage();
-		trackTokenUsage(usage, 'tool1', {}, {});
-		resetTokenUsage(usage);
-		trackTokenUsage(usage, 'tool2', { x: 1 }, { y: 2 });
-		expect(usage.callCount).toBe(1);
-		expect(usage.byTool['tool1']).toBeUndefined();
-		expect(usage.byTool['tool2']).toBeDefined();
-	});
-});
-// ============================================================================
-// getTokenUsageSummary Tests
-// ============================================================================
-describe('getTokenUsageSummary', () => {
-	it('should return empty summary for new usage', () => {
-		const usage = createTokenUsage();
-		const summary = getTokenUsageSummary(usage);
-		expect(summary.total_calls).toBe(0);
-		expect(summary.total_tokens).toBe(0);
-		expect(summary.average_tokens_per_call).toBe(0);
-		expect(summary.by_tool).toEqual({});
-		expect(summary.by_model).toEqual({});
-		expect(summary.current_model).toBeNull();
-	});
-	it('should calculate average tokens per call', () => {
-		const usage = createTokenUsage();
-		// Track 3 calls with roughly similar sizes
-		trackTokenUsage(usage, 'tool1', { a: 1 }, { b: 2 });
-		trackTokenUsage(usage, 'tool1', { a: 1 }, { b: 2 });
-		trackTokenUsage(usage, 'tool1', { a: 1 }, { b: 2 });
-		const summary = getTokenUsageSummary(usage);
-		expect(summary.total_calls).toBe(3);
-		expect(summary.average_tokens_per_call).toBeGreaterThan(0);
-		expect(summary.average_tokens_per_call).toBe(
-			Math.round(summary.total_tokens / summary.total_calls)
-		);
-	});
-	it('should include per-tool averages', () => {
-		const usage = createTokenUsage();
-		trackTokenUsage(usage, 'small_tool', { x: 1 }, { y: 2 });
-		trackTokenUsage(usage, 'small_tool', { x: 1 }, { y: 2 });
-		const summary = getTokenUsageSummary(usage);
-		expect(summary.by_tool['small_tool'].calls).toBe(2);
-		expect(summary.by_tool['small_tool'].avg).toBeGreaterThan(0);
-		expect(summary.by_tool['small_tool'].avg).toBe(
-			Math.round(summary.by_tool['small_tool'].tokens / summary.by_tool['small_tool'].calls)
-		);
-	});
-	it('should include model breakdown', () => {
-		const usage = createTokenUsage();
-		setCurrentModel(usage, 'opus');
-		trackTokenUsage(usage, 'tool1', { a: 1 }, { b: 2 });
-		setCurrentModel(usage, 'haiku');
-		trackTokenUsage(usage, 'tool2', { c: 3 }, { d: 4 });
-		const summary = getTokenUsageSummary(usage);
-		expect(summary.by_model['opus']).toBeDefined();
-		expect(summary.by_model['haiku']).toBeDefined();
-		expect(summary.current_model).toBe('haiku');
-	});
-	it('should return a copy of byModel to prevent mutation', () => {
-		const usage = createTokenUsage();
-		setCurrentModel(usage, 'opus');
-		trackTokenUsage(usage, 'tool1', { a: 1 }, { b: 2 });
-		const summary = getTokenUsageSummary(usage);
-		// Modify the summary
-		summary.by_model['opus'].input = 999;
-		// Original should be unchanged
-		expect(usage.byModel['opus'].input).not.toBe(999);
-	});
-});
-// ============================================================================
-// Integration Tests
-// ============================================================================
-describe('Token Tracking Integration', () => {
-	it('should track a realistic session workflow', () => {
-		const usage = createTokenUsage();
-		// Agent starts with opus model
-		setCurrentModel(usage, 'opus');
-		// Start session
-		trackTokenUsage(
-			usage,
-			'start_work_session',
-			{ git_url: 'https://github.com/org/repo', model: 'opus' },
-			{
-				session_id: '123',
-				persona: 'Atlas',
-				next_task: { id: 'task-1', title: 'Fix bug' },
-			}
-		);
-		// Update task
-		trackTokenUsage(
-			usage,
-			'update_task',
-			{ task_id: 'task-1', status: 'in_progress', progress_percentage: 25 },
-			{ success: true }
-		);
-		// Complete task
-		trackTokenUsage(
-			usage,
-			'complete_task',
-			{ task_id: 'task-1', summary: 'Fixed the bug' },
-			{ success: true, next_task: null }
-		);
-		const summary = getTokenUsageSummary(usage);
-		expect(summary.total_calls).toBe(3);
-		expect(summary.by_tool['start_work_session'].calls).toBe(1);
-		expect(summary.by_tool['update_task'].calls).toBe(1);
-		expect(summary.by_tool['complete_task'].calls).toBe(1);
-		expect(summary.by_model['opus']).toBeDefined();
-		expect(summary.by_model['opus'].input).toBeGreaterThan(0);
-		expect(summary.by_model['opus'].output).toBeGreaterThan(0);
-	});
-	it('should handle session reset', () => {
-		const usage = createTokenUsage();
-		// First session
-		setCurrentModel(usage, 'sonnet');
-		trackTokenUsage(usage, 'tool1', {}, {});
-		trackTokenUsage(usage, 'tool2', {}, {});
-		const firstSummary = getTokenUsageSummary(usage);
-		expect(firstSummary.total_calls).toBe(2);
-		// Reset for new session
-		resetTokenUsage(usage);
-		// Second session
-		setCurrentModel(usage, 'haiku');
-		trackTokenUsage(usage, 'tool3', {}, {});
-		const secondSummary = getTokenUsageSummary(usage);
-		expect(secondSummary.total_calls).toBe(1);
-		expect(secondSummary.by_tool['tool1']).toBeUndefined();
-		expect(secondSummary.by_tool['tool3']).toBeDefined();
-		expect(secondSummary.current_model).toBe('haiku');
-	});
-});
+import { describe, it, expect, beforeEach, vi } from 'vitest';
+import {
+	estimateTokens,
+	createTokenUsage,
+	trackTokenUsage,
+	setCurrentModel,
+	resetTokenUsage,
+	getTokenUsageSummary,
+	type TokenUsage,
+} from './token-tracking.js';
+// ============================================================================
+// estimateTokens Tests
+// ============================================================================
+describe('estimateTokens', () => {
+	it('should return 1 for empty object', () => {
+		// "{}" is 2 chars, ceil(2/4) = 1
+		expect(estimateTokens({})).toBe(1);
+	});
+	it('should return 1 for empty array', () => {
+		// "[]" is 2 chars, ceil(2/4) = 1
+		expect(estimateTokens([])).toBe(1);
+	});
+	it('should return 1 for empty string', () => {
+		// '""' is 2 chars, ceil(2/4) = 1
+		expect(estimateTokens('')).toBe(1);
+	});
+	it('should return 1 for null', () => {
+		// "null" is 4 chars, ceil(4/4) = 1
+		expect(estimateTokens(null)).toBe(1);
+	});
+	it('should return 1 for boolean', () => {
+		// "true" is 4 chars, ceil(4/4) = 1
+		expect(estimateTokens(true)).toBe(1);
+		// "false" is 5 chars, ceil(5/4) = 2
+		expect(estimateTokens(false)).toBe(2);
+	});
+	it('should estimate tokens for simple object', () => {
+		const obj = { name: 'test' };
+		// {"name":"test"} is 15 chars, ceil(15/4) = 4
+		expect(estimateTokens(obj)).toBe(4);
+	});
+	it('should estimate tokens for array of strings', () => {
+		const arr = ['one', 'two', 'three'];
+		// ["one","two","three"] is 21 chars, ceil(21/4) = 6
+		expect(estimateTokens(arr)).toBe(6);
+	});
+	it('should estimate tokens for nested object', () => {
+		const obj = {
+			user: {
+				name: 'John',
+				age: 30,
+			},
+			active: true,
+		};
+		// Complex object - just verify it returns a reasonable positive number
+		const tokens = estimateTokens(obj);
+		expect(tokens).toBeGreaterThan(0);
+		expect(tokens).toBeLessThan(100); // Sanity check
+	});
+	it('should estimate tokens for large object', () => {
+		const obj = {
+			tasks: Array(100)
+				.fill(null)
+				.map((_, i) => ({
+					id: `task-${i}`,
+					title: `Task number ${i}`,
+					status: 'pending',
+				})),
+		};
+		const tokens = estimateTokens(obj);
+		// Should be a large number for 100 tasks
+		expect(tokens).toBeGreaterThan(500);
+	});
+	it('should handle numbers', () => {
+		// "12345" is 5 chars, ceil(5/4) = 2
+		expect(estimateTokens(12345)).toBe(2);
+		// "3.14159" is 7 chars, ceil(7/4) = 2
+		expect(estimateTokens(3.14159)).toBe(2);
+	});
+	it('should handle undefined by treating as null', () => {
+		// JSON.stringify(undefined) returns undefined, not a string
+		// Our function handles this gracefully
+		const tokens = estimateTokens(undefined);
+		expect(tokens).toBeGreaterThanOrEqual(1);
+	});
+	it('should handle circular reference gracefully and log warning', () => {
+		const warnSpy = vi.spyOn(console, 'warn').mockImplementation(() => {});
+		const obj: Record<string, unknown> = { name: 'test' };
+		obj.self = obj; // Create circular reference
+		// Should not throw, should return minimal estimate
+		const tokens = estimateTokens(obj);
+		expect(tokens).toBe(1);
+		// Should log a warning about the serialization failure
+		expect(warnSpy).toHaveBeenCalledTimes(1);
+		expect(warnSpy).toHaveBeenCalledWith(
+			expect.stringContaining('[Vibescope] Token estimation failed:')
+		);
+		warnSpy.mockRestore();
+	});
+	it('should handle objects with toJSON method', () => {
+		const obj = {
+			data: 'test',
+			toJSON() {
+				return { serialized: true };
+			},
+		};
+		// toJSON returns {"serialized":true} which is 18 chars, ceil(18/4) = 5
+		expect(estimateTokens(obj)).toBe(5);
+	});
+});
+// ============================================================================
+// createTokenUsage Tests
+// ============================================================================
+describe('createTokenUsage', () => {
+	it('should create fresh token usage object', () => {
+		const usage = createTokenUsage();
+		expect(usage.callCount).toBe(0);
+		expect(usage.totalTokens).toBe(0);
+		expect(usage.byTool).toEqual({});
+		expect(usage.byModel).toEqual({});
+		expect(usage.currentModel).toBeNull();
+	});
+	it('should create independent instances', () => {
+		const usage1 = createTokenUsage();
+		const usage2 = createTokenUsage();
+		usage1.callCount = 5;
+		usage1.byTool['test'] = { calls: 1, tokens: 10 };
+		expect(usage2.callCount).toBe(0);
+		expect(usage2.byTool).toEqual({});
+	});
+});
+// ============================================================================
+// trackTokenUsage Tests
+// ============================================================================
+describe('trackTokenUsage', () => {
+	let usage: TokenUsage;
+	beforeEach(() => {
+		usage = createTokenUsage();
+	});
+	it('should increment call count', () => {
+		trackTokenUsage(usage, 'test_tool', {}, {});
+		expect(usage.callCount).toBe(1);
+		trackTokenUsage(usage, 'test_tool', {}, {});
+		expect(usage.callCount).toBe(2);
+	});
+	it('should accumulate total tokens', () => {
+		trackTokenUsage(usage, 'tool1', { key: 'value' }, { result: 'ok' });
+		const firstTotal = usage.totalTokens;
+		expect(firstTotal).toBeGreaterThan(0);
+		trackTokenUsage(usage, 'tool2', { key: 'value' }, { result: 'ok' });
+		expect(usage.totalTokens).toBeGreaterThan(firstTotal);
+	});
+	it('should track by tool name', () => {
+		trackTokenUsage(usage, 'add_task', { title: 'Test' }, { success: true });
+		trackTokenUsage(usage, 'add_task', { title: 'Test 2' }, { success: true });
+		trackTokenUsage(usage, 'complete_task', { id: '123' }, { success: true });
+		expect(usage.byTool['add_task'].calls).toBe(2);
+		expect(usage.byTool['complete_task'].calls).toBe(1);
+		expect(usage.byTool['add_task'].tokens).toBeGreaterThan(0);
+	});
+	it('should track by model when set', () => {
+		setCurrentModel(usage, 'opus');
+		trackTokenUsage(usage, 'tool1', { data: 'input' }, { data: 'output' });
+		expect(usage.byModel['opus']).toBeDefined();
+		expect(usage.byModel['opus'].input).toBeGreaterThan(0);
+		expect(usage.byModel['opus'].output).toBeGreaterThan(0);
+	});
+	it('should not track by model when not set', () => {
+		trackTokenUsage(usage, 'tool1', { data: 'input' }, { data: 'output' });
+		expect(Object.keys(usage.byModel)).toHaveLength(0);
+	});
+	it('should track multiple models separately', () => {
+		setCurrentModel(usage, 'opus');
+		trackTokenUsage(usage, 'tool1', { x: 1 }, { y: 2 });
+		setCurrentModel(usage, 'sonnet');
+		trackTokenUsage(usage, 'tool2', { x: 1 }, { y: 2 });
+		trackTokenUsage(usage, 'tool3', { x: 1 }, { y: 2 });
+		expect(Object.keys(usage.byModel)).toHaveLength(2);
+		expect(usage.byModel['opus']).toBeDefined();
+		expect(usage.byModel['sonnet']).toBeDefined();
+	});
+	it('should handle empty args and response', () => {
+		trackTokenUsage(usage, 'empty_tool', {}, {});
+		expect(usage.callCount).toBe(1);
+		expect(usage.totalTokens).toBeGreaterThanOrEqual(2); // At least 2 for {} + {}
+		expect(usage.byTool['empty_tool'].calls).toBe(1);
+	});
+	it('should handle large args and response', () => {
+		const largeArgs = { items: Array(1000).fill('item') };
+		const largeResponse = { results: Array(1000).fill({ ok: true }) };
+		trackTokenUsage(usage, 'large_tool', largeArgs, largeResponse);
+		expect(usage.totalTokens).toBeGreaterThan(1000);
+	});
+});
+// ============================================================================
+// setCurrentModel Tests
+// ============================================================================
+describe('setCurrentModel', () => {
+	it('should set the current model', () => {
+		const usage = createTokenUsage();
+		setCurrentModel(usage, 'opus');
+		expect(usage.currentModel).toBe('opus');
+		setCurrentModel(usage, 'sonnet');
+		expect(usage.currentModel).toBe('sonnet');
+	});
+	it('should allow clearing the model with null', () => {
+		const usage = createTokenUsage();
+		setCurrentModel(usage, 'opus');
+		expect(usage.currentModel).toBe('opus');
+		setCurrentModel(usage, null);
+		expect(usage.currentModel).toBeNull();
+	});
+});
+// ============================================================================
+// resetTokenUsage Tests
+// ============================================================================
+describe('resetTokenUsage', () => {
+	it('should reset all tracking data', () => {
+		const usage = createTokenUsage();
+		// Add some data
+		setCurrentModel(usage, 'opus');
+		trackTokenUsage(usage, 'tool1', { a: 1 }, { b: 2 });
+		trackTokenUsage(usage, 'tool2', { c: 3 }, { d: 4 });
+		expect(usage.callCount).toBe(2);
+		expect(usage.totalTokens).toBeGreaterThan(0);
+		expect(Object.keys(usage.byTool)).toHaveLength(2);
+		// Reset
+		resetTokenUsage(usage);
+		expect(usage.callCount).toBe(0);
+		expect(usage.totalTokens).toBe(0);
+		expect(usage.byTool).toEqual({});
+		expect(usage.byModel).toEqual({});
+		expect(usage.currentModel).toBeNull();
+	});
+	it('should allow tracking after reset', () => {
+		const usage = createTokenUsage();
+		trackTokenUsage(usage, 'tool1', {}, {});
+		resetTokenUsage(usage);
+		trackTokenUsage(usage, 'tool2', { x: 1 }, { y: 2 });
+		expect(usage.callCount).toBe(1);
+		expect(usage.byTool['tool1']).toBeUndefined();
+		expect(usage.byTool['tool2']).toBeDefined();
+	});
+});
+// ============================================================================
+// getTokenUsageSummary Tests
+// ============================================================================
+describe('getTokenUsageSummary', () => {
+	it('should return empty summary for new usage', () => {
+		const usage = createTokenUsage();
+		const summary = getTokenUsageSummary(usage);
+		expect(summary.total_calls).toBe(0);
+		expect(summary.total_tokens).toBe(0);
+		expect(summary.average_tokens_per_call).toBe(0);
+		expect(summary.by_tool).toEqual({});
+		expect(summary.by_model).toEqual({});
+		expect(summary.current_model).toBeNull();
+	});
+	it('should calculate average tokens per call', () => {
+		const usage = createTokenUsage();
+		// Track 3 calls with roughly similar sizes
+		trackTokenUsage(usage, 'tool1', { a: 1 }, { b: 2 });
+		trackTokenUsage(usage, 'tool1', { a: 1 }, { b: 2 });
+		trackTokenUsage(usage, 'tool1', { a: 1 }, { b: 2 });
+		const summary = getTokenUsageSummary(usage);
+		expect(summary.total_calls).toBe(3);
+		expect(summary.average_tokens_per_call).toBeGreaterThan(0);
+		expect(summary.average_tokens_per_call).toBe(
+			Math.round(summary.total_tokens / summary.total_calls)
+		);
+	});
+	it('should include per-tool averages', () => {
+		const usage = createTokenUsage();
+		trackTokenUsage(usage, 'small_tool', { x: 1 }, { y: 2 });
+		trackTokenUsage(usage, 'small_tool', { x: 1 }, { y: 2 });
+		const summary = getTokenUsageSummary(usage);
+		expect(summary.by_tool['small_tool'].calls).toBe(2);
+		expect(summary.by_tool['small_tool'].avg).toBeGreaterThan(0);
+		expect(summary.by_tool['small_tool'].avg).toBe(
+			Math.round(summary.by_tool['small_tool'].tokens / summary.by_tool['small_tool'].calls)
+		);
+	});
+	it('should include model breakdown', () => {
+		const usage = createTokenUsage();
+		setCurrentModel(usage, 'opus');
+		trackTokenUsage(usage, 'tool1', { a: 1 }, { b: 2 });
+		setCurrentModel(usage, 'haiku');
+		trackTokenUsage(usage, 'tool2', { c: 3 }, { d: 4 });
+		const summary = getTokenUsageSummary(usage);
+		expect(summary.by_model['opus']).toBeDefined();
+		expect(summary.by_model['haiku']).toBeDefined();
+		expect(summary.current_model).toBe('haiku');
+	});
+	it('should return a copy of byModel to prevent mutation', () => {
+		const usage = createTokenUsage();
+		setCurrentModel(usage, 'opus');
+		trackTokenUsage(usage, 'tool1', { a: 1 }, { b: 2 });
+		const summary = getTokenUsageSummary(usage);
+		// Modify the summary
+		summary.by_model['opus'].input = 999;
+		// Original should be unchanged
+		expect(usage.byModel['opus'].input).not.toBe(999);
+	});
+});
+// ============================================================================
+// Integration Tests
+// ============================================================================
+describe('Token Tracking Integration', () => {
+	it('should track a realistic session workflow', () => {
+		const usage = createTokenUsage();
+		// Agent starts with opus model
+		setCurrentModel(usage, 'opus');
+		// Start session
+		trackTokenUsage(
+			usage,
+			'start_work_session',
+			{ git_url: 'https://github.com/org/repo', model: 'opus' },
+			{
+				session_id: '123',
+				persona: 'Atlas',
+				next_task: { id: 'task-1', title: 'Fix bug' },
+			}
+		);
+		// Update task
+		trackTokenUsage(
+			usage,
+			'update_task',
+			{ task_id: 'task-1', status: 'in_progress', progress_percentage: 25 },
+			{ success: true }
+		);
+		// Complete task
+		trackTokenUsage(
+			usage,
+			'complete_task',
+			{ task_id: 'task-1', summary: 'Fixed the bug' },
+			{ success: true, next_task: null }
+		);
+		const summary = getTokenUsageSummary(usage);
+		expect(summary.total_calls).toBe(3);
+		expect(summary.by_tool['start_work_session'].calls).toBe(1);
+		expect(summary.by_tool['update_task'].calls).toBe(1);
+		expect(summary.by_tool['complete_task'].calls).toBe(1);
+		expect(summary.by_model['opus']).toBeDefined();
+		expect(summary.by_model['opus'].input).toBeGreaterThan(0);
+		expect(summary.by_model['opus'].output).toBeGreaterThan(0);
+	});
+	it('should handle session reset', () => {
+		const usage = createTokenUsage();
+		// First session
+		setCurrentModel(usage, 'sonnet');
+		trackTokenUsage(usage, 'tool1', {}, {});
+		trackTokenUsage(usage, 'tool2', {}, {});
+		const firstSummary = getTokenUsageSummary(usage);
+		expect(firstSummary.total_calls).toBe(2);
+		// Reset for new session
+		resetTokenUsage(usage);
+		// Second session
+		setCurrentModel(usage, 'haiku');
+		trackTokenUsage(usage, 'tool3', {}, {});
+		const secondSummary = getTokenUsageSummary(usage);
+		expect(secondSummary.total_calls).toBe(1);
+		expect(secondSummary.by_tool['tool1']).toBeUndefined();
+		expect(secondSummary.by_tool['tool3']).toBeDefined();
+		expect(secondSummary.current_model).toBe('haiku');
+	});
+});