code-ai-installer 4.0.0 → 4.0.1-a

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (471) hide show
  1. package/README.md +83 -67
  2. package/dist/index.js +2 -0
  3. package/dist/mcp/audit_ledger.d.ts +12 -0
  4. package/dist/mcp/audit_ledger.js +82 -0
  5. package/dist/mcp/cli.js +7 -1
  6. package/dist/mcp/config.d.ts +23 -0
  7. package/dist/mcp/config.js +36 -0
  8. package/dist/mcp/index.d.ts +1 -2
  9. package/dist/mcp/index.js +1 -2
  10. package/dist/mcp/paths.d.ts +20 -2
  11. package/dist/mcp/paths.js +29 -5
  12. package/dist/mcp/proposal_dedup.d.ts +32 -0
  13. package/dist/mcp/proposal_dedup.js +102 -0
  14. package/dist/mcp/proposal_store.d.ts +18 -0
  15. package/dist/mcp/proposal_store.js +74 -0
  16. package/dist/mcp/scorecard.d.ts +140 -0
  17. package/dist/mcp/scorecard.js +103 -0
  18. package/dist/mcp/skill_invocations.d.ts +15 -0
  19. package/dist/mcp/skill_invocations.js +28 -0
  20. package/dist/mcp/task_state.d.ts +77 -2
  21. package/dist/mcp/tools/_subprocess.d.ts +16 -0
  22. package/dist/mcp/tools/_subprocess.js +56 -0
  23. package/dist/mcp/tools/advance_gate.js +2 -2
  24. package/dist/mcp/tools/aggregate_run_metrics.d.ts +19 -0
  25. package/dist/mcp/tools/aggregate_run_metrics.js +139 -0
  26. package/dist/mcp/tools/apply_diff.d.ts +2 -0
  27. package/dist/mcp/tools/apply_diff.js +29 -0
  28. package/dist/mcp/tools/audit_bilocale_parity.d.ts +2 -0
  29. package/dist/mcp/tools/audit_bilocale_parity.js +146 -0
  30. package/dist/mcp/tools/audit_budget_compliance.d.ts +35 -0
  31. package/dist/mcp/tools/audit_budget_compliance.js +172 -0
  32. package/dist/mcp/tools/build.d.ts +2 -0
  33. package/dist/mcp/tools/build.js +47 -0
  34. package/dist/mcp/tools/check_lint.d.ts +2 -0
  35. package/dist/mcp/tools/check_lint.js +23 -0
  36. package/dist/mcp/tools/classify_gate.js +2 -2
  37. package/dist/mcp/tools/current_gate.js +2 -2
  38. package/dist/mcp/tools/dependency_supply_chain.d.ts +2 -0
  39. package/dist/mcp/tools/dependency_supply_chain.js +59 -0
  40. package/dist/mcp/tools/docker_compose.d.ts +2 -0
  41. package/dist/mcp/tools/docker_compose.js +24 -0
  42. package/dist/mcp/tools/e2e_playwright.d.ts +2 -0
  43. package/dist/mcp/tools/e2e_playwright.js +88 -0
  44. package/dist/mcp/tools/get_skill.js +17 -0
  45. package/dist/mcp/tools/git_commit.d.ts +2 -0
  46. package/dist/mcp/tools/git_commit.js +30 -0
  47. package/dist/mcp/tools/list_proposals.d.ts +6 -0
  48. package/dist/mcp/tools/list_proposals.js +16 -0
  49. package/dist/mcp/tools/list_skills.js +9 -1
  50. package/dist/mcp/tools/load_role.d.ts +3 -4
  51. package/dist/mcp/tools/load_role.js +11 -13
  52. package/dist/mcp/tools/propose_change.d.ts +8 -0
  53. package/dist/mcp/tools/propose_change.js +36 -0
  54. package/dist/mcp/tools/record_decision.js +25 -25
  55. package/dist/mcp/tools/review_proposal.d.ts +17 -0
  56. package/dist/mcp/tools/review_proposal.js +99 -0
  57. package/dist/mcp/tools/run_drift_audit.d.ts +11 -0
  58. package/dist/mcp/tools/run_drift_audit.js +79 -0
  59. package/dist/mcp/tools/run_tests.d.ts +2 -0
  60. package/dist/mcp/tools/run_tests.js +92 -0
  61. package/dist/mcp/tools/sign_off.js +14 -2
  62. package/dist/mcp/tools/stubs.js +30 -9
  63. package/dist/mcp/tools/verify_claim.js +33 -6
  64. package/dist/mcp_setup.d.ts +8 -0
  65. package/dist/mcp_setup.js +4 -1
  66. package/dist/shared/frontmatter.d.ts +44 -2
  67. package/dist/shared/frontmatter.js +54 -6
  68. package/dist/shared/index.d.ts +0 -5
  69. package/dist/shared/index.js +0 -5
  70. package/dist/shared/persona.d.ts +2 -2
  71. package/dist/shared/persona.js +1 -1
  72. package/dist/shared/pipeline.d.ts +46 -1
  73. package/dist/shared/tools.d.ts +1382 -16
  74. package/dist/shared/tools.js +229 -0
  75. package/dist/shared/vocabulary.d.ts +99 -4
  76. package/dist/shared/vocabulary.js +94 -5
  77. package/domains/analytics/.agents/skills/ansoff-matrix/SKILL.md +316 -300
  78. package/domains/analytics/.agents/skills/bcg-matrix/SKILL.md +345 -329
  79. package/domains/analytics/.agents/skills/blue-ocean-strategy/SKILL.md +432 -416
  80. package/domains/analytics/.agents/skills/board/SKILL.md +22 -0
  81. package/domains/analytics/.agents/skills/cohort-analysis/SKILL.md +338 -322
  82. package/domains/analytics/.agents/skills/competitive-analysis/SKILL.md +413 -395
  83. package/domains/analytics/.agents/skills/customer-journey-mapping/SKILL.md +347 -331
  84. package/domains/analytics/.agents/skills/gates/SKILL.md +388 -366
  85. package/domains/analytics/.agents/skills/handoff/SKILL.md +402 -380
  86. package/domains/analytics/.agents/skills/html-pdf-report/SKILL.md +21 -289
  87. package/domains/analytics/.agents/skills/html-pdf-report-reference/SKILL.md +325 -0
  88. package/domains/analytics/.agents/skills/html-pdf-report-reference/agents/claude.json +17 -0
  89. package/domains/analytics/.agents/skills/html-pdf-report-reference/agents/copilot.json +17 -0
  90. package/domains/analytics/.agents/skills/html-pdf-report-reference/agents/gemini.json +17 -0
  91. package/domains/analytics/.agents/skills/html-pdf-report-reference/agents/kimi.yaml +15 -0
  92. package/domains/analytics/.agents/skills/html-pdf-report-reference/agents/openai.yaml +10 -0
  93. package/domains/analytics/.agents/skills/html-pdf-report-reference/agents/qwen.json +17 -0
  94. package/domains/analytics/.agents/skills/html-pdf-report-reference/agents/skill.yaml +23 -0
  95. package/domains/analytics/.agents/skills/icp-buyer-persona/SKILL.md +407 -390
  96. package/domains/analytics/.agents/skills/jtbd-analysis/SKILL.md +357 -341
  97. package/domains/analytics/.agents/skills/karpathy-guidelines/SKILL.md +32 -0
  98. package/domains/analytics/.agents/skills/pest-analysis/SKILL.md +324 -305
  99. package/domains/analytics/.agents/skills/porters-five-forces/SKILL.md +377 -361
  100. package/domains/analytics/.agents/skills/report-design/SKILL.md +416 -398
  101. package/domains/analytics/.agents/skills/rfm-analysis/SKILL.md +330 -314
  102. package/domains/analytics/.agents/skills/session-prompt-generator/SKILL.md +400 -378
  103. package/domains/analytics/.agents/skills/swot-analysis/SKILL.md +340 -324
  104. package/domains/analytics/.agents/skills/tam-sam-som/SKILL.md +329 -312
  105. package/domains/analytics/.agents/skills/trend-analysis/SKILL.md +347 -331
  106. package/domains/analytics/.agents/skills/unit-economics/SKILL.md +430 -413
  107. package/domains/analytics/.agents/skills/value-chain-analysis/SKILL.md +346 -330
  108. package/domains/analytics/.agents/skills/web-research/SKILL.md +323 -308
  109. package/domains/analytics/AGENTS.md +1 -0
  110. package/domains/analytics/agents/auditor.md +76 -0
  111. package/domains/analytics/agents/conductor.md +11 -0
  112. package/domains/analytics/agents/data_analyst.md +11 -0
  113. package/domains/analytics/agents/designer.md +11 -0
  114. package/domains/analytics/agents/interviewer.md +11 -0
  115. package/domains/analytics/agents/layouter.md +11 -0
  116. package/domains/analytics/agents/mediator.md +11 -0
  117. package/domains/analytics/agents/researcher.md +11 -0
  118. package/domains/analytics/agents/strategist.md +11 -0
  119. package/domains/analytics/locales/en/.agents/skills/ansoff-matrix/SKILL.md +316 -300
  120. package/domains/analytics/locales/en/.agents/skills/bcg-matrix/SKILL.md +345 -329
  121. package/domains/analytics/locales/en/.agents/skills/blue-ocean-strategy/SKILL.md +432 -416
  122. package/domains/analytics/locales/en/.agents/skills/board/SKILL.md +22 -0
  123. package/domains/analytics/locales/en/.agents/skills/cohort-analysis/SKILL.md +338 -322
  124. package/domains/analytics/locales/en/.agents/skills/competitive-analysis/SKILL.md +413 -395
  125. package/domains/analytics/locales/en/.agents/skills/customer-journey-mapping/SKILL.md +347 -331
  126. package/domains/analytics/locales/en/.agents/skills/gates/SKILL.md +388 -366
  127. package/domains/analytics/locales/en/.agents/skills/handoff/SKILL.md +402 -380
  128. package/domains/analytics/locales/en/.agents/skills/html-pdf-report/SKILL.md +21 -289
  129. package/domains/analytics/locales/en/.agents/skills/html-pdf-report-reference/SKILL.md +325 -0
  130. package/domains/analytics/locales/en/.agents/skills/html-pdf-report-reference/agents/claude.json +17 -0
  131. package/domains/analytics/locales/en/.agents/skills/html-pdf-report-reference/agents/copilot.json +17 -0
  132. package/domains/analytics/locales/en/.agents/skills/html-pdf-report-reference/agents/gemini.json +17 -0
  133. package/domains/analytics/locales/en/.agents/skills/html-pdf-report-reference/agents/kimi.yaml +15 -0
  134. package/domains/analytics/locales/en/.agents/skills/html-pdf-report-reference/agents/openai.yaml +10 -0
  135. package/domains/analytics/locales/en/.agents/skills/html-pdf-report-reference/agents/qwen.json +17 -0
  136. package/domains/analytics/locales/en/.agents/skills/html-pdf-report-reference/agents/skill.yaml +29 -0
  137. package/domains/analytics/locales/en/.agents/skills/icp-buyer-persona/SKILL.md +407 -390
  138. package/domains/analytics/locales/en/.agents/skills/jtbd-analysis/SKILL.md +357 -341
  139. package/domains/analytics/locales/en/.agents/skills/karpathy-guidelines/SKILL.md +32 -0
  140. package/domains/analytics/locales/en/.agents/skills/pest-analysis/SKILL.md +324 -305
  141. package/domains/analytics/locales/en/.agents/skills/porters-five-forces/SKILL.md +377 -361
  142. package/domains/analytics/locales/en/.agents/skills/report-design/SKILL.md +416 -398
  143. package/domains/analytics/locales/en/.agents/skills/rfm-analysis/SKILL.md +330 -314
  144. package/domains/analytics/locales/en/.agents/skills/session-prompt-generator/SKILL.md +400 -378
  145. package/domains/analytics/locales/en/.agents/skills/swot-analysis/SKILL.md +340 -324
  146. package/domains/analytics/locales/en/.agents/skills/tam-sam-som/SKILL.md +329 -312
  147. package/domains/analytics/locales/en/.agents/skills/trend-analysis/SKILL.md +347 -331
  148. package/domains/analytics/locales/en/.agents/skills/unit-economics/SKILL.md +430 -413
  149. package/domains/analytics/locales/en/.agents/skills/value-chain-analysis/SKILL.md +366 -350
  150. package/domains/analytics/locales/en/.agents/skills/web-research/SKILL.md +324 -309
  151. package/domains/analytics/locales/en/AGENTS.md +1 -0
  152. package/domains/analytics/locales/en/agents/auditor.md +76 -0
  153. package/domains/analytics/locales/en/agents/conductor.md +27 -0
  154. package/domains/analytics/locales/en/agents/data_analyst.md +29 -0
  155. package/domains/analytics/locales/en/agents/designer.md +27 -0
  156. package/domains/analytics/locales/en/agents/interviewer.md +11 -0
  157. package/domains/analytics/locales/en/agents/layouter.md +11 -0
  158. package/domains/analytics/locales/en/agents/mediator.md +11 -0
  159. package/domains/analytics/locales/en/agents/researcher.md +11 -0
  160. package/domains/analytics/locales/en/agents/strategist.md +11 -0
  161. package/domains/analytics/persona/persona-base.md +94 -0
  162. package/domains/analytics/pipeline.yaml +102 -0
  163. package/domains/content/.agents/skills/audience-analysis/SKILL.md +15 -0
  164. package/domains/content/.agents/skills/board/SKILL.md +20 -0
  165. package/domains/content/.agents/skills/brand-compliance/SKILL.md +15 -0
  166. package/domains/content/.agents/skills/brand-guidelines/SKILL.md +17 -0
  167. package/domains/content/.agents/skills/competitor-content-analysis/SKILL.md +15 -0
  168. package/domains/content/.agents/skills/content-brief/SKILL.md +15 -0
  169. package/domains/content/.agents/skills/content-calendar/SKILL.md +15 -0
  170. package/domains/content/.agents/skills/content-release-gate/SKILL.md +15 -0
  171. package/domains/content/.agents/skills/content-review-checklist/SKILL.md +15 -0
  172. package/domains/content/.agents/skills/cta-optimization/SKILL.md +15 -0
  173. package/domains/content/.agents/skills/data-storytelling/SKILL.md +15 -0
  174. package/domains/content/.agents/skills/email-copywriting/SKILL.md +15 -0
  175. package/domains/content/.agents/skills/email-engagement-tiers/SKILL.md +15 -0
  176. package/domains/content/.agents/skills/fact-checking/SKILL.md +15 -0
  177. package/domains/content/.agents/skills/gates/SKILL.md +20 -0
  178. package/domains/content/.agents/skills/google-stitch-content/SKILL.md +15 -0
  179. package/domains/content/.agents/skills/handoff/SKILL.md +24 -0
  180. package/domains/content/.agents/skills/headline-formulas/SKILL.md +15 -0
  181. package/domains/content/.agents/skills/image-prompt-engineering/SKILL.md +15 -0
  182. package/domains/content/.agents/skills/karpathy-guidelines/SKILL.md +28 -0
  183. package/domains/content/.agents/skills/mailerlite-email-ops/SKILL.md +15 -0
  184. package/domains/content/.agents/skills/marketing-psychology/SKILL.md +15 -0
  185. package/domains/content/.agents/skills/moodboard/SKILL.md +15 -0
  186. package/domains/content/.agents/skills/platform-compliance/SKILL.md +15 -0
  187. package/domains/content/.agents/skills/platform-strategy/SKILL.md +15 -0
  188. package/domains/content/.agents/skills/platform-visual-specs/SKILL.md +15 -0
  189. package/domains/content/.agents/skills/readability-scoring/SKILL.md +15 -0
  190. package/domains/content/.agents/skills/seo-copywriting/SKILL.md +15 -0
  191. package/domains/content/.agents/skills/social-media-formats/SKILL.md +15 -0
  192. package/domains/content/.agents/skills/source-verification/SKILL.md +15 -0
  193. package/domains/content/.agents/skills/storytelling-framework/SKILL.md +15 -0
  194. package/domains/content/.agents/skills/tone-of-voice/SKILL.md +15 -0
  195. package/domains/content/.agents/skills/topic-research/SKILL.md +15 -0
  196. package/domains/content/.agents/skills/trend-research/SKILL.md +15 -0
  197. package/domains/content/.agents/skills/visual-brief/SKILL.md +15 -0
  198. package/domains/content/AGENTS.md +4 -0
  199. package/domains/content/agents/auditor.md +76 -0
  200. package/domains/content/agents/conductor.md +11 -0
  201. package/domains/content/agents/copywriter.md +11 -0
  202. package/domains/content/agents/researcher.md +11 -0
  203. package/domains/content/agents/reviewer.md +11 -0
  204. package/domains/content/agents/strategist.md +11 -0
  205. package/domains/content/agents/visual_concept.md +11 -0
  206. package/domains/content/locales/en/.agents/skills/audience-analysis/SKILL.md +15 -0
  207. package/domains/content/locales/en/.agents/skills/board/SKILL.md +20 -0
  208. package/domains/content/locales/en/.agents/skills/brand-compliance/SKILL.md +15 -0
  209. package/domains/content/locales/en/.agents/skills/brand-guidelines/SKILL.md +17 -0
  210. package/domains/content/locales/en/.agents/skills/competitor-content-analysis/SKILL.md +15 -0
  211. package/domains/content/locales/en/.agents/skills/content-brief/SKILL.md +15 -0
  212. package/domains/content/locales/en/.agents/skills/content-calendar/SKILL.md +15 -0
  213. package/domains/content/locales/en/.agents/skills/content-release-gate/SKILL.md +15 -0
  214. package/domains/content/locales/en/.agents/skills/content-review-checklist/SKILL.md +15 -0
  215. package/domains/content/locales/en/.agents/skills/cta-optimization/SKILL.md +15 -0
  216. package/domains/content/locales/en/.agents/skills/data-storytelling/SKILL.md +15 -0
  217. package/domains/content/locales/en/.agents/skills/email-copywriting/SKILL.md +15 -0
  218. package/domains/content/locales/en/.agents/skills/email-engagement-tiers/SKILL.md +15 -0
  219. package/domains/content/locales/en/.agents/skills/fact-checking/SKILL.md +15 -0
  220. package/domains/content/locales/en/.agents/skills/gates/SKILL.md +20 -0
  221. package/domains/content/locales/en/.agents/skills/google-stitch-content/SKILL.md +15 -0
  222. package/domains/content/locales/en/.agents/skills/handoff/SKILL.md +24 -0
  223. package/domains/content/locales/en/.agents/skills/headline-formulas/SKILL.md +15 -0
  224. package/domains/content/locales/en/.agents/skills/image-prompt-engineering/SKILL.md +15 -0
  225. package/domains/content/locales/en/.agents/skills/karpathy-guidelines/SKILL.md +30 -1
  226. package/domains/content/locales/en/.agents/skills/mailerlite-email-ops/SKILL.md +15 -0
  227. package/domains/content/locales/en/.agents/skills/marketing-psychology/SKILL.md +15 -0
  228. package/domains/content/locales/en/.agents/skills/moodboard/SKILL.md +15 -0
  229. package/domains/content/locales/en/.agents/skills/platform-compliance/SKILL.md +15 -0
  230. package/domains/content/locales/en/.agents/skills/platform-strategy/SKILL.md +15 -0
  231. package/domains/content/locales/en/.agents/skills/platform-visual-specs/SKILL.md +15 -0
  232. package/domains/content/locales/en/.agents/skills/readability-scoring/SKILL.md +15 -0
  233. package/domains/content/locales/en/.agents/skills/seo-copywriting/SKILL.md +15 -0
  234. package/domains/content/locales/en/.agents/skills/social-media-formats/SKILL.md +15 -0
  235. package/domains/content/locales/en/.agents/skills/source-verification/SKILL.md +15 -0
  236. package/domains/content/locales/en/.agents/skills/storytelling-framework/SKILL.md +15 -0
  237. package/domains/content/locales/en/.agents/skills/tone-of-voice/SKILL.md +15 -0
  238. package/domains/content/locales/en/.agents/skills/topic-research/SKILL.md +15 -0
  239. package/domains/content/locales/en/.agents/skills/trend-research/SKILL.md +15 -0
  240. package/domains/content/locales/en/.agents/skills/visual-brief/SKILL.md +15 -0
  241. package/domains/content/locales/en/AGENTS.md +4 -0
  242. package/domains/content/locales/en/agents/auditor.md +76 -0
  243. package/domains/content/locales/en/agents/conductor.md +12 -0
  244. package/domains/content/locales/en/agents/copywriter.md +12 -0
  245. package/domains/content/locales/en/agents/researcher.md +12 -0
  246. package/domains/content/locales/en/agents/reviewer.md +12 -0
  247. package/domains/content/locales/en/agents/strategist.md +12 -0
  248. package/domains/content/locales/en/agents/visual_concept.md +12 -0
  249. package/domains/content/persona/persona-base.md +94 -0
  250. package/domains/content/pipeline.yaml +96 -0
  251. package/domains/development/.agents/skills/adr-log/SKILL.md +1 -0
  252. package/domains/development/.agents/skills/design-intake/SKILL.md +0 -4
  253. package/domains/development/.agents/skills/karpathy-guidelines/SKILL.md +2 -1
  254. package/domains/development/.agents/skills/lava-flow-legacy-detection/SKILL.md +15 -1
  255. package/domains/development/.agents/skills/mcp-integration/SKILL.md +211 -0
  256. package/domains/development/.agents/skills/mcp-integration/agents/claude.json +22 -0
  257. package/domains/development/.agents/skills/mcp-integration/agents/copilot.json +22 -0
  258. package/domains/development/.agents/skills/mcp-integration/agents/gemini.json +22 -0
  259. package/domains/development/.agents/skills/mcp-integration/agents/kimi.yaml +18 -0
  260. package/domains/development/.agents/skills/mcp-integration/agents/openai.yaml +8 -0
  261. package/domains/development/.agents/skills/mcp-integration/agents/qwen.json +22 -0
  262. package/domains/development/.agents/skills/mcp-integration/agents/skill.yaml +26 -0
  263. package/domains/development/.agents/skills/qa-ui-a11y-smoke/SKILL.md +1 -1
  264. package/domains/development/.agents/skills/ui-a11y-smoke-review/SKILL.md +1 -1
  265. package/domains/development/AGENTS.md +1 -0
  266. package/domains/development/AGENTS.yaml +1 -0
  267. package/domains/development/agents/architect.md +13 -1
  268. package/domains/development/agents/auditor.md +74 -0
  269. package/domains/development/agents/conductor.md +14 -3
  270. package/domains/development/agents/devops.md +8 -9
  271. package/domains/development/agents/reviewer.md +12 -0
  272. package/domains/development/agents/senior_full_stack.md +12 -0
  273. package/domains/development/agents/tester.md +10 -16
  274. package/domains/development/locales/en/.agents/skills/adr-log/SKILL.md +1 -0
  275. package/domains/development/locales/en/.agents/skills/current-state-analysis/SKILL.md +256 -172
  276. package/domains/development/locales/en/.agents/skills/karpathy-guidelines/SKILL.md +2 -1
  277. package/domains/development/locales/en/.agents/skills/lava-flow-legacy-detection/SKILL.md +15 -1
  278. package/domains/development/locales/en/.agents/skills/mcp-integration/SKILL.md +211 -0
  279. package/domains/development/locales/en/.agents/skills/mcp-integration/agents/claude.json +22 -0
  280. package/domains/development/locales/en/.agents/skills/mcp-integration/agents/copilot.json +22 -0
  281. package/domains/development/locales/en/.agents/skills/mcp-integration/agents/gemini.json +22 -0
  282. package/domains/development/locales/en/.agents/skills/mcp-integration/agents/kimi.yaml +18 -0
  283. package/domains/development/locales/en/.agents/skills/mcp-integration/agents/openai.yaml +8 -0
  284. package/domains/development/locales/en/.agents/skills/mcp-integration/agents/qwen.json +22 -0
  285. package/domains/development/locales/en/.agents/skills/mcp-integration/agents/skill.yaml +26 -0
  286. package/domains/development/locales/en/.agents/skills/qa-ui-a11y-smoke/SKILL.md +1 -1
  287. package/domains/development/locales/en/.agents/skills/ui-a11y-smoke-review/SKILL.md +1 -1
  288. package/domains/development/locales/en/AGENTS.md +5 -0
  289. package/domains/development/locales/en/AGENTS.yaml +1 -0
  290. package/domains/development/locales/en/agents/architect.md +13 -1
  291. package/domains/development/locales/en/agents/auditor.md +74 -0
  292. package/domains/development/locales/en/agents/conductor.md +14 -3
  293. package/domains/development/locales/en/agents/devops.md +8 -9
  294. package/domains/development/locales/en/agents/reviewer.md +12 -0
  295. package/domains/development/locales/en/agents/senior_full_stack.md +12 -0
  296. package/domains/development/locales/en/agents/tester.md +10 -16
  297. package/domains/development/persona/persona-base.md +94 -0
  298. package/domains/product/.agents/skills/aarrr-metrics/SKILL.md +451 -433
  299. package/domains/product/.agents/skills/ab-test-design/SKILL.md +428 -412
  300. package/domains/product/.agents/skills/acceptance-criteria/SKILL.md +422 -406
  301. package/domains/product/.agents/skills/assumption-mapping/SKILL.md +323 -307
  302. package/domains/product/.agents/skills/board/SKILL.md +24 -0
  303. package/domains/product/.agents/skills/design-brief/SKILL.md +433 -418
  304. package/domains/product/.agents/skills/epic-breakdown/SKILL.md +435 -420
  305. package/domains/product/.agents/skills/gates/SKILL.md +470 -446
  306. package/domains/product/.agents/skills/gtm-brief/SKILL.md +18 -321
  307. package/domains/product/.agents/skills/gtm-brief-reference/SKILL.md +348 -0
  308. package/domains/product/.agents/skills/gtm-brief-reference/agents/claude.json +17 -0
  309. package/domains/product/.agents/skills/gtm-brief-reference/agents/copilot.json +17 -0
  310. package/domains/product/.agents/skills/gtm-brief-reference/agents/gemini.json +17 -0
  311. package/domains/product/.agents/skills/gtm-brief-reference/agents/kimi.yaml +15 -0
  312. package/domains/product/.agents/skills/gtm-brief-reference/agents/openai.yaml +10 -0
  313. package/domains/product/.agents/skills/gtm-brief-reference/agents/qwen.json +17 -0
  314. package/domains/product/.agents/skills/gtm-brief-reference/agents/skill.yaml +22 -0
  315. package/domains/product/.agents/skills/handoff/SKILL.md +463 -439
  316. package/domains/product/.agents/skills/html-pdf-report/SKILL.md +21 -663
  317. package/domains/product/.agents/skills/html-pdf-report-reference/SKILL.md +699 -0
  318. package/domains/product/.agents/skills/html-pdf-report-reference/agents/claude.json +17 -0
  319. package/domains/product/.agents/skills/html-pdf-report-reference/agents/copilot.json +17 -0
  320. package/domains/product/.agents/skills/html-pdf-report-reference/agents/gemini.json +17 -0
  321. package/domains/product/.agents/skills/html-pdf-report-reference/agents/kimi.yaml +15 -0
  322. package/domains/product/.agents/skills/html-pdf-report-reference/agents/openai.yaml +10 -0
  323. package/domains/product/.agents/skills/html-pdf-report-reference/agents/qwen.json +17 -0
  324. package/domains/product/.agents/skills/html-pdf-report-reference/agents/skill.yaml +22 -0
  325. package/domains/product/.agents/skills/hypothesis-template/SKILL.md +484 -469
  326. package/domains/product/.agents/skills/jtbd-canvas/SKILL.md +274 -258
  327. package/domains/product/.agents/skills/kano-model/SKILL.md +370 -355
  328. package/domains/product/.agents/skills/karpathy-guidelines/SKILL.md +36 -0
  329. package/domains/product/.agents/skills/launch-checklist/SKILL.md +434 -419
  330. package/domains/product/.agents/skills/moscow-prioritization/SKILL.md +407 -392
  331. package/domains/product/.agents/skills/north-star-metric/SKILL.md +317 -301
  332. package/domains/product/.agents/skills/okr-framework/SKILL.md +299 -284
  333. package/domains/product/.agents/skills/opportunity-solution-tree/SKILL.md +472 -456
  334. package/domains/product/.agents/skills/prd-template/SKILL.md +18 -258
  335. package/domains/product/.agents/skills/prd-template-reference/SKILL.md +285 -0
  336. package/domains/product/.agents/skills/prd-template-reference/agents/claude.json +17 -0
  337. package/domains/product/.agents/skills/prd-template-reference/agents/copilot.json +17 -0
  338. package/domains/product/.agents/skills/prd-template-reference/agents/gemini.json +17 -0
  339. package/domains/product/.agents/skills/prd-template-reference/agents/kimi.yaml +16 -0
  340. package/domains/product/.agents/skills/prd-template-reference/agents/openai.yaml +10 -0
  341. package/domains/product/.agents/skills/prd-template-reference/agents/qwen.json +17 -0
  342. package/domains/product/.agents/skills/prd-template-reference/agents/skill.yaml +23 -0
  343. package/domains/product/.agents/skills/problem-statement/SKILL.md +327 -312
  344. package/domains/product/.agents/skills/product-roadmap/SKILL.md +320 -304
  345. package/domains/product/.agents/skills/product-vision/SKILL.md +409 -394
  346. package/domains/product/.agents/skills/release-notes/SKILL.md +18 -258
  347. package/domains/product/.agents/skills/release-notes-reference/SKILL.md +285 -0
  348. package/domains/product/.agents/skills/release-notes-reference/agents/claude.json +17 -0
  349. package/domains/product/.agents/skills/release-notes-reference/agents/copilot.json +17 -0
  350. package/domains/product/.agents/skills/release-notes-reference/agents/gemini.json +17 -0
  351. package/domains/product/.agents/skills/release-notes-reference/agents/kimi.yaml +15 -0
  352. package/domains/product/.agents/skills/release-notes-reference/agents/openai.yaml +10 -0
  353. package/domains/product/.agents/skills/release-notes-reference/agents/qwen.json +17 -0
  354. package/domains/product/.agents/skills/release-notes-reference/agents/skill.yaml +22 -0
  355. package/domains/product/.agents/skills/report-design/SKILL.md +17 -307
  356. package/domains/product/.agents/skills/report-design-reference/SKILL.md +331 -0
  357. package/domains/product/.agents/skills/report-design-reference/agents/claude.json +17 -0
  358. package/domains/product/.agents/skills/report-design-reference/agents/copilot.json +17 -0
  359. package/domains/product/.agents/skills/report-design-reference/agents/gemini.json +17 -0
  360. package/domains/product/.agents/skills/report-design-reference/agents/kimi.yaml +15 -0
  361. package/domains/product/.agents/skills/report-design-reference/agents/openai.yaml +10 -0
  362. package/domains/product/.agents/skills/report-design-reference/agents/qwen.json +17 -0
  363. package/domains/product/.agents/skills/report-design-reference/agents/skill.yaml +22 -0
  364. package/domains/product/.agents/skills/rice-scoring/SKILL.md +266 -251
  365. package/domains/product/.agents/skills/saas-metrics/SKILL.md +422 -404
  366. package/domains/product/.agents/skills/session-prompt-generator/SKILL.md +474 -450
  367. package/domains/product/.agents/skills/user-flow/SKILL.md +491 -476
  368. package/domains/product/.agents/skills/user-interview-script/SKILL.md +315 -298
  369. package/domains/product/.agents/skills/user-story/SKILL.md +401 -385
  370. package/domains/product/.agents/skills/wsjf-scoring/SKILL.md +333 -315
  371. package/domains/product/AGENTS.md +5 -0
  372. package/domains/product/AGENTS.yaml +1 -0
  373. package/domains/product/agents/auditor.md +76 -0
  374. package/domains/product/agents/conductor.md +11 -0
  375. package/domains/product/agents/data_analyst.md +11 -0
  376. package/domains/product/agents/designer.md +11 -0
  377. package/domains/product/agents/discovery.md +11 -0
  378. package/domains/product/agents/layouter.md +11 -0
  379. package/domains/product/agents/mediator.md +11 -0
  380. package/domains/product/agents/pm.md +11 -0
  381. package/domains/product/agents/product_strategist.md +11 -0
  382. package/domains/product/agents/tech_lead.md +11 -0
  383. package/domains/product/agents/ux_designer.md +11 -0
  384. package/domains/product/locales/en/.agents/skills/aarrr-metrics/SKILL.md +451 -433
  385. package/domains/product/locales/en/.agents/skills/ab-test-design/SKILL.md +428 -412
  386. package/domains/product/locales/en/.agents/skills/acceptance-criteria/SKILL.md +422 -406
  387. package/domains/product/locales/en/.agents/skills/assumption-mapping/SKILL.md +323 -307
  388. package/domains/product/locales/en/.agents/skills/board/SKILL.md +24 -0
  389. package/domains/product/locales/en/.agents/skills/design-brief/SKILL.md +433 -418
  390. package/domains/product/locales/en/.agents/skills/epic-breakdown/SKILL.md +435 -420
  391. package/domains/product/locales/en/.agents/skills/gates/SKILL.md +470 -446
  392. package/domains/product/locales/en/.agents/skills/gtm-brief/SKILL.md +18 -321
  393. package/domains/product/locales/en/.agents/skills/gtm-brief-reference/SKILL.md +348 -0
  394. package/domains/product/locales/en/.agents/skills/gtm-brief-reference/agents/claude.json +17 -0
  395. package/domains/product/locales/en/.agents/skills/gtm-brief-reference/agents/copilot.json +17 -0
  396. package/domains/product/locales/en/.agents/skills/gtm-brief-reference/agents/gemini.json +17 -0
  397. package/domains/product/locales/en/.agents/skills/gtm-brief-reference/agents/kimi.yaml +15 -0
  398. package/domains/product/locales/en/.agents/skills/gtm-brief-reference/agents/openai.yaml +10 -0
  399. package/domains/product/locales/en/.agents/skills/gtm-brief-reference/agents/qwen.json +17 -0
  400. package/domains/product/locales/en/.agents/skills/gtm-brief-reference/agents/skill.yaml +22 -0
  401. package/domains/product/locales/en/.agents/skills/handoff/SKILL.md +463 -439
  402. package/domains/product/locales/en/.agents/skills/html-pdf-report/SKILL.md +21 -663
  403. package/domains/product/locales/en/.agents/skills/html-pdf-report-reference/SKILL.md +699 -0
  404. package/domains/product/locales/en/.agents/skills/html-pdf-report-reference/agents/claude.json +17 -0
  405. package/domains/product/locales/en/.agents/skills/html-pdf-report-reference/agents/copilot.json +17 -0
  406. package/domains/product/locales/en/.agents/skills/html-pdf-report-reference/agents/gemini.json +17 -0
  407. package/domains/product/locales/en/.agents/skills/html-pdf-report-reference/agents/kimi.yaml +15 -0
  408. package/domains/product/locales/en/.agents/skills/html-pdf-report-reference/agents/openai.yaml +10 -0
  409. package/domains/product/locales/en/.agents/skills/html-pdf-report-reference/agents/qwen.json +17 -0
  410. package/domains/product/locales/en/.agents/skills/html-pdf-report-reference/agents/skill.yaml +22 -0
  411. package/domains/product/locales/en/.agents/skills/hypothesis-template/SKILL.md +484 -469
  412. package/domains/product/locales/en/.agents/skills/jtbd-canvas/SKILL.md +273 -257
  413. package/domains/product/locales/en/.agents/skills/kano-model/SKILL.md +370 -355
  414. package/domains/product/locales/en/.agents/skills/karpathy-guidelines/SKILL.md +36 -0
  415. package/domains/product/locales/en/.agents/skills/launch-checklist/SKILL.md +434 -419
  416. package/domains/product/locales/en/.agents/skills/moscow-prioritization/SKILL.md +407 -392
  417. package/domains/product/locales/en/.agents/skills/north-star-metric/SKILL.md +317 -301
  418. package/domains/product/locales/en/.agents/skills/okr-framework/SKILL.md +299 -284
  419. package/domains/product/locales/en/.agents/skills/opportunity-solution-tree/SKILL.md +472 -456
  420. package/domains/product/locales/en/.agents/skills/prd-template/SKILL.md +18 -258
  421. package/domains/product/locales/en/.agents/skills/prd-template-reference/SKILL.md +285 -0
  422. package/domains/product/locales/en/.agents/skills/prd-template-reference/agents/claude.json +16 -0
  423. package/domains/product/locales/en/.agents/skills/prd-template-reference/agents/copilot.json +16 -0
  424. package/domains/product/locales/en/.agents/skills/prd-template-reference/agents/gemini.json +16 -0
  425. package/domains/product/locales/en/.agents/skills/prd-template-reference/agents/kimi.yaml +15 -0
  426. package/domains/product/locales/en/.agents/skills/prd-template-reference/agents/openai.yaml +10 -0
  427. package/domains/product/locales/en/.agents/skills/prd-template-reference/agents/qwen.json +16 -0
  428. package/domains/product/locales/en/.agents/skills/prd-template-reference/agents/skill.yaml +22 -0
  429. package/domains/product/locales/en/.agents/skills/problem-statement/SKILL.md +327 -312
  430. package/domains/product/locales/en/.agents/skills/product-roadmap/SKILL.md +321 -305
  431. package/domains/product/locales/en/.agents/skills/product-vision/SKILL.md +410 -395
  432. package/domains/product/locales/en/.agents/skills/release-notes/SKILL.md +18 -258
  433. package/domains/product/locales/en/.agents/skills/release-notes-reference/SKILL.md +285 -0
  434. package/domains/product/locales/en/.agents/skills/release-notes-reference/agents/claude.json +16 -0
  435. package/domains/product/locales/en/.agents/skills/release-notes-reference/agents/copilot.json +16 -0
  436. package/domains/product/locales/en/.agents/skills/release-notes-reference/agents/gemini.json +16 -0
  437. package/domains/product/locales/en/.agents/skills/release-notes-reference/agents/kimi.yaml +14 -0
  438. package/domains/product/locales/en/.agents/skills/release-notes-reference/agents/openai.yaml +10 -0
  439. package/domains/product/locales/en/.agents/skills/release-notes-reference/agents/qwen.json +16 -0
  440. package/domains/product/locales/en/.agents/skills/release-notes-reference/agents/skill.yaml +21 -0
  441. package/domains/product/locales/en/.agents/skills/report-design/SKILL.md +17 -307
  442. package/domains/product/locales/en/.agents/skills/report-design-reference/SKILL.md +331 -0
  443. package/domains/product/locales/en/.agents/skills/report-design-reference/agents/claude.json +17 -0
  444. package/domains/product/locales/en/.agents/skills/report-design-reference/agents/copilot.json +17 -0
  445. package/domains/product/locales/en/.agents/skills/report-design-reference/agents/gemini.json +17 -0
  446. package/domains/product/locales/en/.agents/skills/report-design-reference/agents/kimi.yaml +15 -0
  447. package/domains/product/locales/en/.agents/skills/report-design-reference/agents/openai.yaml +10 -0
  448. package/domains/product/locales/en/.agents/skills/report-design-reference/agents/qwen.json +17 -0
  449. package/domains/product/locales/en/.agents/skills/report-design-reference/agents/skill.yaml +22 -0
  450. package/domains/product/locales/en/.agents/skills/rice-scoring/SKILL.md +266 -251
  451. package/domains/product/locales/en/.agents/skills/saas-metrics/SKILL.md +422 -404
  452. package/domains/product/locales/en/.agents/skills/session-prompt-generator/SKILL.md +474 -450
  453. package/domains/product/locales/en/.agents/skills/user-flow/SKILL.md +491 -476
  454. package/domains/product/locales/en/.agents/skills/user-interview-script/SKILL.md +314 -297
  455. package/domains/product/locales/en/.agents/skills/user-story/SKILL.md +401 -385
  456. package/domains/product/locales/en/.agents/skills/wsjf-scoring/SKILL.md +333 -315
  457. package/domains/product/locales/en/AGENTS.md +5 -0
  458. package/domains/product/locales/en/agents/auditor.md +76 -0
  459. package/domains/product/locales/en/agents/conductor.md +11 -0
  460. package/domains/product/locales/en/agents/data_analyst.md +11 -0
  461. package/domains/product/locales/en/agents/designer.md +11 -0
  462. package/domains/product/locales/en/agents/discovery.md +11 -0
  463. package/domains/product/locales/en/agents/layouter.md +11 -0
  464. package/domains/product/locales/en/agents/mediator.md +11 -0
  465. package/domains/product/locales/en/agents/pm.md +11 -0
  466. package/domains/product/locales/en/agents/product_strategist.md +11 -0
  467. package/domains/product/locales/en/agents/tech_lead.md +11 -0
  468. package/domains/product/locales/en/agents/ux_designer.md +11 -0
  469. package/domains/product/persona/persona-base.md +94 -0
  470. package/domains/product/pipeline.yaml +115 -0
  471. package/package.json +72 -70
@@ -1,469 +1,484 @@
1
- ---
2
- name: hypothesis-template
3
- description: Тестируемая гипотеза — We believe / Will result in / We'll know when [metric] reaches [threshold]
4
- ---
5
- # Hypothesis Template
6
-
7
- > **Категория:** Experimentation · **Slug:** `hypothesis-template`
8
-
9
- ## Когда использовать
10
-
11
- - Перед каждым experiment (A/B test, rollout, prototype test).
12
- - При assumption validation — convert assumption в testable hypothesis.
13
- - Для pre-mortem решений — «если мы делаем X, что ожидаем?».
14
- - Как часть PRD success criteria.
15
-
16
- ## Вход
17
-
18
- | Поле | Обязательно | Описание |
19
- |------|:-----------:|----------|
20
- | Предлагаемое изменение / фича | ✅ | Что тестируем |
21
- | Лежащее в основе допущение | ✅ | Почему думаем, что сработает |
22
- | Метрика результата | ✅ | Что измеряем |
23
- | Базовые данные | ✅ | Текущий уровень метрики |
24
-
25
- ## Источники данных
26
-
27
- 1. `$assumption-mapping`какие допущения тестировать.
28
- 2. `$saas-metrics` + `$aarrr-metrics`для выбора метрики результата.
29
- 3. Исторические данные базовый уровень.
30
- 4. Отраслевые бенчмарки — ожидаемые размеры эффекта.
31
-
32
- ### Связь с другими скилами
33
-
34
- | Скил | Что берём | Когда вызывать |
35
- |------|-----------|----------------|
36
- | `assumption-mapping` | Наиболее рискованные допущения гипотезы | Перед hypothesis |
37
- | `ab-test-design` | Метод тестирования | После hypothesis |
38
- | `saas-metrics` | Метрики результата | Для измерения |
39
- | `north-star-metric` | Выравнивание первичной метрики | Для тестов, связанных с NSM |
40
-
41
- ## Формат (Canonical)
42
-
43
- > **We believe** [proposed change / hypothesis]
44
- > **For** [target user / segment]
45
- > **Will result in** [expected outcome]
46
- > **We'll know it's true when** [metric] **reaches** [threshold] **within** [timeframe]
47
- > **Because** [underlying rationale]
48
-
49
- Пример:
50
- > **We believe** adding an in-app onboarding checklist
51
- > **For** new users (trial signups, first 7 days)
52
- > **Will result in** higher activation rate
53
- > **We'll know it's true when** 7-day activation rate reaches **45%** (from baseline **32%**) **within** 6 weeks of rollout
54
- > **Because** 12/15 interviews показали confusion about first steps, и competitor data suggests checklist approach drives +40% activation в category.
55
-
56
- ## Протокол
57
-
58
- ### Шаг 1 Формулировка гипотезы
59
-
60
- **We believe:** конкретное изменение (фича, текст, поток)
61
- **For:** конкретный сегмент пользователей (не «все пользователи»)
62
- **Will result in:** направленный результат + метрика
63
-
64
- Правила:
65
- - Конкретное изменение, не расплывчатое («улучшить UX»)
66
- - Конкретный пользователь, не «пользователи»
67
- - Конкретный результат, не «лучшая вовлечённость»
68
-
69
- ### Шаг 2 Outcome Metric Selection
70
-
71
- Первичная метрика должна быть:
72
- - **Измеримой:** инструментирована или может быть инструментирована
73
- - **Опережающей или запаздывающей:** знать которой
74
- - **Согласованной:** связана с NSM / OKR
75
- - **Защищённой от манипуляций:** не поддаётся лёгкому искажению
76
-
77
- Распространённые метрики результата по типу гипотезы:
78
- - **Гипотеза онбординга/активации:** 7-дневный activation rate, time-to-first-value
79
- - **Гипотеза retention:** W/W retention, churn rate, частота использования
80
- - **Гипотеза монетизации:** conversion rate, ARPA, upsell rate
81
- - **Гипотеза вовлечённости:** DAU/MAU, длительность сессии, действия за сессию
82
-
83
- ### Шаг 3 — Baseline + Threshold
84
-
85
- **Базовый уровень:** текущий уровень (на основе недавнего окна данных).
86
-
87
- **Порог:** что сигнализирует о «подтверждении гипотезы»? Два подхода:
88
-
89
- 1. **Абсолютный:** «45% activation» (определённое абсолютное число)
90
- 2. **Относительный:** «+20% activation» или «+5pp»
91
-
92
- Обоснование порога:
93
- - На основе бизнес-потребности (какой прирост делает запуск оправданным)
94
- - На основе обнаруживаемого эффекта (какой объём выборки поддерживает)
95
- - На основе отраслевых бенчмарков
96
-
97
- ### Шаг 4 — Timeframe
98
-
99
- - Слишком короткий = шум
100
- - Слишком длинный = медленный цикл обучения
101
- - Типичный для B2B SaaS: 4-8 недель для activation, 8-12 для retention
102
-
103
- Обоснование: почему такая продолжительность?
104
-
105
- ### Шаг 5 — «Because» Rationale
106
-
107
- Лежащие в основе доказательства:
108
- - Исследование пользователей (цитаты, интервью)
109
- - Исторические данные (прошлые похожие изменения)
110
- - Отраслевые бенчмарки
111
- - Поведение конкурентов
112
-
113
- Без «because» — угадывание. С доказательствами — осознанная ставка.
114
-
115
- ### Шаг 6 Null Hypothesis (Explicit)
116
-
117
- Что если гипотеза не подтверждается? Что это означает:
118
- - Допущение не выдерживает проверки
119
- - Нужна новая гипотеза
120
- - Фича не запускается, ресурсы переходят к другому
121
-
122
- Будьте готовы отказаться от идеи, если данные говорят об этом.
123
-
124
- ### Шаг 7 Guardrail Metrics
125
-
126
- Что **не должно** деградировать даже при улучшении первичной метрики:
127
- - Churn rate (не должен расти)
128
- - NPS
129
- - Объём тикетов поддержки
130
- - Метрики производительности
131
- - Выручка на пользователя (если рост вовлечённости идёт за счёт ARPA)
132
-
133
- Если guardrail нарушается несмотря на победу первичной метрики — считать провалом.
134
-
135
- ### Шаг 8 Confidence Level
136
-
137
- Байесовский неформальный:
138
- - **Высокая уверенность** (80%+): Сильные доказательства, похожие успешные запуски, чёткий механизм
139
- - **Средняя** (50-80%): Умеренные доказательства, новый механизм
140
- - **Низкая** (<50%): Исследовательская, много допущений
141
-
142
- Определяет инвестиции в эксперименты (более крупные тесты для низкой уверенности).
143
-
144
- ### Шаг 9 — Segment Analysis Plan
145
-
146
- Указать сегменты для анализа после теста:
147
- - По размеру компании (SMB / mid / enterprise)
148
- - По роли пользователя (buyer / end-user / admin)
149
- - По тиру тарифного плана
150
- - По стажу (новые / постоянные)
151
-
152
- Общий прирост + разбивка по сегментам.
153
-
154
- ## Валидация (Quality Gate)
155
-
156
- - [ ] Все 5 компонентов (believe / for / result / know / because) заполнены
157
- - [ ] Конкретное изменение + конкретный сегмент пользователей
158
- - [ ] Метрика результата измерима + инструментирована
159
- - [ ] Базовые данные предоставлены (недавнее окно)
160
- - [ ] Порог обоснован (бизнес + обнаруживаемость)
161
- - [ ] Обоснование временных рамок
162
- - [ ] Обоснование ссылается на 2 источника доказательств
163
- - [ ] Последствия нулевой гипотезы явны
164
- - [ ] Guardrail метрики перечислены
165
- - [ ] Уровень уверенности указан
166
- - [ ] План сегментного анализа
167
-
168
- ## Handoff
169
-
170
- Результат является входом для:
171
- - **`ab-test-design`** метод тестирования
172
- - **Data Analyst** инструментирование
173
- - **PM** секция критериев успеха PRD
174
- - **Engineering** настройка feature flag
175
-
176
- Формат: hypothesis card (markdown). Через `$handoff`.
177
-
178
- ## Anti-patterns
179
-
180
- | Ошибка | Почему плохо | Как правильно |
181
- |--------|-------------|---------------|
182
- | Расплывчатое изменение | Не тестируется | Конкретная реализация |
183
- | «Все пользователи» | Размывает сигнал | Конкретный сегмент |
184
- | Нет базового уровня | Невозможно обнаружить изменение | Сначала базовые данные |
185
- | Нет порога | «Улучшится» | Числовой порог + обоснование |
186
- | Нет обоснования | Угадывание | ≥ 2 источника доказательств |
187
- | Нет guardrails | Невидимый ущерб | Явные guardrails |
188
- | Игнорируемая нулевая гипотеза | Никогда не убивают проигрывающие идеи | Подготовить условия отказа |
189
-
190
- ## Шаблон
191
-
192
- ```markdown
193
- # Hypothesis: [Короткое название]
194
-
195
- **We believe** [изменение]
196
- **For** [сегмент]
197
- **Will result in** [результат]
198
- **We'll know it's true when** [метрика] reaches [порог] within [временные рамки]
199
- **Because** [обоснование, ≥2 источника доказательств]
200
-
201
- ## Базовый уровень
202
- - Текущий [метрика]: X
203
- - Окно данных: [последние 30 дней и т.д.]
204
- - Уверенность: Средняя
205
-
206
- ## Порог
207
- - Цель: X → Y
208
- - Обоснование: [бизнес-потребность + обнаруживаемость + бенчмарк]
209
-
210
- ## Guardrails
211
- - Churn < [порог]
212
- - NPS [порог]
213
- - Тикеты поддержки < [порог]
214
-
215
- ## Сегменты для анализа
216
- - Размер компании
217
- - Роль пользователя
218
-
219
- ## Последствия нулевой гипотезы
220
- Если метрика не достигает Y:
221
- - Допущение X не выдерживает проверки
222
- - Запускать? Вероятно нет — данные говорят, что нет соответствия
223
- ```
224
-
225
- ## Worked Example — TeamFlow Hypothesis Cards (4 cards для AI Summarization launch)
226
-
227
- **Контекст:** Pre-MVP запуск, data analyst формирует карточки гипотез для каждого высокорискового допущения из assumption-map. Каждая карточка будет проверена через конкретный эксперимент.
228
-
229
- ### Hypothesis Card H-001: AI Summary Willingness to Pay (V1 assumption)
230
-
231
- ```markdown
232
- # Hypothesis: H-001 Willingness to Pay для AI Tier
233
-
234
- **We believe** adding AI Summarization as Team Tier feature (+$8/seat/month premium)
235
- **For** TeamFlow customer base (200 existing Core accounts) + new trial signups с manager workflows
236
- **Will result in** 40 account upgrades to AI Team Tier within first quarter post-launch
237
- **We'll know it's true when** AI Team Tier adoption reaches **20%** of 200 existing customer base
238
- (baseline: 0% (tier не existing pre-launch); target = 40 of 200 customer accounts upgrade)
239
- **within** 90 days post-launch
240
- **Because**
241
- (1) 7 of 10 customer conversations в landing page test confirmed «we'd pay $10/seat for AI summaries»
242
- (2) Competitor ChatGPT Teams priced at $25/user shows price ceiling exists (we're well-below)
243
- (3) Post-Discovery survey: 34% of customers expressed interest в AI summarization, suggesting 20% conversion realistic conservative target
244
-
245
- ## Базовый уровень
246
- - Текущий adoption AI Tier: 0 аккаунтов (тир не существовал до запуска)
247
- - Исторический темп обновления Core Team Tier: 12% / год (отраслевая норма)
248
- - Окно данных: Q4 2025 + Q1 2026 (6 месяцев) — для базового churn / NPS
249
- - Уверенность: Средне-высокая (проверена в 2 методах исследования клиентов)
250
-
251
- ## Порог
252
- - Цель: **20% конверсия** базы 200 клиентов за 90 дней = 40 аккаунтов
253
- - Обоснование:
254
- - Бизнес-потребность: OKR KR1.1 «40 аккаунтов обновлено»
255
- - Верхняя граница: 34% выразили интерес (опрос Discovery) → 20% конверсия предполагает 60% конверсию интереса в обновление
256
- - Бенчмарк: Успешные запуски premium-тиров B2B SaaS достигают 15-25% в первые 90 дней, когда фича соответствует потребности
257
-
258
- ## Guardrails
259
- - Churn rate < 9% (от базового 8%) — если ценообразование вызывает отток
260
- - NPS ≥ 43 (от базового 45) — если нарушение тиров вызывает неудовлетворённость
261
- - Тикеты поддержки «ценообразование / путаница с тирами» < 5% от всех тикетов
262
- - Отток Core-тира не должен ускоряться (максимум +0.5pp)
263
-
264
- ## Сегменты для анализа
265
- - Размер компании (SMB / mid-market / enterprise) — ожидаем enterprise > mid > SMB
266
- - Стаж (<6 мес / 6-24 мес / 24+ мес) — ожидаем постоянные > новые
267
- - Текущая интенсивность использования (топ-квартиль WAM / медиана / нижний) ожидаем тяжёлые пользователи → обновление
268
-
269
- ## Последствия нулевой гипотезы
270
- Если конверсия не достигает 8%:
271
- - **Ниже 3%:** Ценообразование неверное ИЛИ ценность фичи слабая. Триггер: пересмотреть ценообразование; рассмотреть unbundling
272
- - **3-5%:** Сигнал смешанный. Изучить по сегментам: вероятно enterprise внедряет, но mid-market чувствителен к цене
273
- - **5-8%:** Почти достигнуто — продлить наблюдение на 30 дней, скорректировать GTM сообщения, пересмотреть
274
-
275
- ## Связанные эксперименты
276
- - Exp EXP-012: A/B тест сообщений страницы ценообразования (фокус на ценность vs фокус на экономию)
277
- - Exp EXP-015: A/B тест тайминга внутреннего upsell (день 7 vs день 14 vs день 30 с момента права на тир)
278
-
279
- ## Уровень уверенности: Средне-высокий (75%)
280
- ## Ожидаемое P-value если истинно: <0.05 в 90-дневном окне
281
- ```
282
-
283
- ---
284
-
285
- ### Hypothesis Card H-002: LLM Quality Acceptability (F1 assumption)
286
-
287
- ```markdown
288
- # Hypothesis: H-002LLM Quality Acceptable для HR Use Case
289
-
290
- **We believe** GPT-4 level LLMs (primary OpenAI GPT-4-Turbo, fallback Anthropic Claude 3.5)
291
- **For** 30-minute 1:1 performance conversations in English
292
- **Will generate summaries** acceptable to managers >85% of the time
293
- (Acceptable = manager approves без major edits (< 50% content changed))
294
- **We'll know it's true when** в Wizard-of-Oz test:
295
- - Blind quality rating from managers: ≥ 4.0 out of 5.0 average (across N ≥ 100 meetings)
296
- - Hallucination rate: < 5% of summaries contain factually wrong info
297
- - Misattribution rate: < 3% of action items assigned to wrong person
298
- **within** 4 weeks of Wizard-of-Oz testing
299
- **Because**
300
- (1) Recent LLM benchmarks on summarization (Anthropic HELM, OpenAI evals) показывают 87-92% acceptance
301
- (2) Our manual QA на 30 sample prompts achieved 90% acceptable rate
302
- (3) Adjacent use cases (Fireflies.ai, Gong) report >80% customer satisfaction — lower bar but similar
303
-
304
- ## Базовый уровень
305
- - Внутреннее QA тестирование промптов: 90% приемлемо (N=30 ручных тестов)
306
- - Нет внешнего базового уровня конкретно для HR-разговоров
307
- - Уверенность: Средняя (ограниченные HR-специфичные данные)
308
-
309
- ## Порог
310
- - Цель: **≥85% приемлемость** в Wizard-of-Oz
311
- - Обоснование:
312
- - Ниже 85% доверие пользователей рушится, фича становится обузой
313
- - 85-90% = готово к производству
314
- - >90% = превышает ожидания
315
-
316
- ## Guardrails
317
- - P95 задержка генерации 60с (ограничение пользовательского опыта)
318
- - Стоимость одного summary ≤ $0.10 (жизнеспособность — допущение FP5)
319
- - Нулевая утечка данных к LLM-провайдеру (проверено через аудит провайдера)
320
- - Нулевое обучение на данных клиентов (контрактное + техническое соблюдение)
321
-
322
- ## Сегменты для анализа
323
- - Длительность встречи (короткая 5-15 / стандартная 15-45 / длинная 45-120 мин) — ожидаем средняя лучшая
324
- - Тип разговора (планирование / обратная связь / сложный разговор / catch-up) — ожидаем вариативность
325
- - Отрасль клиента (tech / услуги / производство) — ожидаем tech наивысший
326
- - Языковой состав (чистый английский / частично не-английский) — исключить не-английский для MVP
327
-
328
- ## Последствия нулевой гипотезы
329
- Если приемлемость < 85%:
330
- - **<70%:** Убить фичу. LLM не готов для HR сценария, ждать 6-12 месяцев.
331
- - **70-80%:** Запустить с обязательным слоем человеческого контроля (feature flag). Снижает ценностное предложение, но запускается.
332
- - **80-85%:** Обширный prompt engineering + итерация до запуска. Задержка 2-4 недели.
333
-
334
- ## Связанные эксперименты
335
- - **Exp EXP-020: Wizard-of-Oz тест** 20 бета-менеджеров, 100+ встреч итого, слепая оценка качества
336
- - Exp EXP-021: Итерация prompt engineering (A/B разные промпты, измерить приемлемость)
337
-
338
- ## Уровень уверенности: Средний (60%)
339
- ## Инвестиции в риске: $200K engineering + 10 недель задержки при опровержении
340
- ```
341
-
342
- ---
343
-
344
- ### Hypothesis Card H-003: Manager Adoption Rate (V2 assumption)
345
-
346
- ```markdown
347
- # Hypothesis: H-003 Manager Adoption Rate Post-Launch
348
-
349
- **We believe** managers в AI-tier upgraded accounts
350
- **Will** adopt AI summarization at **≥60% weekly usage rate** within 90 days of account upgrade
351
- (Adoption = ≥1 AI-summarized 1:1 per week)
352
- **Because**
353
- (1) Discovery: 6 of 8 managers expressed direct desire for this feature
354
- (2) Removes 3-4 hrs/week admin burden very high individual incentive
355
- (3) Onboarding checklist design will guide first-use в <7 days
356
-
357
- ## Базовый уровень
358
- - Н/П (фича не существовала). Аналог: средний adoption существующих фич Team Tier 55% еженедельного использования за 90 дней.
359
- - Уверенность: Средняя
360
-
361
- ## Порог
362
- - Цель: **60% еженедельный adoption** к Дню 90
363
- - Stretch: 75%
364
- - Обоснование:
365
- - Ниже 50% фича не удерживает; риск оттока
366
- - 50-60% приемлемо, но требует улучшения
367
- - 60-75% — здорово
368
- - 75%+ определяет категорию
369
-
370
- ## Guardrails
371
- - Обратный adoption (отказ) < 10% — пользователи, попробовавшие и остановившиеся
372
- - NPS стабильный или улучшается
373
- - Completion rate action items растёт у тех, кто внедрил (дополнительный сигнал)
374
-
375
- ## Сегменты для анализа
376
- - Размер команды менеджера (малая 3-5 / средняя 6-10 / большая 11+ подчинённых) — ожидаем средняя/большая наивысший
377
- - Стаж менеджера в роли (<2 года / 2-5 / 5+) — ожидаем новые менеджеры наивысший (новинка помогает)
378
- - Отрасль / роль (tech / non-tech) — ожидаем tech наивысший
379
- - Время месяца (сезон оценок vs обычный) — должно быть стабильным
380
-
381
- ## Последствия нулевой гипотезы
382
- Если adoption < 60%:
383
- - **<40%:** Провал фичи пересмотреть дизайн, рассмотреть крупную переработку
384
- - **40-50%:** Требует итерации, вероятно проблемы с онбординговым потоком
385
- - **50-60%:** Почти достигнуто, итерировать онбординг + напоминания
386
-
387
- ## Связанные эксперименты
388
- - Exp EXP-025: A/B тест наличия онбордингового чеклиста (с vs без)
389
- - Exp EXP-026: A/B тест тайминга первого напоминания о встрече
390
- - Текущий: когортный анализ по месяцу активации
391
-
392
- ## Уверенность: Средняя (65%)
393
- ```
394
-
395
- ---
396
-
397
- ### Hypothesis Card H-004: Enterprise Tier Dashboard Upgrade Driver (V3 assumption)
398
-
399
- ```markdown
400
- # Hypothesis: H-004 Aggregate Dashboard Drives Enterprise Tier Upgrades
401
-
402
- **We believe** showing VP HR / CPO buyers aggregate dashboard (cadence + health score + benchmarks)
403
- **Will** drive **5 Enterprise tier upgrades** (to $50+/seat tier) within Q2
404
- **Because**
405
- (1) 4 of 4 buyer interviews explicitly asked для dashboard visibility
406
- (2) 8 of 10 enterprise prospects в Q1 asked «do you have 1:1 analytics?» — current blocker
407
- (3) Existing mid-market → enterprise conversion rate 0% (no offering); we're creating demand
408
-
409
- ## Базовый уровень
410
- - Текущие конверсии Enterprise тира из mid-market: 0/квартал (нет функции дашборда)
411
- - Текущий Enterprise тир = устаревшее ценообразование, 10 аккаунтов дедовских прав
412
- - Уверенность: Средняя (сильный сигнал покупателя, но новое движение)
413
-
414
- ## Порог
415
- - Цель: **5 обновлений Enterprise тира** к 30 июня
416
- - Stretch: 10
417
- - Обоснование:
418
- - 5 = обязательство OKR KR2.1
419
- - На основе 80 подходящих mid-market аккаунтов × 6% конверсия (консервативно) = 5
420
-
421
- ## Guardrails
422
- - Нет каннибализации существующих Enterprise тир аккаунтов (не должны снижаться)
423
- - Размер Enterprise сделки не разбавляется (поддерживается средний ACV)
424
- - Команда продаж не тратит непропорциональное время (мониторинг времени-на-сделку)
425
-
426
- ## Сегменты для анализа
427
- - Размер аккаунта (100-299 / 300-499 / 500+ сотрудников) — ожидаем 300+ наивысшая конверсия
428
- - Текущий тир расходов (Team vs устаревший Enterprise) — Team с >50 местами наиболее вероятный
429
- - Отрасль (регулируемая / нерегулируемая) — регулируемая ниже (барьеры проверки соответствия)
430
-
431
- ## Последствия нулевой гипотезы
432
- Если обновлений < 5:
433
- - **0-2:** Дашборд недостаточно ценен для тирной премии. Пересмотреть область фичи или ценообразование.
434
- - **3-4:** Почти достигнуто продлить срок на 30 дней, улучшить sales motion
435
- - **5+:** Успех, расширить roadmap фич Enterprise тира
436
-
437
- ## Связанные эксперименты
438
- - Exp EXP-030: 3 сессии concierge с design partner (качественный + намерение конверсии)
439
- - Exp EXP-031: A/B вариации питча команды продаж (питч сначала данные vs питч сначала ROI)
440
-
441
- ## Уверенность: Средняя (60%)
442
- ```
443
-
444
- ---
445
-
446
- ### Обзор портфеля карточек гипотез
447
-
448
- | ID | Гипотеза | Уверенность | Метод валидации | Статус | Зависимость запуска |
449
- |----|-----------|:----------:|-------------------|:------:|-----------------|
450
- | H-001 | WTP $8/место премия | 75% | Landing page + разговоры с клиентами | ⏳ До запуска | Запустить ценовой тир |
451
- | H-002 | Качество LLM ≥85% | 60% | Wizard-of-Oz N=100+ | ⏳ Неделя 3-6 | Запустить AI фичу |
452
- | H-003 | 60% еженедельный adoption | 65% | Когортный анализ после запуска | 🔜 После запуска | Итерировать онбординг |
453
- | H-004 | 5 обновлений Enterprise | 60% | Сессии design partner + A/B продаж | ⏳ До запуска | Dashboard MVP |
454
-
455
- ### Дерево решений на основе результатов
456
-
457
- ```
458
- H-002 (качество LLM)
459
- ├── >85% приемлемо → ЗЕЛЁНЫЙ СВЕТ для MVP запуска
460
- ├── 70-85% → Запустить с слоем человеческого контроля, итерировать промпты
461
- └── <70% Задержка 2-3 месяца, ждать улучшения LLM
462
-
463
- H-001 (WTP)
464
- ├── >8% конверсия → Подтверждено, масштабировать GTM
465
- ├── 5-8% Почти достигнуто, итерировать ценообразование / сообщения
466
- └── <5% Ценообразование неверное, пересмотреть цену или unbundle
467
- ```
468
-
469
- > **Урок hypothesis:** 4 hypothesis cards cover **different types of risk**: value (H-001, H-004), feasibility (H-002), usability (H-003). Each с own validation method (landing page, Wizard-of-Oz, cohort analysis, design partner). The **null hypothesis consequences** section — что often skipped — делает кit actionable: «if <X, do Y». Без этого hypothesis cards = wishful thinking. Каждый card links назад к assumption-map risk score, закрывая discovery-to-validation loop.
1
+ ---
2
+ name: hypothesis-template
3
+ description: Тестируемая гипотеза — We believe / Will result in / We'll know when [metric] reaches [threshold]
4
+ type: triggered
5
+ domain: product
6
+ owners:
7
+ - data_analyst
8
+ gates:
9
+ - DATA_ANALYST
10
+ tech: []
11
+ topic: []
12
+ triggers:
13
+ - hypothesis-template
14
+ - hypothesis
15
+ - гипотеза
16
+ related: []
17
+ budget_lines: 484
18
+ schema_version: 1
19
+ ---
20
+ # Hypothesis Template
21
+
22
+ > **Категория:** Experimentation · **Slug:** `hypothesis-template`
23
+
24
+ ## Когда использовать
25
+
26
+ - Перед каждым experiment (A/B test, rollout, prototype test).
27
+ - При assumption validation convert assumption в testable hypothesis.
28
+ - Для pre-mortem решений «если мы делаем X, что ожидаем?».
29
+ - Как часть PRD success criteria.
30
+
31
+ ## Вход
32
+
33
+ | Поле | Обязательно | Описание |
34
+ |------|:-----------:|----------|
35
+ | Предлагаемое изменение / фича | ✅ | Что тестируем |
36
+ | Лежащее в основе допущение | | Почему думаем, что сработает |
37
+ | Метрика результата | | Что измеряем |
38
+ | Базовые данные | | Текущий уровень метрики |
39
+
40
+ ## Источники данных
41
+
42
+ 1. `$assumption-mapping` — какие допущения тестировать.
43
+ 2. `$saas-metrics` + `$aarrr-metrics` для выбора метрики результата.
44
+ 3. Исторические данные базовый уровень.
45
+ 4. Отраслевые бенчмарки ожидаемые размеры эффекта.
46
+
47
+ ### Связь с другими скилами
48
+
49
+ | Скил | Что берём | Когда вызывать |
50
+ |------|-----------|----------------|
51
+ | `assumption-mapping` | Наиболее рискованные допущения гипотезы | Перед hypothesis |
52
+ | `ab-test-design` | Метод тестирования | После hypothesis |
53
+ | `saas-metrics` | Метрики результата | Для измерения |
54
+ | `north-star-metric` | Выравнивание первичной метрики | Для тестов, связанных с NSM |
55
+
56
+ ## Формат (Canonical)
57
+
58
+ > **We believe** [proposed change / hypothesis]
59
+ > **For** [target user / segment]
60
+ > **Will result in** [expected outcome]
61
+ > **We'll know it's true when** [metric] **reaches** [threshold] **within** [timeframe]
62
+ > **Because** [underlying rationale]
63
+
64
+ Пример:
65
+ > **We believe** adding an in-app onboarding checklist
66
+ > **For** new users (trial signups, first 7 days)
67
+ > **Will result in** higher activation rate
68
+ > **We'll know it's true when** 7-day activation rate reaches **45%** (from baseline **32%**) **within** 6 weeks of rollout
69
+ > **Because** 12/15 interviews показали confusion about first steps, и competitor data suggests checklist approach drives +40% activation в category.
70
+
71
+ ## Протокол
72
+
73
+ ### Шаг 1 Формулировка гипотезы
74
+
75
+ **We believe:** конкретное изменение (фича, текст, поток)
76
+ **For:** конкретный сегмент пользователей (не «все пользователи»)
77
+ **Will result in:** направленный результат + метрика
78
+
79
+ Правила:
80
+ - Конкретное изменение, не расплывчатое («улучшить UX»)
81
+ - Конкретный пользователь, не «пользователи»
82
+ - Конкретный результат, не «лучшая вовлечённость»
83
+
84
+ ### Шаг 2 — Outcome Metric Selection
85
+
86
+ Первичная метрика должна быть:
87
+ - **Измеримой:** инструментирована или может быть инструментирована
88
+ - **Опережающей или запаздывающей:** знать которой
89
+ - **Согласованной:** связана с NSM / OKR
90
+ - **Защищённой от манипуляций:** не поддаётся лёгкому искажению
91
+
92
+ Распространённые метрики результата по типу гипотезы:
93
+ - **Гипотеза онбординга/активации:** 7-дневный activation rate, time-to-first-value
94
+ - **Гипотеза retention:** W/W retention, churn rate, частота использования
95
+ - **Гипотеза монетизации:** conversion rate, ARPA, upsell rate
96
+ - **Гипотеза вовлечённости:** DAU/MAU, длительность сессии, действия за сессию
97
+
98
+ ### Шаг 3 — Baseline + Threshold
99
+
100
+ **Базовый уровень:** текущий уровень (на основе недавнего окна данных).
101
+
102
+ **Порог:** что сигнализирует о «подтверждении гипотезы»? Два подхода:
103
+
104
+ 1. **Абсолютный:** «45% activation» (определённое абсолютное число)
105
+ 2. **Относительный:** «+20% activation» или «+5pp»
106
+
107
+ Обоснование порога:
108
+ - На основе бизнес-потребности (какой прирост делает запуск оправданным)
109
+ - На основе обнаруживаемого эффекта (какой объём выборки поддерживает)
110
+ - На основе отраслевых бенчмарков
111
+
112
+ ### Шаг 4 — Timeframe
113
+
114
+ - Слишком короткий = шум
115
+ - Слишком длинный = медленный цикл обучения
116
+ - Типичный для B2B SaaS: 4-8 недель для activation, 8-12 для retention
117
+
118
+ Обоснование: почему такая продолжительность?
119
+
120
+ ### Шаг 5 «Because» Rationale
121
+
122
+ Лежащие в основе доказательства:
123
+ - Исследование пользователей (цитаты, интервью)
124
+ - Исторические данные (прошлые похожие изменения)
125
+ - Отраслевые бенчмарки
126
+ - Поведение конкурентов
127
+
128
+ Без «because» — угадывание. С доказательствами — осознанная ставка.
129
+
130
+ ### Шаг 6 — Null Hypothesis (Explicit)
131
+
132
+ Что если гипотеза не подтверждается? Что это означает:
133
+ - Допущение не выдерживает проверки
134
+ - Нужна новая гипотеза
135
+ - Фича не запускается, ресурсы переходят к другому
136
+
137
+ Будьте готовы отказаться от идеи, если данные говорят об этом.
138
+
139
+ ### Шаг 7 Guardrail Metrics
140
+
141
+ Что **не должно** деградировать даже при улучшении первичной метрики:
142
+ - Churn rate (не должен расти)
143
+ - NPS
144
+ - Объём тикетов поддержки
145
+ - Метрики производительности
146
+ - Выручка на пользователя (если рост вовлечённости идёт за счёт ARPA)
147
+
148
+ Если guardrail нарушается несмотря на победу первичной метрики — считать провалом.
149
+
150
+ ### Шаг 8 Confidence Level
151
+
152
+ Байесовский неформальный:
153
+ - **Высокая уверенность** (80%+): Сильные доказательства, похожие успешные запуски, чёткий механизм
154
+ - **Средняя** (50-80%): Умеренные доказательства, новый механизм
155
+ - **Низкая** (<50%): Исследовательская, много допущений
156
+
157
+ Определяет инвестиции в эксперименты (более крупные тесты для низкой уверенности).
158
+
159
+ ### Шаг 9 Segment Analysis Plan
160
+
161
+ Указать сегменты для анализа после теста:
162
+ - По размеру компании (SMB / mid / enterprise)
163
+ - По роли пользователя (buyer / end-user / admin)
164
+ - По тиру тарифного плана
165
+ - По стажу (новые / постоянные)
166
+
167
+ Общий прирост + разбивка по сегментам.
168
+
169
+ ## Валидация (Quality Gate)
170
+
171
+ - [ ] Все 5 компонентов (believe / for / result / know / because) заполнены
172
+ - [ ] Конкретное изменение + конкретный сегмент пользователей
173
+ - [ ] Метрика результата измерима + инструментирована
174
+ - [ ] Базовые данные предоставлены (недавнее окно)
175
+ - [ ] Порог обоснован (бизнес + обнаруживаемость)
176
+ - [ ] Обоснование временных рамок
177
+ - [ ] Обоснование ссылается на ≥ 2 источника доказательств
178
+ - [ ] Последствия нулевой гипотезы явны
179
+ - [ ] Guardrail метрики перечислены
180
+ - [ ] Уровень уверенности указан
181
+ - [ ] План сегментного анализа
182
+
183
+ ## Handoff
184
+
185
+ Результат является входом для:
186
+ - **`ab-test-design`** метод тестирования
187
+ - **Data Analyst** инструментирование
188
+ - **PM** секция критериев успеха PRD
189
+ - **Engineering** → настройка feature flag
190
+
191
+ Формат: hypothesis card (markdown). Через `$handoff`.
192
+
193
+ ## Anti-patterns
194
+
195
+ | Ошибка | Почему плохо | Как правильно |
196
+ |--------|-------------|---------------|
197
+ | Расплывчатое изменение | Не тестируется | Конкретная реализация |
198
+ | «Все пользователи» | Размывает сигнал | Конкретный сегмент |
199
+ | Нет базового уровня | Невозможно обнаружить изменение | Сначала базовые данные |
200
+ | Нет порога | «Улучшится» | Числовой порог + обоснование |
201
+ | Нет обоснования | Угадывание | ≥ 2 источника доказательств |
202
+ | Нет guardrails | Невидимый ущерб | Явные guardrails |
203
+ | Игнорируемая нулевая гипотеза | Никогда не убивают проигрывающие идеи | Подготовить условия отказа |
204
+
205
+ ## Шаблон
206
+
207
+ ```markdown
208
+ # Hypothesis: [Короткое название]
209
+
210
+ **We believe** [изменение]
211
+ **For** [сегмент]
212
+ **Will result in** [результат]
213
+ **We'll know it's true when** [метрика] reaches [порог] within [временные рамки]
214
+ **Because** [обоснование, ≥2 источника доказательств]
215
+
216
+ ## Базовый уровень
217
+ - Текущий [метрика]: X
218
+ - Окно данных: [последние 30 дней и т.д.]
219
+ - Уверенность: Средняя
220
+
221
+ ## Порог
222
+ - Цель: X Y
223
+ - Обоснование: [бизнес-потребность + обнаруживаемость + бенчмарк]
224
+
225
+ ## Guardrails
226
+ - Churn < [порог]
227
+ - NPS [порог]
228
+ - Тикеты поддержки < [порог]
229
+
230
+ ## Сегменты для анализа
231
+ - Размер компании
232
+ - Роль пользователя
233
+
234
+ ## Последствия нулевой гипотезы
235
+ Если метрика не достигает Y:
236
+ - Допущение X не выдерживает проверки
237
+ - Запускать? Вероятно нет данные говорят, что нет соответствия
238
+ ```
239
+
240
+ ## Worked Example — TeamFlow Hypothesis Cards (4 cards для AI Summarization launch)
241
+
242
+ **Контекст:** Pre-MVP запуск, data analyst формирует карточки гипотез для каждого высокорискового допущения из assumption-map. Каждая карточка будет проверена через конкретный эксперимент.
243
+
244
+ ### Hypothesis Card H-001: AI Summary Willingness to Pay (V1 assumption)
245
+
246
+ ```markdown
247
+ # Hypothesis: H-001 Willingness to Pay для AI Tier
248
+
249
+ **We believe** adding AI Summarization as Team Tier feature (+$8/seat/month premium)
250
+ **For** TeamFlow customer base (200 existing Core accounts) + new trial signups с manager workflows
251
+ **Will result in** 40 account upgrades to AI Team Tier within first quarter post-launch
252
+ **We'll know it's true when** AI Team Tier adoption reaches **20%** of 200 existing customer base
253
+ (baseline: 0% (tier не existing pre-launch); target = 40 of 200 customer accounts upgrade)
254
+ **within** 90 days post-launch
255
+ **Because**
256
+ (1) 7 of 10 customer conversations в landing page test confirmed «we'd pay $10/seat for AI summaries»
257
+ (2) Competitor ChatGPT Teams priced at $25/user shows price ceiling exists (we're well-below)
258
+ (3) Post-Discovery survey: 34% of customers expressed interest в AI summarization, suggesting 20% conversion realistic conservative target
259
+
260
+ ## Базовый уровень
261
+ - Текущий adoption AI Tier: 0 аккаунтов (тир не существовал до запуска)
262
+ - Исторический темп обновления Core Team Tier: 12% / год (отраслевая норма)
263
+ - Окно данных: Q4 2025 + Q1 2026 (6 месяцев) — для базового churn / NPS
264
+ - Уверенность: Средне-высокая (проверена в 2 методах исследования клиентов)
265
+
266
+ ## Порог
267
+ - Цель: **20% конверсия** базы 200 клиентов за 90 дней = 40 аккаунтов
268
+ - Обоснование:
269
+ - Бизнес-потребность: OKR KR1.1 «40 аккаунтов обновлено»
270
+ - Верхняя граница: 34% выразили интерес (опрос Discovery) → 20% конверсия предполагает 60% конверсию интереса в обновление
271
+ - Бенчмарк: Успешные запуски premium-тиров B2B SaaS достигают 15-25% в первые 90 дней, когда фича соответствует потребности
272
+
273
+ ## Guardrails
274
+ - Churn rate < 9% (от базового 8%) — если ценообразование вызывает отток
275
+ - NPS ≥ 43 (от базового 45) — если нарушение тиров вызывает неудовлетворённость
276
+ - Тикеты поддержки «ценообразование / путаница с тирами» < 5% от всех тикетов
277
+ - Отток Core-тира не должен ускоряться (максимум +0.5pp)
278
+
279
+ ## Сегменты для анализа
280
+ - Размер компании (SMB / mid-market / enterprise) ожидаем enterprise > mid > SMB
281
+ - Стаж (<6 мес / 6-24 мес / 24+ мес) — ожидаем постоянные > новые
282
+ - Текущая интенсивность использования (топ-квартиль WAM / медиана / нижний) — ожидаем тяжёлые пользователи → обновление
283
+
284
+ ## Последствия нулевой гипотезы
285
+ Если конверсия не достигает 8%:
286
+ - **Ниже 3%:** Ценообразование неверное ИЛИ ценность фичи слабая. Триггер: пересмотреть ценообразование; рассмотреть unbundling
287
+ - **3-5%:** Сигнал смешанный. Изучить по сегментам: вероятно enterprise внедряет, но mid-market чувствителен к цене
288
+ - **5-8%:** Почти достигнуто продлить наблюдение на 30 дней, скорректировать GTM сообщения, пересмотреть
289
+
290
+ ## Связанные эксперименты
291
+ - Exp EXP-012: A/B тест сообщений страницы ценообразования (фокус на ценность vs фокус на экономию)
292
+ - Exp EXP-015: A/B тест тайминга внутреннего upsell (день 7 vs день 14 vs день 30 с момента права на тир)
293
+
294
+ ## Уровень уверенности: Средне-высокий (75%)
295
+ ## Ожидаемое P-value если истинно: <0.05 в 90-дневном окне
296
+ ```
297
+
298
+ ---
299
+
300
+ ### Hypothesis Card H-002: LLM Quality Acceptability (F1 assumption)
301
+
302
+ ```markdown
303
+ # Hypothesis: H-002 — LLM Quality Acceptable для HR Use Case
304
+
305
+ **We believe** GPT-4 level LLMs (primary OpenAI GPT-4-Turbo, fallback Anthropic Claude 3.5)
306
+ **For** 30-minute 1:1 performance conversations in English
307
+ **Will generate summaries** acceptable to managers >85% of the time
308
+ (Acceptable = manager approves без major edits (< 50% content changed))
309
+ **We'll know it's true when** в Wizard-of-Oz test:
310
+ - Blind quality rating from managers: ≥ 4.0 out of 5.0 average (across N ≥ 100 meetings)
311
+ - Hallucination rate: < 5% of summaries contain factually wrong info
312
+ - Misattribution rate: < 3% of action items assigned to wrong person
313
+ **within** 4 weeks of Wizard-of-Oz testing
314
+ **Because**
315
+ (1) Recent LLM benchmarks on summarization (Anthropic HELM, OpenAI evals) показывают 87-92% acceptance
316
+ (2) Our manual QA на 30 sample prompts achieved 90% acceptable rate
317
+ (3) Adjacent use cases (Fireflies.ai, Gong) report >80% customer satisfaction — lower bar but similar
318
+
319
+ ## Базовый уровень
320
+ - Внутреннее QA тестирование промптов: 90% приемлемо (N=30 ручных тестов)
321
+ - Нет внешнего базового уровня конкретно для HR-разговоров
322
+ - Уверенность: Средняя (ограниченные HR-специфичные данные)
323
+
324
+ ## Порог
325
+ - Цель: **≥85% приемлемость** в Wizard-of-Oz
326
+ - Обоснование:
327
+ - Ниже 85% → доверие пользователей рушится, фича становится обузой
328
+ - 85-90% = готово к производству
329
+ - >90% = превышает ожидания
330
+
331
+ ## Guardrails
332
+ - P95 задержка генерации 60с (ограничение пользовательского опыта)
333
+ - Стоимость одного summary ≤ $0.10 (жизнеспособность — допущение FP5)
334
+ - Нулевая утечка данных к LLM-провайдеру (проверено через аудит провайдера)
335
+ - Нулевое обучение на данных клиентов (контрактное + техническое соблюдение)
336
+
337
+ ## Сегменты для анализа
338
+ - Длительность встречи (короткая 5-15 / стандартная 15-45 / длинная 45-120 мин) — ожидаем средняя лучшая
339
+ - Тип разговора (планирование / обратная связь / сложный разговор / catch-up) — ожидаем вариативность
340
+ - Отрасль клиента (tech / услуги / производство) — ожидаем tech наивысший
341
+ - Языковой состав (чистый английский / частично не-английский) — исключить не-английский для MVP
342
+
343
+ ## Последствия нулевой гипотезы
344
+ Если приемлемость < 85%:
345
+ - **<70%:** Убить фичу. LLM не готов для HR сценария, ждать 6-12 месяцев.
346
+ - **70-80%:** Запустить с обязательным слоем человеческого контроля (feature flag). Снижает ценностное предложение, но запускается.
347
+ - **80-85%:** Обширный prompt engineering + итерация до запуска. Задержка 2-4 недели.
348
+
349
+ ## Связанные эксперименты
350
+ - **Exp EXP-020: Wizard-of-Oz тест** 20 бета-менеджеров, 100+ встреч итого, слепая оценка качества
351
+ - Exp EXP-021: Итерация prompt engineering (A/B разные промпты, измерить приемлемость)
352
+
353
+ ## Уровень уверенности: Средний (60%)
354
+ ## Инвестиции в риске: $200K engineering + 10 недель задержки при опровержении
355
+ ```
356
+
357
+ ---
358
+
359
+ ### Hypothesis Card H-003: Manager Adoption Rate (V2 assumption)
360
+
361
+ ```markdown
362
+ # Hypothesis: H-003 Manager Adoption Rate Post-Launch
363
+
364
+ **We believe** managers в AI-tier upgraded accounts
365
+ **Will** adopt AI summarization at **≥60% weekly usage rate** within 90 days of account upgrade
366
+ (Adoption = ≥1 AI-summarized 1:1 per week)
367
+ **Because**
368
+ (1) Discovery: 6 of 8 managers expressed direct desire for this feature
369
+ (2) Removes 3-4 hrs/week admin burden — very high individual incentive
370
+ (3) Onboarding checklist design will guide first-use в <7 days
371
+
372
+ ## Базовый уровень
373
+ - Н/П (фича не существовала). Аналог: средний adoption существующих фич Team Tier 55% еженедельного использования за 90 дней.
374
+ - Уверенность: Средняя
375
+
376
+ ## Порог
377
+ - Цель: **60% еженедельный adoption** к Дню 90
378
+ - Stretch: 75%
379
+ - Обоснование:
380
+ - Ниже 50% — фича не удерживает; риск оттока
381
+ - 50-60% приемлемо, но требует улучшения
382
+ - 60-75% здорово
383
+ - 75%+определяет категорию
384
+
385
+ ## Guardrails
386
+ - Обратный adoption (отказ) < 10% — пользователи, попробовавшие и остановившиеся
387
+ - NPS стабильный или улучшается
388
+ - Completion rate action items растёт у тех, кто внедрил (дополнительный сигнал)
389
+
390
+ ## Сегменты для анализа
391
+ - Размер команды менеджера (малая 3-5 / средняя 6-10 / большая 11+ подчинённых) — ожидаем средняя/большая наивысший
392
+ - Стаж менеджера в роли (<2 года / 2-5 / 5+) — ожидаем новые менеджеры наивысший (новинка помогает)
393
+ - Отрасль / роль (tech / non-tech) — ожидаем tech наивысший
394
+ - Время месяца (сезон оценок vs обычный) — должно быть стабильным
395
+
396
+ ## Последствия нулевой гипотезы
397
+ Если adoption < 60%:
398
+ - **<40%:** Провал фичи — пересмотреть дизайн, рассмотреть крупную переработку
399
+ - **40-50%:** Требует итерации, вероятно проблемы с онбординговым потоком
400
+ - **50-60%:** Почти достигнуто, итерировать онбординг + напоминания
401
+
402
+ ## Связанные эксперименты
403
+ - Exp EXP-025: A/B тест наличия онбордингового чеклиста (с vs без)
404
+ - Exp EXP-026: A/B тест тайминга первого напоминания о встрече
405
+ - Текущий: когортный анализ по месяцу активации
406
+
407
+ ## Уверенность: Средняя (65%)
408
+ ```
409
+
410
+ ---
411
+
412
+ ### Hypothesis Card H-004: Enterprise Tier Dashboard Upgrade Driver (V3 assumption)
413
+
414
+ ```markdown
415
+ # Hypothesis: H-004 Aggregate Dashboard Drives Enterprise Tier Upgrades
416
+
417
+ **We believe** showing VP HR / CPO buyers aggregate dashboard (cadence + health score + benchmarks)
418
+ **Will** drive **5 Enterprise tier upgrades** (to $50+/seat tier) within Q2
419
+ **Because**
420
+ (1) 4 of 4 buyer interviews explicitly asked для dashboard visibility
421
+ (2) 8 of 10 enterprise prospects в Q1 asked «do you have 1:1 analytics?» — current blocker
422
+ (3) Existing mid-market enterprise conversion rate 0% (no offering); we're creating demand
423
+
424
+ ## Базовый уровень
425
+ - Текущие конверсии Enterprise тира из mid-market: 0/квартал (нет функции дашборда)
426
+ - Текущий Enterprise тир = устаревшее ценообразование, 10 аккаунтов дедовских прав
427
+ - Уверенность: Средняя (сильный сигнал покупателя, но новое движение)
428
+
429
+ ## Порог
430
+ - Цель: **5 обновлений Enterprise тира** к 30 июня
431
+ - Stretch: 10
432
+ - Обоснование:
433
+ - 5 = обязательство OKR KR2.1
434
+ - На основе 80 подходящих mid-market аккаунтов × 6% конверсия (консервативно) = 5
435
+
436
+ ## Guardrails
437
+ - Нет каннибализации существующих Enterprise тир аккаунтов (не должны снижаться)
438
+ - Размер Enterprise сделки не разбавляется (поддерживается средний ACV)
439
+ - Команда продаж не тратит непропорциональное время (мониторинг времени-на-сделку)
440
+
441
+ ## Сегменты для анализа
442
+ - Размер аккаунта (100-299 / 300-499 / 500+ сотрудников) — ожидаем 300+ наивысшая конверсия
443
+ - Текущий тир расходов (Team vs устаревший Enterprise) — Team с >50 местами наиболее вероятный
444
+ - Отрасль (регулируемая / нерегулируемая) — регулируемая ниже (барьеры проверки соответствия)
445
+
446
+ ## Последствия нулевой гипотезы
447
+ Если обновлений < 5:
448
+ - **0-2:** Дашборд недостаточно ценен для тирной премии. Пересмотреть область фичи или ценообразование.
449
+ - **3-4:** Почти достигнуто — продлить срок на 30 дней, улучшить sales motion
450
+ - **5+:** Успех, расширить roadmap фич Enterprise тира
451
+
452
+ ## Связанные эксперименты
453
+ - Exp EXP-030: 3 сессии concierge с design partner (качественный + намерение конверсии)
454
+ - Exp EXP-031: A/B вариации питча команды продаж (питч сначала данные vs питч сначала ROI)
455
+
456
+ ## Уверенность: Средняя (60%)
457
+ ```
458
+
459
+ ---
460
+
461
+ ### Обзор портфеля карточек гипотез
462
+
463
+ | ID | Гипотеза | Уверенность | Метод валидации | Статус | Зависимость запуска |
464
+ |----|-----------|:----------:|-------------------|:------:|-----------------|
465
+ | H-001 | WTP $8/место премия | 75% | Landing page + разговоры с клиентами | ⏳ До запуска | Запустить ценовой тир |
466
+ | H-002 | Качество LLM ≥85% | 60% | Wizard-of-Oz N=100+ | ⏳ Неделя 3-6 | Запустить AI фичу |
467
+ | H-003 | 60% еженедельный adoption | 65% | Когортный анализ после запуска | 🔜 После запуска | Итерировать онбординг |
468
+ | H-004 | 5 обновлений Enterprise | 60% | Сессии design partner + A/B продаж | ⏳ До запуска | Dashboard MVP |
469
+
470
+ ### Дерево решений на основе результатов
471
+
472
+ ```
473
+ H-002 (качество LLM)
474
+ ├── >85% приемлемо → ЗЕЛЁНЫЙ СВЕТ для MVP запуска
475
+ ├── 70-85% → Запустить с слоем человеческого контроля, итерировать промпты
476
+ └── <70% → Задержка 2-3 месяца, ждать улучшения LLM
477
+
478
+ H-001 (WTP)
479
+ ├── >8% конверсия → Подтверждено, масштабировать GTM
480
+ ├── 5-8% → Почти достигнуто, итерировать ценообразование / сообщения
481
+ └── <5% → Ценообразование неверное, пересмотреть цену или unbundle
482
+ ```
483
+
484
+ > **Урок hypothesis:** 4 hypothesis cards cover **different types of risk**: value (H-001, H-004), feasibility (H-002), usability (H-003). Each с own validation method (landing page, Wizard-of-Oz, cohort analysis, design partner). The **null hypothesis consequences** section — что often skipped — делает кit actionable: «if <X, do Y». Без этого hypothesis cards = wishful thinking. Каждый card links назад к assumption-map risk score, закрывая discovery-to-validation loop.