npm - @luanpdd/kit-mcp - Versions diffs - 1.30.2 → 1.31.0 - Mend

@luanpdd/kit-mcp 1.30.2 → 1.31.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (347) hide show

package/LICENSE +21 -21
package/README.md +168 -168
package/gates/agent-no-recursive-dispatch.md +84 -82
package/kit/COMANDOS.md +138 -138
package/kit/README.md +76 -76
package/kit/agents/advisor-researcher.md +107 -106
package/kit/agents/ai-mutation-tester.md +1 -0
package/kit/agents/assumptions-analyzer.md +108 -107
package/kit/agents/audit-log-implementer.md +314 -313
package/kit/agents/auditor-consistencia-isolamento.md +414 -413
package/kit/agents/b2b-saas-architect.md +157 -156
package/kit/agents/burn-rate-forecaster.md +1 -0
package/kit/agents/cascading-failures-auditor.md +299 -298
package/kit/agents/codebase-mapper.md +769 -768
package/kit/agents/crm-pipeline-implementer.md +257 -256
package/kit/agents/debugger.md +814 -813
package/kit/agents/detector-tenant-quente.md +338 -337
package/kit/agents/evolution-go-integrator.md +201 -200
package/kit/agents/example-reviewer.md +22 -21
package/kit/agents/executor.md +565 -564
package/kit/agents/golden-signals-instrumenter.md +1 -0
package/kit/agents/incident-investigator.md +1 -0
package/kit/agents/integration-checker.md +201 -200
package/kit/agents/invite-flow-implementer.md +190 -189
package/kit/agents/legacy-characterizer.md +369 -368
package/kit/agents/lgpd-compliance-auditor.md +296 -295
package/kit/agents/load-shedding-instrumenter.md +1 -0
package/kit/agents/multi-tenant-isolation-auditor.md +254 -253
package/kit/agents/multi-tenant-rls-writer.md +341 -340
package/kit/agents/nyquist-auditor.md +179 -178
package/kit/agents/observability-coverage-auditor.md +316 -315
package/kit/agents/observability-instrumenter.md +1 -0
package/kit/agents/omm-auditor.md +1 -0
package/kit/agents/org-onboarding-implementer.md +224 -223
package/kit/agents/payload-capture-instrumenter.md +274 -273
package/kit/agents/phase-researcher.md +697 -696
package/kit/agents/plan-checker.md +273 -272
package/kit/agents/planner.md +923 -922
package/kit/agents/postmortem-writer.md +1 -0
package/kit/agents/project-researcher.md +653 -652
package/kit/agents/prr-conductor.md +1 -0
package/kit/agents/refactor-safety-auditor.md +405 -404
package/kit/agents/release-pipeline-auditor.md +1 -0
package/kit/agents/research-synthesizer.md +246 -245
package/kit/agents/roadmapper.md +678 -677
package/kit/agents/schema-checker.md +1 -0
package/kit/agents/seam-finder.md +360 -359
package/kit/agents/shotgun-surgery-detector.md +350 -349
package/kit/agents/slo-engineer.md +1 -0
package/kit/agents/storytelling-analyst.md +1 -0
package/kit/agents/supabase-architect.md +1 -0
package/kit/agents/supabase-auth-bootstrapper.md +1 -0
package/kit/agents/supabase-branching-architect.md +563 -562
package/kit/agents/supabase-cicd-pipeline-implementer.md +778 -777
package/kit/agents/supabase-column-privileges-writer.md +400 -399
package/kit/agents/supabase-edge-fn-tester.md +2 -1
package/kit/agents/supabase-edge-fn-writer.md +2 -1
package/kit/agents/supabase-migration-writer.md +386 -385
package/kit/agents/supabase-rbac-implementer.md +393 -392
package/kit/agents/supabase-realtime-implementer.md +364 -363
package/kit/agents/supabase-rls-hardener.md +522 -521
package/kit/agents/supabase-rls-writer.md +324 -323
package/kit/agents/supabase-roles-implementer.md +356 -355
package/kit/agents/supabase-storage-implementer.md +1 -0
package/kit/agents/super-admin-implementer.md +282 -281
package/kit/agents/toil-auditor.md +1 -0
package/kit/agents/ui-auditor.md +438 -437
package/kit/agents/ui-checker.md +303 -302
package/kit/agents/ui-researcher.md +356 -355
package/kit/agents/user-profiler.md +176 -175
package/kit/agents/validador-evolucao-schema.md +336 -335
package/kit/agents/verifier.md +729 -728
package/kit/commands/adicionar-backlog.md +75 -75
package/kit/commands/adicionar-fase.md +42 -42
package/kit/commands/adicionar-tarefa.md +45 -45
package/kit/commands/adicionar-testes.md +41 -41
package/kit/commands/ajuda.md +21 -21
package/kit/commands/atualizar.md +37 -37
package/kit/commands/auditar-cascading.md +111 -111
package/kit/commands/auditar-marco.md +179 -179
package/kit/commands/auditar-observabilidade-cobertura.md +183 -183
package/kit/commands/auditar-refactor.md +219 -219
package/kit/commands/auditar-release.md +109 -109
package/kit/commands/auditar-uat.md +23 -23
package/kit/commands/autonomo.md +40 -40
package/kit/commands/branch-pr.md +24 -24
package/kit/commands/burn-rate-status.md +408 -408
package/kit/commands/capturar-payloads.md +193 -193
package/kit/commands/caracterizar.md +212 -212
package/kit/commands/concluir-marco.md +247 -247
package/kit/commands/configuracoes.md +36 -36
package/kit/commands/dados-distribuidos.md +188 -188
package/kit/commands/definir-perfil.md +10 -10
package/kit/commands/depurar.md +190 -190
package/kit/commands/detectar-duplicacao.md +197 -197
package/kit/commands/discutir-fase.md +131 -131
package/kit/commands/encontrar-seams.md +136 -136
package/kit/commands/entrar-discord.md +17 -17
package/kit/commands/estatisticas.md +18 -18
package/kit/commands/example-greeting.md +33 -33
package/kit/commands/executar-fase.md +58 -58
package/kit/commands/expresso.md +56 -56
package/kit/commands/fase-ui.md +34 -34
package/kit/commands/fazer.md +57 -57
package/kit/commands/fio.md +125 -125
package/kit/commands/fluxos-trabalho.md +64 -64
package/kit/commands/forense.md +176 -176
package/kit/commands/gerenciador.md +38 -38
package/kit/commands/inserir-fase.md +31 -31
package/kit/commands/legacy.md +263 -263
package/kit/commands/limpeza.md +17 -17
package/kit/commands/listar-hipoteses-fase.md +45 -45
package/kit/commands/listar-workspaces.md +18 -18
package/kit/commands/load-shedding.md +117 -117
package/kit/commands/mapear-codebase.md +70 -70
package/kit/commands/multi-tenant.md +163 -163
package/kit/commands/nota.md +33 -33
package/kit/commands/novo-marco.md +43 -43
package/kit/commands/novo-projeto.md +41 -41
package/kit/commands/novo-workspace.md +43 -43
package/kit/commands/pausar-trabalho.md +37 -37
package/kit/commands/perfil-usuario.md +45 -45
package/kit/commands/pesquisar-fase.md +195 -195
package/kit/commands/planejar-fase.md +67 -67
package/kit/commands/planejar-lacunas.md +33 -33
package/kit/commands/plantar-ideia.md +25 -25
package/kit/commands/progresso.md +24 -24
package/kit/commands/proximo.md +30 -30
package/kit/commands/publicar.md +490 -490
package/kit/commands/rapido.md +35 -35
package/kit/commands/reaplicar-patches.md +124 -124
package/kit/commands/refactor-seguro.md +321 -321
package/kit/commands/relatorio-sessao.md +19 -19
package/kit/commands/remover-fase.md +31 -31
package/kit/commands/remover-workspace.md +26 -26
package/kit/commands/resumo-marco.md +50 -50
package/kit/commands/retomar-trabalho.md +40 -40
package/kit/commands/revisar-backlog.md +60 -60
package/kit/commands/revisar-ui.md +32 -32
package/kit/commands/revisar.md +37 -37
package/kit/commands/saude.md +21 -21
package/kit/commands/setup-notion.md +93 -93
package/kit/commands/storytelling.md +179 -179
package/kit/commands/sync-main.md +68 -68
package/kit/commands/validar-fase.md +35 -35
package/kit/commands/verificar-tarefas.md +44 -44
package/kit/commands/verificar-trabalho.md +64 -64
package/kit/file-manifest.json +82 -81
package/kit/framework/bin/lib/commands.cjs +959 -959
package/kit/framework/bin/lib/config.cjs +442 -442
package/kit/framework/bin/lib/core.cjs +1230 -1230
package/kit/framework/bin/lib/frontmatter.cjs +336 -336
package/kit/framework/bin/lib/init.cjs +1442 -1442
package/kit/framework/bin/lib/milestone.cjs +252 -252
package/kit/framework/bin/lib/model-profiles.cjs +68 -68
package/kit/framework/bin/lib/phase.cjs +888 -888
package/kit/framework/bin/lib/profile-output.cjs +952 -952
package/kit/framework/bin/lib/profile-pipeline.cjs +539 -539
package/kit/framework/bin/lib/roadmap.cjs +329 -329
package/kit/framework/bin/lib/security.cjs +382 -382
package/kit/framework/bin/lib/state.cjs +1031 -1031
package/kit/framework/bin/lib/template.cjs +222 -222
package/kit/framework/bin/lib/uat.cjs +282 -282
package/kit/framework/bin/lib/verify.cjs +888 -888
package/kit/framework/bin/lib/workstream.cjs +491 -491
package/kit/framework/bin/tools.cjs +918 -918
package/kit/framework/commands/workstreams.md +63 -63
package/kit/framework/references/checkpoints.md +778 -778
package/kit/framework/references/continuation-format.md +249 -249
package/kit/framework/references/decimal-phase-calculation.md +64 -64
package/kit/framework/references/git-integration.md +295 -295
package/kit/framework/references/git-planning-commit.md +38 -38
package/kit/framework/references/model-profile-resolution.md +36 -36
package/kit/framework/references/model-profiles.md +139 -139
package/kit/framework/references/phase-argument-parsing.md +61 -61
package/kit/framework/references/planning-config.md +202 -202
package/kit/framework/references/questioning.md +162 -162
package/kit/framework/references/tdd.md +263 -263
package/kit/framework/references/ui-brand.md +160 -160
package/kit/framework/references/user-profiling.md +657 -657
package/kit/framework/references/verification-patterns.md +612 -612
package/kit/framework/references/workstream-flag.md +58 -58
package/kit/framework/templates/DEBUG.md +164 -164
package/kit/framework/templates/UAT.md +265 -265
package/kit/framework/templates/UI-SPEC.md +100 -100
package/kit/framework/templates/VALIDATION.md +76 -76
package/kit/framework/templates/claude-md.md +122 -122
package/kit/framework/templates/codebase/architecture.md +185 -185
package/kit/framework/templates/codebase/concerns.md +205 -205
package/kit/framework/templates/codebase/conventions.md +204 -204
package/kit/framework/templates/codebase/integrations.md +192 -192
package/kit/framework/templates/codebase/stack.md +158 -158
package/kit/framework/templates/codebase/structure.md +199 -199
package/kit/framework/templates/codebase/testing.md +301 -301
package/kit/framework/templates/config.json +44 -44
package/kit/framework/templates/context.md +352 -352
package/kit/framework/templates/continue-here.md +78 -78
package/kit/framework/templates/copilot-instructions.md +7 -7
package/kit/framework/templates/debug-subagent-prompt.md +91 -91
package/kit/framework/templates/dev-preferences.md +20 -20
package/kit/framework/templates/discovery.md +146 -146
package/kit/framework/templates/discussion-log.md +63 -63
package/kit/framework/templates/milestone-archive.md +123 -123
package/kit/framework/templates/milestone.md +115 -115
package/kit/framework/templates/phase-prompt.md +610 -610
package/kit/framework/templates/planner-subagent-prompt.md +117 -117
package/kit/framework/templates/project.md +186 -186
package/kit/framework/templates/requirements.md +231 -231
package/kit/framework/templates/research-project/ARCHITECTURE.md +204 -204
package/kit/framework/templates/research-project/FEATURES.md +147 -147
package/kit/framework/templates/research-project/PITFALLS.md +200 -200
package/kit/framework/templates/research-project/STACK.md +120 -120
package/kit/framework/templates/research-project/SUMMARY.md +170 -170
package/kit/framework/templates/research.md +419 -419
package/kit/framework/templates/retrospective.md +54 -54
package/kit/framework/templates/roadmap.md +202 -202
package/kit/framework/templates/state.md +176 -176
package/kit/framework/templates/summary-complex.md +59 -59
package/kit/framework/templates/summary-minimal.md +41 -41
package/kit/framework/templates/summary-standard.md +48 -48
package/kit/framework/templates/summary.md +209 -209
package/kit/framework/templates/user-profile.md +146 -146
package/kit/framework/templates/user-setup.md +256 -256
package/kit/framework/templates/verification-report.md +258 -258
package/kit/framework/workflows/add-phase.md +112 -112
package/kit/framework/workflows/add-tests.md +351 -351
package/kit/framework/workflows/add-todo.md +158 -158
package/kit/framework/workflows/audit-milestone.md +340 -340
package/kit/framework/workflows/audit-uat.md +109 -109
package/kit/framework/workflows/autonomous.md +891 -891
package/kit/framework/workflows/check-todos.md +177 -177
package/kit/framework/workflows/cleanup.md +152 -152
package/kit/framework/workflows/complete-milestone.md +696 -696
package/kit/framework/workflows/diagnose-issues.md +231 -231
package/kit/framework/workflows/discovery-phase.md +289 -289
package/kit/framework/workflows/discuss-phase-assumptions.md +653 -653
package/kit/framework/workflows/discuss-phase.md +784 -784
package/kit/framework/workflows/do.md +104 -104
package/kit/framework/workflows/execute-phase.md +838 -838
package/kit/framework/workflows/execute-plan.md +510 -510
package/kit/framework/workflows/fast.md +102 -102
package/kit/framework/workflows/forensics.md +265 -265
package/kit/framework/workflows/health.md +181 -181
package/kit/framework/workflows/help.md +619 -619
package/kit/framework/workflows/insert-phase.md +130 -130
package/kit/framework/workflows/list-phase-assumptions.md +178 -178
package/kit/framework/workflows/list-workspaces.md +56 -56
package/kit/framework/workflows/manager.md +362 -362
package/kit/framework/workflows/map-codebase.md +377 -377
package/kit/framework/workflows/milestone-summary.md +223 -223
package/kit/framework/workflows/new-milestone.md +486 -486
package/kit/framework/workflows/new-project.md +1159 -1159
package/kit/framework/workflows/new-workspace.md +237 -237
package/kit/framework/workflows/next.md +97 -97
package/kit/framework/workflows/node-repair.md +92 -92
package/kit/framework/workflows/note.md +156 -156
package/kit/framework/workflows/pause-work.md +176 -176
package/kit/framework/workflows/plan-milestone-gaps.md +273 -273
package/kit/framework/workflows/plan-phase.md +765 -765
package/kit/framework/workflows/plant-seed.md +169 -169
package/kit/framework/workflows/pr-branch.md +129 -129
package/kit/framework/workflows/profile-user.md +450 -450
package/kit/framework/workflows/progress.md +507 -507
package/kit/framework/workflows/quick.md +757 -757
package/kit/framework/workflows/remove-phase.md +155 -155
package/kit/framework/workflows/remove-workspace.md +90 -90
package/kit/framework/workflows/research-phase.md +82 -82
package/kit/framework/workflows/resume-project.md +326 -326
package/kit/framework/workflows/review.md +228 -228
package/kit/framework/workflows/session-report.md +146 -146
package/kit/framework/workflows/settings.md +283 -283
package/kit/framework/workflows/ship.md +228 -228
package/kit/framework/workflows/stats.md +60 -60
package/kit/framework/workflows/transition.md +671 -671
package/kit/framework/workflows/ui-phase.md +302 -302
package/kit/framework/workflows/ui-review.md +165 -165
package/kit/framework/workflows/update.md +323 -323
package/kit/framework/workflows/validate-phase.md +174 -174
package/kit/framework/workflows/verify-phase.md +252 -252
package/kit/framework/workflows/verify-work.md +637 -637
package/kit/hooks/check-update.js +118 -118
package/kit/hooks/context-monitor.js +163 -163
package/kit/hooks/kit-attribution-reminder.cjs +29 -50
package/kit/hooks/kit-router.cjs +137 -0
package/kit/hooks/prompt-guard.js +103 -103
package/kit/hooks/statusline.js +125 -125
package/kit/hooks/workflow-guard.js +101 -101
package/kit/settings.json +45 -45
package/kit/skills/ai-prompt-characterization/SKILL.md +335 -335
package/kit/skills/armadilhas-sistemas-distribuidos/SKILL.md +447 -447
package/kit/skills/audit-log-multi-tenant/SKILL.md +340 -340
package/kit/skills/b2b-saas-architecture/SKILL.md +300 -300
package/kit/skills/consistencia-leitura-replica/SKILL.md +385 -385
package/kit/skills/crm-lead-pipeline-patterns/SKILL.md +343 -343
package/kit/skills/escolha-modelo-consistencia/SKILL.md +494 -494
package/kit/skills/evolucao-schema-compativel/SKILL.md +448 -448
package/kit/skills/evolution-go-whatsapp-integration/SKILL.md +322 -322
package/kit/skills/example-skill/SKILL.md +42 -42
package/kit/skills/legacy-api-only-applications/SKILL.md +358 -358
package/kit/skills/legacy-characterization-tests/SKILL.md +330 -330
package/kit/skills/legacy-effect-analysis/SKILL.md +331 -331
package/kit/skills/legacy-extract-class/SKILL.md +203 -203
package/kit/skills/legacy-programming-by-difference/SKILL.md +252 -252
package/kit/skills/legacy-seams-and-test-harness/SKILL.md +460 -460
package/kit/skills/legacy-shotgun-surgery/SKILL.md +286 -286
package/kit/skills/legacy-sprout-wrap-techniques/SKILL.md +434 -434
package/kit/skills/legacy-storytelling-naked-crc/SKILL.md +270 -270
package/kit/skills/lgpd-multi-tenant-compliance/SKILL.md +340 -340
package/kit/skills/member-invite-flow/SKILL.md +305 -305
package/kit/skills/member-management-react-shadcn/SKILL.md +328 -328
package/kit/skills/multi-tenant-performance-scaling/SKILL.md +316 -316
package/kit/skills/multi-tenant-rls-hierarchy/SKILL.md +342 -342
package/kit/skills/org-onboarding-flow/SKILL.md +257 -257
package/kit/skills/org-switcher-react-pattern/SKILL.md +349 -349
package/kit/skills/permission-gate-react-pattern/SKILL.md +271 -271
package/kit/skills/postgres-isolamento-concorrencia/SKILL.md +552 -552
package/kit/skills/pre-refactor-characterization/SKILL.md +421 -421
package/kit/skills/rbac-permissions-matrix-supabase/SKILL.md +338 -338
package/kit/skills/streams-eventos-cdc/SKILL.md +711 -711
package/kit/skills/supabase-branching-workflow/SKILL.md +544 -544
package/kit/skills/supabase-ci-cd-github-actions/SKILL.md +880 -880
package/kit/skills/supabase-column-level-security/SKILL.md +426 -426
package/kit/skills/supabase-config-toml-remotes/SKILL.md +807 -807
package/kit/skills/supabase-custom-claims-rbac/SKILL.md +472 -472
package/kit/skills/supabase-edge-functions/SKILL.md +1 -1
package/kit/skills/supabase-edge-functions-auth/SKILL.md +1 -1
package/kit/skills/supabase-edge-functions-limits/SKILL.md +1 -1
package/kit/skills/supabase-edge-functions-mcp-server/SKILL.md +1 -1
package/kit/skills/supabase-edge-functions-testing/SKILL.md +1 -1
package/kit/skills/supabase-edge-runtime-builtins/SKILL.md +1 -1
package/kit/skills/supabase-migration-repair/SKILL.md +823 -823
package/kit/skills/supabase-migrations/SKILL.md +297 -297
package/kit/skills/supabase-pgtap-testing/SKILL.md +1053 -1053
package/kit/skills/supabase-postgres-roles/SKILL.md +392 -392
package/kit/skills/supabase-realtime/SKILL.md +460 -460
package/kit/skills/supabase-rls-defense-in-depth/SKILL.md +418 -418
package/kit/skills/supabase-rls-policies/SKILL.md +635 -635
package/kit/skills/super-admin-platform-pattern/SKILL.md +326 -326
package/kit/skills/tenant-quente-mitigacao/SKILL.md +605 -605
package/kit/skills/whatsapp-conversation-state-machine/SKILL.md +287 -287
package/package.json +1 -1
package/src/core/kit.js +216 -216
package/src/core/reflect.js +247 -247
package/src/core/reverse-sync.js +372 -372
package/src/core/sync.js +437 -418
package/src/core/watch.js +121 -121
package/src/mcp-server/index.js +794 -746

package/kit/skills/tenant-quente-mitigacao/SKILL.md CHANGED Viewed

@@ -1,605 +1,605 @@
----
-name: tenant-quente-mitigacao
-description: Use ao escalar Postgres multi-tenant em Supabase quando 1 tenant consome >>> que outros (problema "Justin Bieber tenant" do DDIA Ch 6)…
----
-# Tenant Quente — Mitigação (DDIA Ch 6 aplicado a Postgres + Supabase)
-## Quando usar
-LLM carrega esta skill quando há **suspeita ou evidência de skewed workload em B2B SaaS multi-tenant** — i.e. um tenant (ou pequeno conjunto) consome desproporcionalmente recursos vs P50 dos demais. DDIA Ch 6 chama isso de **hot spot**, e o anchor narrativo canônico é o "Justin Bieber tenant" — referência ao caso Twitter onde 3% dos servidores ficaram dedicados a 1 celebrity user (DDIA p.196 nota [13]). Em B2B SaaS, o equivalente é **1 cliente enterprise** (ou anchor tenant) que escala 10× mais rápido que o restante da base.
-Trigger phrases:
-- "tenant Justin Bieber", "hot tenant", "skewed multi-tenant"
-- "1 cliente consumindo a base inteira", "tenant dominante", "anchor tenant"
-- "particionamento por tenant", "PARTITION BY HASH/RANGE org_id"
-- "scatter-gather Postgres super-admin"
-- "rebalancear tenant sem downtime", "mover tenant para schema dedicado"
-- "MV per-tenant pesada", "queue priority por tenant"
-Esta skill é consumida por `multi-tenant-isolation-auditor` (v1.21) ao detectar tabelas suspeitas de skew, por `omm-auditor` (v1.10) ao avaliar capacidade de escala, e por `b2b-saas-architect` (v1.21) ao desenhar schema de novo cliente enterprise grande.
-## Regras absolutas
-**REGRA #1 (medir antes de mitigar):** **NUNCA** aplicar mitigação sem coletar baseline 30d das 3 métricas canônicas (REQ TENANT-01). Mitigação prematura = otimização cega. Threshold canônico: WARN >3× P50, CRITICAL >10× P50.
-**REGRA #2 (default document-partitioned):** Índices secundários em tabelas particionadas devem ser **document-partitioned (local)** por default. Term-partitioned (global) **só** em query path crítica onde scatter-gather é o gargalo medido.
-**REGRA #3 (hash quando uniforme, range quando skewed conhecido):** Particionar por `HASH (org_id)` quando workload é uniforme cross-tenant. Particionar por `RANGE (org_id)` apenas quando hot tenants são **conhecidos a priori** (anchor tenant enterprise onboarded com SLA dedicado).
-**REGRA #4 (rebalanceamento manual, nunca automático):** Mover tenant para schema/instância dedicada **NUNCA** automaticamente. Sempre humano-no-loop com janela de manutenção comunicada — DDIA p.204 ("Operations: automatic or manual rebalancing") documenta o risco de cascading failure quando rebalance auto reage a node lento.
-**REGRA #5 (cleanup conservador):** Após mover tenant, **NUNCA** dropar schema/dados antigos antes de **7d sem queries** confirmados via `pg_stat_user_tables.last_seq_scan` + `last_idx_scan`. Defesa contra rollback emergencial.
-## Patterns canônicos
-### REQ TENANT-01 — Detecção do "tenant Justin Bieber"
-Três métricas canônicas, todas com baseline 30d e threshold relativo ao P50 da base de tenants ativos:
-#### Métrica 1 — Ratio queries/min via `pg_stat_statements`
-```sql
--- Pré-requisito: pg_stat_statements habilitado (Supabase: Settings → Database → Extensions)
--- Helper: extrai org_id do parameter da query (assume RLS sempre filtra por org_id literal/parameter)
-create or replace function private.extract_org_id_from_query(p_query text)
-returns uuid
-language plpgsql
-immutable
-set search_path = ''
-as $$
-declare
-  m text[];
-begin
-  -- Casa UUID em formato canônico no texto da query (parameter-bound)
-  m := regexp_match(p_query, '''([0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{12})''');
-  if m is null then
-    return null;
-  end if;
-  return m[1]::uuid;
-end;
-$$;
--- View canônica: queries/min por org_id sobre janela 24h
-create or replace view private.hot_tenant_query_rate as
-with per_org as (
-  select
-    private.extract_org_id_from_query(query) as org_id,
-    sum(calls) / nullif(extract(epoch from (now() - stats_reset)) / 60, 0) as queries_per_min
-  from pg_stat_statements
-  where private.extract_org_id_from_query(query) is not null
-  group by 1
-),
-stats as (
-  select
-    percentile_cont(0.5) within group (order by queries_per_min) as p50
-  from per_org
-)
-select
-  per_org.org_id,
-  per_org.queries_per_min,
-  stats.p50,
-  round((per_org.queries_per_min / nullif(stats.p50, 0))::numeric, 2) as ratio_vs_p50,
-  case
-    when per_org.queries_per_min > 10 * stats.p50 then 'CRITICAL'
-    when per_org.queries_per_min > 3  * stats.p50 then 'WARN'
-    else 'OK'
-  end as severity
-from per_org cross join stats
-order by ratio_vs_p50 desc nulls last;
-```
-#### Métrica 2 — Ratio storage GB via `pg_total_relation_size`
-```sql
--- View: storage por tenant agregando tabelas particionadas + tabelas não-particionadas
--- Assume convenção de naming partição: <tabela_base>_<org_id_underscore>
-create or replace view private.hot_tenant_storage as
-with per_partition as (
-  select
-    -- Extrai org_id do nome da partição (audit_logs_<uuid_underscore> -> uuid)
-    replace(
-      regexp_replace(c.relname, '^[a-z_]+_([0-9a-f_]{36})$', '\1'),
-      '_', '-'
-    )::uuid as org_id,
-    pg_total_relation_size(c.oid) as bytes
-  from pg_class c
-  join pg_namespace n on n.oid = c.relnamespace
-  where n.nspname = 'public'
-    and c.relkind = 'r'                           -- tabelas regulares
-    and c.relname ~ '_[0-9a-f]{8}_[0-9a-f]{4}_[0-9a-f]{4}_[0-9a-f]{4}_[0-9a-f]{12}$'
-),
-per_org as (
-  select
-    org_id,
-    sum(bytes) / (1024.0^3) as storage_gb
-  from per_partition
-  group by 1
-),
-stats as (
-  select percentile_cont(0.5) within group (order by storage_gb) as p50 from per_org
-)
-select
-  per_org.org_id,
-  round(per_org.storage_gb::numeric, 3) as storage_gb,
-  round(stats.p50::numeric, 3) as p50_gb,
-  round((per_org.storage_gb / nullif(stats.p50, 0))::numeric, 2) as ratio_vs_p50,
-  case
-    when per_org.storage_gb > 10 * stats.p50 then 'CRITICAL'
-    when per_org.storage_gb > 3  * stats.p50 then 'WARN'
-    else 'OK'
-  end as severity
-from per_org cross join stats
-order by storage_gb desc;
-```
-#### Métrica 3 — Ratio conn slots via `pg_stat_activity`
-```sql
--- Pré-requisito: app seta application_name com org context, ex: 'app:org=<uuid>:edge=lead-create'
--- Convenção canônica documentada em b2b-saas-architecture
-create or replace view private.hot_tenant_conn_slots as
-with per_org as (
-  select
-    -- Extrai uuid do application_name após 'org='
-    (regexp_match(application_name, 'org=([0-9a-f-]{36})'))[1]::uuid as org_id,
-    count(*) as active_slots
-  from pg_stat_activity
-  where state = 'active'
-    and application_name ~ 'org=[0-9a-f-]{36}'
-  group by 1
-),
-stats as (
-  select percentile_cont(0.5) within group (order by active_slots) as p50 from per_org
-)
-select
-  per_org.org_id,
-  per_org.active_slots,
-  stats.p50,
-  round((per_org.active_slots::numeric / nullif(stats.p50, 0))::numeric, 2) as ratio_vs_p50,
-  case
-    when per_org.active_slots > 10 * stats.p50 then 'CRITICAL'
-    when per_org.active_slots > 3  * stats.p50 then 'WARN'
-    else 'OK'
-  end as severity
-from per_org cross join stats
-order by ratio_vs_p50 desc nulls last;
-```
-**Hot tenant é confirmado quando ≥ 2 das 3 métricas estão em WARN+ simultaneamente** — uma só métrica sozinha pode ser falso positivo (batch job, importação, migração). Triangulação reduz noise.
-### REQ TENANT-02 — 5 estratégias de mitigação (tabela canônica)
-| # | Estratégia | Quando usar | Tradeoff principal | Config / SQL exemplo |
-|---|---|---|---|---|
-| 1 | **Rate limit por tenant** | Picos imprevisíveis de write/read em hot tenant que prejudicam P95 dos demais | Impacto UX no tenant target — usuário vê HTTP 429; precisa coordenar com customer success | RLS reject + `pg_cron` throttle counter (abaixo) |
-| 2 | **Pool conexão isolado (Supavisor multi-pool)** | Conn starvation — hot tenant esgota slots na pool compartilhada | Custo Supavisor multi-pool (Pro+) + complexidade de routing | Supavisor config `[pools.org_<uuid>]` |
-| 3 | **Read replica dedicada** | Tenant read-heavy (dashboards, exports) que não precisa de write strong consistency | Custo Supabase Pro+ + lag replicação aceitável (centenas ms) | Supavisor `read.*` routing + `application_name` hint |
-| 4 | **Desnormalização (MV per-tenant)** | Query repetitiva pesada (agregações, joins 5+ tabelas) que rodam 100× / hora p/ mesmo tenant | Refresh complexity + staleness window aceitável (5-15min) | `CREATE MATERIALIZED VIEW ... REFRESH CONCURRENTLY` + `pg_cron` |
-| 5 | **Request shaping (pgmq priority)** | Picos previsíveis batch (relatório fim-de-mês, importação) — work é assíncrono | Complexidade fila + worker; latency aumenta para hot tenant | `pgmq` priority queue + worker que drena LOW após HIGH |
-#### Estratégia 1 — Rate limit por tenant (exemplo)
-```sql
--- Tabela counter: bucket por org × minuto
-create table private.tenant_rate_limit_buckets (
-  org_id uuid not null,
-  bucket_minute timestamptz not null,
-  request_count int not null default 0,
-  primary key (org_id, bucket_minute)
-);
--- Função: incrementa counter e retorna se excedeu limite
-create or replace function private.check_tenant_rate_limit(
-  p_org_id uuid,
-  p_limit_per_min int default 1000
-)
-returns boolean
-language plpgsql
-security definer
-set search_path = ''
-as $$
-declare
-  v_count int;
-  v_bucket timestamptz;
-begin
-  v_bucket := date_trunc('minute', now());
-  insert into private.tenant_rate_limit_buckets (org_id, bucket_minute, request_count)
-    values (p_org_id, v_bucket, 1)
-    on conflict (org_id, bucket_minute)
-    do update set request_count = tenant_rate_limit_buckets.request_count + 1
-    returning request_count into v_count;
-  return v_count <= p_limit_per_min;
-end;
-$$;
--- Cleanup buckets > 1h (pg_cron)
-select cron.schedule('cleanup-rate-limit-buckets', '*/15 * * * *', $$
-  delete from private.tenant_rate_limit_buckets
-  where bucket_minute < now() - interval '1 hour';
-$$);
-```
-#### Estratégia 4 — MV per-tenant (exemplo agregação leads)
-```sql
--- MV agregando métricas pesadas só para hot tenant
--- (Para os demais tenants, query original direto na tabela ainda é rápida)
-create materialized view public.lead_metrics_org_<uuid_underscore> as
-select
-  l.stage,
-  count(*) as count,
-  count(*) filter (where l.created_at > now() - interval '7 days') as last_7d
-from public.leads l
-where l.org_id = '<uuid>'
-group by l.stage;
-create unique index lead_metrics_org_<uuid_underscore>_stage_idx
-  on public.lead_metrics_org_<uuid_underscore> (stage);
--- Refresh concurrent a cada 10min
-select cron.schedule(
-  'refresh-lead-metrics-org-<uuid_underscore>',
-  '*/10 * * * *',
-  $$ refresh materialized view concurrently public.lead_metrics_org_<uuid_underscore>; $$
-);
-```
-#### Estratégia 5 — Request shaping (pgmq priority)
-```sql
--- 2 filas: high (pequenos clientes) + low (hot tenant batch)
-select pgmq.create('exports_high');
-select pgmq.create('exports_low');
--- Enqueue: hot tenant vai para low, demais para high
-create or replace function public.enqueue_export(p_org_id uuid, p_payload jsonb)
-returns bigint
-language plpgsql
-security invoker
-set search_path = ''
-as $$
-declare
-  v_is_hot boolean;
-begin
-  -- Lookup hot tenant (refresh por job separado)
-  select exists (select 1 from private.hot_tenant_registry where org_id = p_org_id and active)
-    into v_is_hot;
-  if v_is_hot then
-    return (select msg_id from pgmq.send('exports_low', p_payload));
-  else
-    return (select msg_id from pgmq.send('exports_high', p_payload));
-  end if;
-end;
-$$;
--- Worker: drena high primeiro, low só quando high vazio
--- (implementação Edge Function com Deno cron)
-```
-### REQ TENANT-03 — Particionamento range vs hash para `tenant_id`
-#### Decision tree
-```
-Tabela > 50k rows/tenant OU > 5M rows total?
-├── Não → SEM particionamento (overhead > benefit). Use partial indexes.
-└── Sim → particionar
-    ├── Workload uniforme cross-tenant (P95 ratio < 2× P50)?
-    │   ├── Sim → HASH (org_id) com 16-64 partições fixas
-    │   └── Não → continuar abaixo
-    └── Hot tenants conhecidos a priori (anchor tenant onboarded com SLA)?
-        ├── Sim → RANGE (org_id) com partição manual para cada hot
-        └── Não → HASH (default seguro) + monitor com REQ TENANT-01
-```
-#### Hash partitioning — workload uniforme
-```sql
--- Tabela particionada por HASH em 16 partições (typical sweet spot Postgres 16+)
-create table public.events (
-  id uuid not null,
-  org_id uuid not null,
-  event_type text not null,
-  payload jsonb,
-  created_at timestamptz not null default now(),
-  primary key (org_id, id)
-) partition by hash (org_id);
--- Cria 16 partições — Postgres distribui via hash modulo 16
-do $$
-declare
-  i int;
-begin
-  for i in 0..15 loop
-    execute format(
-      'create table public.events_p%s partition of public.events for values with (modulus 16, remainder %s)',
-      lpad(i::text, 2, '0'), i
-    );
-  end loop;
-end $$;
--- Index local em cada partição (document-partitioned — REQ TENANT-04)
-create index events_org_created_idx on public.events (org_id, created_at desc);
-```
-**Por que 16 partições:** sweet spot empírico Postgres 16+ — partição management overhead negligível, paralelização de scans efetiva. Acima de 64 partições, planner começa a sofrer (citação DDIA p.202 — "each partition also has management overhead").
-#### Range partitioning — anchor tenant conhecido
-```sql
--- Tabela particionada por RANGE — partição dedicada para anchor tenant + default p/ os demais
-create table public.audit_logs (
-  id uuid not null,
-  org_id uuid not null,
-  event_type text not null,
-  actor_id uuid,
-  payload jsonb,
-  created_at timestamptz not null default now(),
-  primary key (org_id, id)
-) partition by range (org_id);
--- Partição dedicada para anchor tenant (uuid conhecido)
-create table public.audit_logs_anchor_acme
-  partition of public.audit_logs
-  for values from ('11111111-1111-1111-1111-111111111111')
-                to ('11111111-1111-1111-1111-111111111112');
--- Partição default para todos os demais — rebalancear manualmente quando outro tenant virar hot
-create table public.audit_logs_default
-  partition of public.audit_logs
-  default;
--- Índice local em cada partição
-create index audit_logs_anchor_acme_created_idx on public.audit_logs_anchor_acme (created_at desc);
-create index audit_logs_default_org_created_idx on public.audit_logs_default (org_id, created_at desc);
-```
-**Vantagem range para anchor:** isola I/O do anchor tenant. Bloat/vacuum/analyze de outras orgs não bloqueia o anchor. Permite tablespace dedicado em disco SSD separado.
-**Risco range:** se outro tenant escalar inesperadamente, partição default fica skewed. Mitigação: REQ TENANT-01 monitor + script de migração para nova partição range.
-### REQ TENANT-04 — Índices secundários document-partitioned vs term-partitioned
-DDIA p.197-200 distingue duas estratégias para índices secundários em tabelas particionadas. Aplicado a queries cross-tenant em views super-admin (caso canônico em B2B SaaS):
-| Aspecto | Document-partitioned (local) | Term-partitioned (global) |
-|---|---|---|
-| **Topologia** | 1 índice por partição (default Postgres) | 1 índice global cobrindo todas as partições (não-default Postgres — exige extensão pg_partman ou abordagem manual) |
-| **Write cost** | Barato — 1 partição afetada | Caro — N partições do índice afetadas + lock cross-partição |
-| **Read cost (single tenant)** | O(log n) na partição alvo | O(log n) no índice global |
-| **Read cost (cross-tenant super-admin)** | **scatter-gather** — todas as partições consultadas em paralelo | O(log n) — 1 lookup direto |
-| **Aplicação canônica** | RLS queries normais (filter por `org_id` → 1 partição) | Super-admin views que listam todas orgs por critério (ex: "todas as leads created_at > X") |
-#### Recomendação default: document-partitioned
-```sql
--- Index local em cada partição da tabela events (REQ TENANT-03)
--- Postgres cria automaticamente em cada partição quando criado na tabela parent
-create index events_event_type_idx on public.events (event_type);
--- Verificar que cada partição tem o index
-select
-  pi.indrelid::regclass as partition_name,
-  pi.indexrelid::regclass as index_name
-from pg_inherits inh
-join pg_index pi on pi.indrelid = inh.inhrelid
-where inh.inhparent = 'public.events'::regclass;
-```
-**Query super-admin sobre `event_type` faz scatter-gather** — Postgres pruner não consegue eliminar partições (filter não inclui `org_id`). Custo: tail latency amplification (DDIA p.198) — query é tão lenta quanto a partição mais lenta. Aceitável para super-admin (queries raras, async, não user-facing).
-#### Term-partitioned (quando query path é crítico)
-Postgres não suporta nativamente índice global em tabela particionada. Opções:
-1. **Tabela auxiliar de lookup** — manualmente mantida via trigger:
-```sql
--- Lookup table cross-tenant: term → (org_id, event_id)
--- Mantida via trigger nas partições filhas
-create table private.events_event_type_global_idx (
-  event_type text not null,
-  org_id uuid not null,
-  event_id uuid not null,
-  created_at timestamptz not null,
-  primary key (event_type, created_at desc, org_id, event_id)
-);
-create or replace function private.events_sync_global_idx()
-returns trigger
-language plpgsql
-security definer
-set search_path = ''
-as $$
-begin
-  if (tg_op = 'INSERT') then
-    insert into private.events_event_type_global_idx
-      (event_type, org_id, event_id, created_at)
-      values (new.event_type, new.org_id, new.id, new.created_at);
-  elsif (tg_op = 'DELETE') then
-    delete from private.events_event_type_global_idx
-      where event_type = old.event_type and event_id = old.id;
-  end if;
-  return null;
-end;
-$$;
--- Trigger replicado em cada partição (script bash gera a partir de pg_inherits)
--- Custo: 2× write (tabela + lookup) + lock cross-partição quando lookup é atualizado
-```
-2. **Aceitar staleness via job batch** — DDIA p.200 nota que DynamoDB GSI tem propagação assíncrona "within a fraction of a second". Mesmo trade-off vale aqui:
-```sql
--- Refresh global index via pg_cron a cada 30s
-select cron.schedule('refresh-events-global-idx', '*/30 * * * * *', $$
-  insert into private.events_event_type_global_idx
-    (event_type, org_id, event_id, created_at)
-  select event_type, org_id, id, created_at
-  from public.events
-  where created_at > coalesce((select max(created_at) from private.events_event_type_global_idx), 'epoch')
-  on conflict do nothing;
-$$);
-```
-**Recomendação canônica:** começar com document-partitioned. Migrar para term-partitioned **somente** quando query path super-admin específica for medida em > 5s P95 e não-async-tolerant.
-### REQ TENANT-05 — Rebalanceamento sem downtime (4 passos)
-DDIA p.201-204 documenta que rebalancing tem 3 requisitos não-negociáveis: load fair pós-rebalance, sem downtime durante rebalance, mover só o necessário. Aplicado a Postgres + Supavisor:
-#### Passo 1 — Detectar tenant alvo via thresholds (REQ TENANT-01)
-Confirmado quando ≥ 2 das 3 métricas em CRITICAL por > 7 dias consecutivos. Decisão: humano (DBA + customer success) revisa antes de prosseguir. **NÃO automatizar.**
-#### Passo 2 — Dump do tenant para schema isolado
-```bash
-# Pré-requisito: app está em modo read-only para o hot tenant durante 30min de janela de manutenção
-# (controlado por feature flag — coordenado com customer success)
-# Dump apenas tabelas do tenant (assumindo convenção partition naming)
-pg_dump \
-  --schema=public \
-  --table='*tenant_<uuid_underscore>*' \
-  --table='public.events_<uuid_underscore>' \
-  --table='public.audit_logs_<uuid_underscore>' \
-  --no-owner \
-  --no-acl \
-  --file=/tmp/tenant_<uuid>_dump.sql \
-  postgresql://postgres:<password>@db.<source_project_ref>.supabase.co:5432/postgres
-# Restaurar em nova instância Supabase dedicada (criada previamente)
-psql \
-  postgresql://postgres:<password>@db.<dedicated_project_ref>.supabase.co:5432/postgres \
-  < /tmp/tenant_<uuid>_dump.sql
-# Validar row count match
-psql <source> -c "select count(*) from public.events where org_id = '<uuid>';"
-psql <dedicated> -c "select count(*) from public.events;"
-```
-#### Passo 3 — Supavisor redirect via routing config
-```toml
-# supavisor.toml (ou config UI Supabase Dashboard)
-# Routing rule: requests com header X-Org-Id=<uuid> vão para instância dedicada
-[[routes]]
-match.header = "X-Org-Id"
-match.value = "<uuid>"
-target = "dedicated_<uuid>"
-priority = 100
-[pools.dedicated_<uuid>]
-host = "db.<dedicated_project_ref>.supabase.co"
-port = 5432
-database = "postgres"
-mode = "transaction"
-pool_size = 50
-# Default route para os demais tenants (instância original)
-[[routes]]
-match.default = true
-target = "shared"
-priority = 1
-```
-```typescript
-// App: setar header X-Org-Id em toda request
-// Supabase JS client custom header (versão >= 2.x)
-const supabase = createClient(url, anon_key, {
-  global: {
-    headers: { 'X-Org-Id': activeOrgId }
-  }
-})
-```
-**Após reload Supavisor (zero downtime — connections drain gracefully), tráfego do tenant alvo vai para instância dedicada. Demais tenants seguem na instância original.**
-#### Passo 4 — Cleanup conservador (após 7d sem queries)
-```sql
--- Verificar que nenhuma query tocou as partições antigas nos últimos 7d
-select
-  schemaname, relname,
-  last_seq_scan,
-  last_idx_scan,
-  greatest(coalesce(last_seq_scan, 'epoch'::timestamptz),
-           coalesce(last_idx_scan, 'epoch'::timestamptz)) as last_access
-from pg_stat_user_tables
-where relname like '%<uuid_underscore>%'
-order by last_access;
--- Esperado: last_access < now() - interval '7 days' para todas
--- Apenas após confirmação manual humana, dropar
-begin;
-  drop table if exists public.events_<uuid_underscore> cascade;
-  drop table if exists public.audit_logs_<uuid_underscore> cascade;
-  -- ... outras tabelas particionadas do tenant
-commit;
-```
-**Por que 7d:** janela de defesa contra rollback emergencial. Se a instância dedicada falhar por bug não detectado em customer testing, voltar tráfego para instância original em < 5min via reverter Supavisor config — só funciona se dados antigos ainda existem.
-## Anti-patterns
-### Anti-pattern 1: Mitigar antes de medir (sem baseline 30d)
-**Errado:** "Cliente reclamou de lentidão — vamos criar MV per-tenant para ele agora."
-**Por quê:** sem baseline 30d das 3 métricas (REQ TENANT-01), não dá pra distinguir hot tenant real de pico transitório (importação CSV grande, batch fim-de-mês). Mitigação prematura adiciona MV refresh overhead permanente para uma situação possivelmente pontual.
-**Certo:** coletar 30d de baseline, identificar via REQ TENANT-01, confirmar com ≥ 2 das 3 métricas em WARN+ por > 7d. Só então aplicar mitigação.
-### Anti-pattern 2: Particionar tabela com poucos rows
-**Errado:**
-```sql
--- 5 tenants, 200 rows/tenant
-create table public.events (...) partition by hash (org_id);
-```
-**Por quê:** overhead de partition pruning + planner trabalho > benefit. Cada query passa por partition routing, dump/restore mais lento, manutenção complexa. Premature optimization clássica — DDIA p.202 nota que "each partition also has management overhead".
-**Certo:** começar com tabela regular + index `(org_id, created_at desc)`. Particionar quando atingir threshold real (> 50k rows/tenant OU > 5M total).
-### Anti-pattern 3: Term-partitioned como default
-**Errado:** criar lookup table global (term-partitioned) já no MVP "para evitar scatter-gather no futuro".
-**Por quê:** writes ficam 2× mais caros desde dia 1. Cross-partition lock complica. DDIA p.200 documenta que mesmo DynamoDB GSI (term-partitioned built-in) tem trade-off de propagation delay assíncrono. Você está pagando custo agora para benefício hipotético futuro.
-**Certo:** document-partitioned como default. Migrar para term-partitioned **somente** quando query path super-admin medir > 5s P95 e for user-facing crítico.
-### Anti-pattern 4: Rebalancing automático
-**Errado:** script bash que detecta hot tenant via REQ TENANT-01 e automaticamente roda passos 2-3 do REQ TENANT-05.
-**Por quê:** DDIA p.204 documenta cascading failure clássica — node lento detectado como dead → rebalance automático → carga extra no resto do cluster → mais nodes ficam lentos → mais rebalance → cascade. Em B2B SaaS, equivalente: importação CSV grande detectada como hot → rebalance triggered → aplicação volta-volta no meio de transação user-facing → erros 500 em produção.
-**Certo:** detecção automática gera **alerta** (Slack/PagerDuty). Decisão de rebalance é humana (DBA + customer success), executada em janela de manutenção pré-comunicada.
-### Anti-pattern 5: Cleanup imediato após move (sem 7d)
-**Errado:**
-```sql
--- Logo após Supavisor reroute (REQ TENANT-05 passo 3)
-drop schema tenant_<uuid> cascade;
-```
-**Por quê:** se instância dedicada tiver bug não detectado (RLS quebrada, schema diverge, performance pior), você não consegue rollback. Customer fica fora do ar até nova restore from backup (RTO horas).
-**Certo:** 7d de monitoring ativo (`pg_stat_user_tables.last_seq_scan`/`last_idx_scan` confirmados zero) antes do drop. Custo: 7d de storage duplicado (negligível vs custo de outage).
-## Ver também
-- [`../_shared-dados-distribuidos/glossary.md`](../_shared-dados-distribuidos/glossary.md) — glossário compartilhado da Suíte DDIA Foundations v1.22 (define `hot spot`, `scatter-gather`, `consistent hashing`, `key range partitioning`, etc.)
-- [`../multi-tenant-performance-scaling/SKILL.md`](../multi-tenant-performance-scaling/SKILL.md) — Supavisor pooling, partial indexes, helper functions STABLE (skill irmã v1.21 — base de scaling antes de mitigação de hot tenant)
-- [`../supabase-postgres-style/SKILL.md`](../supabase-postgres-style/SKILL.md) — style guide SQL canônico (snake_case, schema-qualified, `private.*` para helpers)
-- [`../multi-tenant-rls-hierarchy/SKILL.md`](../multi-tenant-rls-hierarchy/SKILL.md) — RLS hierarchical policies que coexistem com partições (RLS aplicada na tabela parent propaga para todas as partições)
-- [`../super-admin-platform-pattern/SKILL.md`](../super-admin-platform-pattern/SKILL.md) — cross-tenant views super-admin (caso canônico para REQ TENANT-04 term-partitioned trade-off)
-- DDIA Ch 6 (Designing Data-Intensive Applications, Martin Kleppmann) — Partitioning. Justin Bieber tenant: p.196 nota [13]. Hash vs range: p.194-196. Secondary indexes: p.197-200. Rebalancing: p.201-204.
-- [Postgres Declarative Partitioning Docs](https://www.postgresql.org/docs/current/ddl-partitioning.html#DDL-PARTITIONING-DECLARATIVE)
-- [Supavisor Multi-Pool Docs](https://supabase.com/docs/guides/database/connecting-to-postgres#supavisor)
+---
+name: tenant-quente-mitigacao
+description: Use ao escalar Postgres multi-tenant em Supabase quando 1 tenant consome >>> que outros (problema "Justin Bieber tenant" do DDIA Ch 6)…
+---
+# Tenant Quente — Mitigação (DDIA Ch 6 aplicado a Postgres + Supabase)
+## Quando usar
+LLM carrega esta skill quando há **suspeita ou evidência de skewed workload em B2B SaaS multi-tenant** — i.e. um tenant (ou pequeno conjunto) consome desproporcionalmente recursos vs P50 dos demais. DDIA Ch 6 chama isso de **hot spot**, e o anchor narrativo canônico é o "Justin Bieber tenant" — referência ao caso Twitter onde 3% dos servidores ficaram dedicados a 1 celebrity user (DDIA p.196 nota [13]). Em B2B SaaS, o equivalente é **1 cliente enterprise** (ou anchor tenant) que escala 10× mais rápido que o restante da base.
+Trigger phrases:
+- "tenant Justin Bieber", "hot tenant", "skewed multi-tenant"
+- "1 cliente consumindo a base inteira", "tenant dominante", "anchor tenant"
+- "particionamento por tenant", "PARTITION BY HASH/RANGE org_id"
+- "scatter-gather Postgres super-admin"
+- "rebalancear tenant sem downtime", "mover tenant para schema dedicado"
+- "MV per-tenant pesada", "queue priority por tenant"
+Esta skill é consumida por `multi-tenant-isolation-auditor` (v1.21) ao detectar tabelas suspeitas de skew, por `omm-auditor` (v1.10) ao avaliar capacidade de escala, e por `b2b-saas-architect` (v1.21) ao desenhar schema de novo cliente enterprise grande.
+## Regras absolutas
+**REGRA #1 (medir antes de mitigar):** **NUNCA** aplicar mitigação sem coletar baseline 30d das 3 métricas canônicas (REQ TENANT-01). Mitigação prematura = otimização cega. Threshold canônico: WARN >3× P50, CRITICAL >10× P50.
+**REGRA #2 (default document-partitioned):** Índices secundários em tabelas particionadas devem ser **document-partitioned (local)** por default. Term-partitioned (global) **só** em query path crítica onde scatter-gather é o gargalo medido.
+**REGRA #3 (hash quando uniforme, range quando skewed conhecido):** Particionar por `HASH (org_id)` quando workload é uniforme cross-tenant. Particionar por `RANGE (org_id)` apenas quando hot tenants são **conhecidos a priori** (anchor tenant enterprise onboarded com SLA dedicado).
+**REGRA #4 (rebalanceamento manual, nunca automático):** Mover tenant para schema/instância dedicada **NUNCA** automaticamente. Sempre humano-no-loop com janela de manutenção comunicada — DDIA p.204 ("Operations: automatic or manual rebalancing") documenta o risco de cascading failure quando rebalance auto reage a node lento.
+**REGRA #5 (cleanup conservador):** Após mover tenant, **NUNCA** dropar schema/dados antigos antes de **7d sem queries** confirmados via `pg_stat_user_tables.last_seq_scan` + `last_idx_scan`. Defesa contra rollback emergencial.
+## Patterns canônicos
+### REQ TENANT-01 — Detecção do "tenant Justin Bieber"
+Três métricas canônicas, todas com baseline 30d e threshold relativo ao P50 da base de tenants ativos:
+#### Métrica 1 — Ratio queries/min via `pg_stat_statements`
+```sql
+-- Pré-requisito: pg_stat_statements habilitado (Supabase: Settings → Database → Extensions)
+-- Helper: extrai org_id do parameter da query (assume RLS sempre filtra por org_id literal/parameter)
+create or replace function private.extract_org_id_from_query(p_query text)
+returns uuid
+language plpgsql
+immutable
+set search_path = ''
+as $$
+declare
+  m text[];
+begin
+  -- Casa UUID em formato canônico no texto da query (parameter-bound)
+  m := regexp_match(p_query, '''([0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{12})''');
+  if m is null then
+    return null;
+  end if;
+  return m[1]::uuid;
+end;
+$$;
+-- View canônica: queries/min por org_id sobre janela 24h
+create or replace view private.hot_tenant_query_rate as
+with per_org as (
+  select
+    private.extract_org_id_from_query(query) as org_id,
+    sum(calls) / nullif(extract(epoch from (now() - stats_reset)) / 60, 0) as queries_per_min
+  from pg_stat_statements
+  where private.extract_org_id_from_query(query) is not null
+  group by 1
+),
+stats as (
+  select
+    percentile_cont(0.5) within group (order by queries_per_min) as p50
+  from per_org
+)
+select
+  per_org.org_id,
+  per_org.queries_per_min,
+  stats.p50,
+  round((per_org.queries_per_min / nullif(stats.p50, 0))::numeric, 2) as ratio_vs_p50,
+  case
+    when per_org.queries_per_min > 10 * stats.p50 then 'CRITICAL'
+    when per_org.queries_per_min > 3  * stats.p50 then 'WARN'
+    else 'OK'
+  end as severity
+from per_org cross join stats
+order by ratio_vs_p50 desc nulls last;
+```
+#### Métrica 2 — Ratio storage GB via `pg_total_relation_size`
+```sql
+-- View: storage por tenant agregando tabelas particionadas + tabelas não-particionadas
+-- Assume convenção de naming partição: <tabela_base>_<org_id_underscore>
+create or replace view private.hot_tenant_storage as
+with per_partition as (
+  select
+    -- Extrai org_id do nome da partição (audit_logs_<uuid_underscore> -> uuid)
+    replace(
+      regexp_replace(c.relname, '^[a-z_]+_([0-9a-f_]{36})$', '\1'),
+      '_', '-'
+    )::uuid as org_id,
+    pg_total_relation_size(c.oid) as bytes
+  from pg_class c
+  join pg_namespace n on n.oid = c.relnamespace
+  where n.nspname = 'public'
+    and c.relkind = 'r'                           -- tabelas regulares
+    and c.relname ~ '_[0-9a-f]{8}_[0-9a-f]{4}_[0-9a-f]{4}_[0-9a-f]{4}_[0-9a-f]{12}$'
+),
+per_org as (
+  select
+    org_id,
+    sum(bytes) / (1024.0^3) as storage_gb
+  from per_partition
+  group by 1
+),
+stats as (
+  select percentile_cont(0.5) within group (order by storage_gb) as p50 from per_org
+)
+select
+  per_org.org_id,
+  round(per_org.storage_gb::numeric, 3) as storage_gb,
+  round(stats.p50::numeric, 3) as p50_gb,
+  round((per_org.storage_gb / nullif(stats.p50, 0))::numeric, 2) as ratio_vs_p50,
+  case
+    when per_org.storage_gb > 10 * stats.p50 then 'CRITICAL'
+    when per_org.storage_gb > 3  * stats.p50 then 'WARN'
+    else 'OK'
+  end as severity
+from per_org cross join stats
+order by storage_gb desc;
+```
+#### Métrica 3 — Ratio conn slots via `pg_stat_activity`
+```sql
+-- Pré-requisito: app seta application_name com org context, ex: 'app:org=<uuid>:edge=lead-create'
+-- Convenção canônica documentada em b2b-saas-architecture
+create or replace view private.hot_tenant_conn_slots as
+with per_org as (
+  select
+    -- Extrai uuid do application_name após 'org='
+    (regexp_match(application_name, 'org=([0-9a-f-]{36})'))[1]::uuid as org_id,
+    count(*) as active_slots
+  from pg_stat_activity
+  where state = 'active'
+    and application_name ~ 'org=[0-9a-f-]{36}'
+  group by 1
+),
+stats as (
+  select percentile_cont(0.5) within group (order by active_slots) as p50 from per_org
+)
+select
+  per_org.org_id,
+  per_org.active_slots,
+  stats.p50,
+  round((per_org.active_slots::numeric / nullif(stats.p50, 0))::numeric, 2) as ratio_vs_p50,
+  case
+    when per_org.active_slots > 10 * stats.p50 then 'CRITICAL'
+    when per_org.active_slots > 3  * stats.p50 then 'WARN'
+    else 'OK'
+  end as severity
+from per_org cross join stats
+order by ratio_vs_p50 desc nulls last;
+```
+**Hot tenant é confirmado quando ≥ 2 das 3 métricas estão em WARN+ simultaneamente** — uma só métrica sozinha pode ser falso positivo (batch job, importação, migração). Triangulação reduz noise.
+### REQ TENANT-02 — 5 estratégias de mitigação (tabela canônica)
+| # | Estratégia | Quando usar | Tradeoff principal | Config / SQL exemplo |
+|---|---|---|---|---|
+| 1 | **Rate limit por tenant** | Picos imprevisíveis de write/read em hot tenant que prejudicam P95 dos demais | Impacto UX no tenant target — usuário vê HTTP 429; precisa coordenar com customer success | RLS reject + `pg_cron` throttle counter (abaixo) |
+| 2 | **Pool conexão isolado (Supavisor multi-pool)** | Conn starvation — hot tenant esgota slots na pool compartilhada | Custo Supavisor multi-pool (Pro+) + complexidade de routing | Supavisor config `[pools.org_<uuid>]` |
+| 3 | **Read replica dedicada** | Tenant read-heavy (dashboards, exports) que não precisa de write strong consistency | Custo Supabase Pro+ + lag replicação aceitável (centenas ms) | Supavisor `read.*` routing + `application_name` hint |
+| 4 | **Desnormalização (MV per-tenant)** | Query repetitiva pesada (agregações, joins 5+ tabelas) que rodam 100× / hora p/ mesmo tenant | Refresh complexity + staleness window aceitável (5-15min) | `CREATE MATERIALIZED VIEW ... REFRESH CONCURRENTLY` + `pg_cron` |
+| 5 | **Request shaping (pgmq priority)** | Picos previsíveis batch (relatório fim-de-mês, importação) — work é assíncrono | Complexidade fila + worker; latency aumenta para hot tenant | `pgmq` priority queue + worker que drena LOW após HIGH |
+#### Estratégia 1 — Rate limit por tenant (exemplo)
+```sql
+-- Tabela counter: bucket por org × minuto
+create table private.tenant_rate_limit_buckets (
+  org_id uuid not null,
+  bucket_minute timestamptz not null,
+  request_count int not null default 0,
+  primary key (org_id, bucket_minute)
+);
+-- Função: incrementa counter e retorna se excedeu limite
+create or replace function private.check_tenant_rate_limit(
+  p_org_id uuid,
+  p_limit_per_min int default 1000
+)
+returns boolean
+language plpgsql
+security definer
+set search_path = ''
+as $$
+declare
+  v_count int;
+  v_bucket timestamptz;
+begin
+  v_bucket := date_trunc('minute', now());
+  insert into private.tenant_rate_limit_buckets (org_id, bucket_minute, request_count)
+    values (p_org_id, v_bucket, 1)
+    on conflict (org_id, bucket_minute)
+    do update set request_count = tenant_rate_limit_buckets.request_count + 1
+    returning request_count into v_count;
+  return v_count <= p_limit_per_min;
+end;
+$$;
+-- Cleanup buckets > 1h (pg_cron)
+select cron.schedule('cleanup-rate-limit-buckets', '*/15 * * * *', $$
+  delete from private.tenant_rate_limit_buckets
+  where bucket_minute < now() - interval '1 hour';
+$$);
+```
+#### Estratégia 4 — MV per-tenant (exemplo agregação leads)
+```sql
+-- MV agregando métricas pesadas só para hot tenant
+-- (Para os demais tenants, query original direto na tabela ainda é rápida)
+create materialized view public.lead_metrics_org_<uuid_underscore> as
+select
+  l.stage,
+  count(*) as count,
+  count(*) filter (where l.created_at > now() - interval '7 days') as last_7d
+from public.leads l
+where l.org_id = '<uuid>'
+group by l.stage;
+create unique index lead_metrics_org_<uuid_underscore>_stage_idx
+  on public.lead_metrics_org_<uuid_underscore> (stage);
+-- Refresh concurrent a cada 10min
+select cron.schedule(
+  'refresh-lead-metrics-org-<uuid_underscore>',
+  '*/10 * * * *',
+  $$ refresh materialized view concurrently public.lead_metrics_org_<uuid_underscore>; $$
+);
+```
+#### Estratégia 5 — Request shaping (pgmq priority)
+```sql
+-- 2 filas: high (pequenos clientes) + low (hot tenant batch)
+select pgmq.create('exports_high');
+select pgmq.create('exports_low');
+-- Enqueue: hot tenant vai para low, demais para high
+create or replace function public.enqueue_export(p_org_id uuid, p_payload jsonb)
+returns bigint
+language plpgsql
+security invoker
+set search_path = ''
+as $$
+declare
+  v_is_hot boolean;
+begin
+  -- Lookup hot tenant (refresh por job separado)
+  select exists (select 1 from private.hot_tenant_registry where org_id = p_org_id and active)
+    into v_is_hot;
+  if v_is_hot then
+    return (select msg_id from pgmq.send('exports_low', p_payload));
+  else
+    return (select msg_id from pgmq.send('exports_high', p_payload));
+  end if;
+end;
+$$;
+-- Worker: drena high primeiro, low só quando high vazio
+-- (implementação Edge Function com Deno cron)
+```
+### REQ TENANT-03 — Particionamento range vs hash para `tenant_id`
+#### Decision tree
+```
+Tabela > 50k rows/tenant OU > 5M rows total?
+├── Não → SEM particionamento (overhead > benefit). Use partial indexes.
+└── Sim → particionar
+    ├── Workload uniforme cross-tenant (P95 ratio < 2× P50)?
+    │   ├── Sim → HASH (org_id) com 16-64 partições fixas
+    │   └── Não → continuar abaixo
+    └── Hot tenants conhecidos a priori (anchor tenant onboarded com SLA)?
+        ├── Sim → RANGE (org_id) com partição manual para cada hot
+        └── Não → HASH (default seguro) + monitor com REQ TENANT-01
+```
+#### Hash partitioning — workload uniforme
+```sql
+-- Tabela particionada por HASH em 16 partições (typical sweet spot Postgres 16+)
+create table public.events (
+  id uuid not null,
+  org_id uuid not null,
+  event_type text not null,
+  payload jsonb,
+  created_at timestamptz not null default now(),
+  primary key (org_id, id)
+) partition by hash (org_id);
+-- Cria 16 partições — Postgres distribui via hash modulo 16
+do $$
+declare
+  i int;
+begin
+  for i in 0..15 loop
+    execute format(
+      'create table public.events_p%s partition of public.events for values with (modulus 16, remainder %s)',
+      lpad(i::text, 2, '0'), i
+    );
+  end loop;
+end $$;
+-- Index local em cada partição (document-partitioned — REQ TENANT-04)
+create index events_org_created_idx on public.events (org_id, created_at desc);
+```
+**Por que 16 partições:** sweet spot empírico Postgres 16+ — partição management overhead negligível, paralelização de scans efetiva. Acima de 64 partições, planner começa a sofrer (citação DDIA p.202 — "each partition also has management overhead").
+#### Range partitioning — anchor tenant conhecido
+```sql
+-- Tabela particionada por RANGE — partição dedicada para anchor tenant + default p/ os demais
+create table public.audit_logs (
+  id uuid not null,
+  org_id uuid not null,
+  event_type text not null,
+  actor_id uuid,
+  payload jsonb,
+  created_at timestamptz not null default now(),
+  primary key (org_id, id)
+) partition by range (org_id);
+-- Partição dedicada para anchor tenant (uuid conhecido)
+create table public.audit_logs_anchor_acme
+  partition of public.audit_logs
+  for values from ('11111111-1111-1111-1111-111111111111')
+                to ('11111111-1111-1111-1111-111111111112');
+-- Partição default para todos os demais — rebalancear manualmente quando outro tenant virar hot
+create table public.audit_logs_default
+  partition of public.audit_logs
+  default;
+-- Índice local em cada partição
+create index audit_logs_anchor_acme_created_idx on public.audit_logs_anchor_acme (created_at desc);
+create index audit_logs_default_org_created_idx on public.audit_logs_default (org_id, created_at desc);
+```
+**Vantagem range para anchor:** isola I/O do anchor tenant. Bloat/vacuum/analyze de outras orgs não bloqueia o anchor. Permite tablespace dedicado em disco SSD separado.
+**Risco range:** se outro tenant escalar inesperadamente, partição default fica skewed. Mitigação: REQ TENANT-01 monitor + script de migração para nova partição range.
+### REQ TENANT-04 — Índices secundários document-partitioned vs term-partitioned
+DDIA p.197-200 distingue duas estratégias para índices secundários em tabelas particionadas. Aplicado a queries cross-tenant em views super-admin (caso canônico em B2B SaaS):
+| Aspecto | Document-partitioned (local) | Term-partitioned (global) |
+|---|---|---|
+| **Topologia** | 1 índice por partição (default Postgres) | 1 índice global cobrindo todas as partições (não-default Postgres — exige extensão pg_partman ou abordagem manual) |
+| **Write cost** | Barato — 1 partição afetada | Caro — N partições do índice afetadas + lock cross-partição |
+| **Read cost (single tenant)** | O(log n) na partição alvo | O(log n) no índice global |
+| **Read cost (cross-tenant super-admin)** | **scatter-gather** — todas as partições consultadas em paralelo | O(log n) — 1 lookup direto |
+| **Aplicação canônica** | RLS queries normais (filter por `org_id` → 1 partição) | Super-admin views que listam todas orgs por critério (ex: "todas as leads created_at > X") |
+#### Recomendação default: document-partitioned
+```sql
+-- Index local em cada partição da tabela events (REQ TENANT-03)
+-- Postgres cria automaticamente em cada partição quando criado na tabela parent
+create index events_event_type_idx on public.events (event_type);
+-- Verificar que cada partição tem o index
+select
+  pi.indrelid::regclass as partition_name,
+  pi.indexrelid::regclass as index_name
+from pg_inherits inh
+join pg_index pi on pi.indrelid = inh.inhrelid
+where inh.inhparent = 'public.events'::regclass;
+```
+**Query super-admin sobre `event_type` faz scatter-gather** — Postgres pruner não consegue eliminar partições (filter não inclui `org_id`). Custo: tail latency amplification (DDIA p.198) — query é tão lenta quanto a partição mais lenta. Aceitável para super-admin (queries raras, async, não user-facing).
+#### Term-partitioned (quando query path é crítico)
+Postgres não suporta nativamente índice global em tabela particionada. Opções:
+1. **Tabela auxiliar de lookup** — manualmente mantida via trigger:
+```sql
+-- Lookup table cross-tenant: term → (org_id, event_id)
+-- Mantida via trigger nas partições filhas
+create table private.events_event_type_global_idx (
+  event_type text not null,
+  org_id uuid not null,
+  event_id uuid not null,
+  created_at timestamptz not null,
+  primary key (event_type, created_at desc, org_id, event_id)
+);
+create or replace function private.events_sync_global_idx()
+returns trigger
+language plpgsql
+security definer
+set search_path = ''
+as $$
+begin
+  if (tg_op = 'INSERT') then
+    insert into private.events_event_type_global_idx
+      (event_type, org_id, event_id, created_at)
+      values (new.event_type, new.org_id, new.id, new.created_at);
+  elsif (tg_op = 'DELETE') then
+    delete from private.events_event_type_global_idx
+      where event_type = old.event_type and event_id = old.id;
+  end if;
+  return null;
+end;
+$$;
+-- Trigger replicado em cada partição (script bash gera a partir de pg_inherits)
+-- Custo: 2× write (tabela + lookup) + lock cross-partição quando lookup é atualizado
+```
+2. **Aceitar staleness via job batch** — DDIA p.200 nota que DynamoDB GSI tem propagação assíncrona "within a fraction of a second". Mesmo trade-off vale aqui:
+```sql
+-- Refresh global index via pg_cron a cada 30s
+select cron.schedule('refresh-events-global-idx', '*/30 * * * * *', $$
+  insert into private.events_event_type_global_idx
+    (event_type, org_id, event_id, created_at)
+  select event_type, org_id, id, created_at
+  from public.events
+  where created_at > coalesce((select max(created_at) from private.events_event_type_global_idx), 'epoch')
+  on conflict do nothing;
+$$);
+```
+**Recomendação canônica:** começar com document-partitioned. Migrar para term-partitioned **somente** quando query path super-admin específica for medida em > 5s P95 e não-async-tolerant.
+### REQ TENANT-05 — Rebalanceamento sem downtime (4 passos)
+DDIA p.201-204 documenta que rebalancing tem 3 requisitos não-negociáveis: load fair pós-rebalance, sem downtime durante rebalance, mover só o necessário. Aplicado a Postgres + Supavisor:
+#### Passo 1 — Detectar tenant alvo via thresholds (REQ TENANT-01)
+Confirmado quando ≥ 2 das 3 métricas em CRITICAL por > 7 dias consecutivos. Decisão: humano (DBA + customer success) revisa antes de prosseguir. **NÃO automatizar.**
+#### Passo 2 — Dump do tenant para schema isolado
+```bash
+# Pré-requisito: app está em modo read-only para o hot tenant durante 30min de janela de manutenção
+# (controlado por feature flag — coordenado com customer success)
+# Dump apenas tabelas do tenant (assumindo convenção partition naming)
+pg_dump \
+  --schema=public \
+  --table='*tenant_<uuid_underscore>*' \
+  --table='public.events_<uuid_underscore>' \
+  --table='public.audit_logs_<uuid_underscore>' \
+  --no-owner \
+  --no-acl \
+  --file=/tmp/tenant_<uuid>_dump.sql \
+  postgresql://postgres:<password>@db.<source_project_ref>.supabase.co:5432/postgres
+# Restaurar em nova instância Supabase dedicada (criada previamente)
+psql \
+  postgresql://postgres:<password>@db.<dedicated_project_ref>.supabase.co:5432/postgres \
+  < /tmp/tenant_<uuid>_dump.sql
+# Validar row count match
+psql <source> -c "select count(*) from public.events where org_id = '<uuid>';"
+psql <dedicated> -c "select count(*) from public.events;"
+```
+#### Passo 3 — Supavisor redirect via routing config
+```toml
+# supavisor.toml (ou config UI Supabase Dashboard)
+# Routing rule: requests com header X-Org-Id=<uuid> vão para instância dedicada
+[[routes]]
+match.header = "X-Org-Id"
+match.value = "<uuid>"
+target = "dedicated_<uuid>"
+priority = 100
+[pools.dedicated_<uuid>]
+host = "db.<dedicated_project_ref>.supabase.co"
+port = 5432
+database = "postgres"
+mode = "transaction"
+pool_size = 50
+# Default route para os demais tenants (instância original)
+[[routes]]
+match.default = true
+target = "shared"
+priority = 1
+```
+```typescript
+// App: setar header X-Org-Id em toda request
+// Supabase JS client custom header (versão >= 2.x)
+const supabase = createClient(url, anon_key, {
+  global: {
+    headers: { 'X-Org-Id': activeOrgId }
+  }
+})
+```
+**Após reload Supavisor (zero downtime — connections drain gracefully), tráfego do tenant alvo vai para instância dedicada. Demais tenants seguem na instância original.**
+#### Passo 4 — Cleanup conservador (após 7d sem queries)
+```sql
+-- Verificar que nenhuma query tocou as partições antigas nos últimos 7d
+select
+  schemaname, relname,
+  last_seq_scan,
+  last_idx_scan,
+  greatest(coalesce(last_seq_scan, 'epoch'::timestamptz),
+           coalesce(last_idx_scan, 'epoch'::timestamptz)) as last_access
+from pg_stat_user_tables
+where relname like '%<uuid_underscore>%'
+order by last_access;
+-- Esperado: last_access < now() - interval '7 days' para todas
+-- Apenas após confirmação manual humana, dropar
+begin;
+  drop table if exists public.events_<uuid_underscore> cascade;
+  drop table if exists public.audit_logs_<uuid_underscore> cascade;
+  -- ... outras tabelas particionadas do tenant
+commit;
+```
+**Por que 7d:** janela de defesa contra rollback emergencial. Se a instância dedicada falhar por bug não detectado em customer testing, voltar tráfego para instância original em < 5min via reverter Supavisor config — só funciona se dados antigos ainda existem.
+## Anti-patterns
+### Anti-pattern 1: Mitigar antes de medir (sem baseline 30d)
+**Errado:** "Cliente reclamou de lentidão — vamos criar MV per-tenant para ele agora."
+**Por quê:** sem baseline 30d das 3 métricas (REQ TENANT-01), não dá pra distinguir hot tenant real de pico transitório (importação CSV grande, batch fim-de-mês). Mitigação prematura adiciona MV refresh overhead permanente para uma situação possivelmente pontual.
+**Certo:** coletar 30d de baseline, identificar via REQ TENANT-01, confirmar com ≥ 2 das 3 métricas em WARN+ por > 7d. Só então aplicar mitigação.
+### Anti-pattern 2: Particionar tabela com poucos rows
+**Errado:**
+```sql
+-- 5 tenants, 200 rows/tenant
+create table public.events (...) partition by hash (org_id);
+```
+**Por quê:** overhead de partition pruning + planner trabalho > benefit. Cada query passa por partition routing, dump/restore mais lento, manutenção complexa. Premature optimization clássica — DDIA p.202 nota que "each partition also has management overhead".
+**Certo:** começar com tabela regular + index `(org_id, created_at desc)`. Particionar quando atingir threshold real (> 50k rows/tenant OU > 5M total).
+### Anti-pattern 3: Term-partitioned como default
+**Errado:** criar lookup table global (term-partitioned) já no MVP "para evitar scatter-gather no futuro".
+**Por quê:** writes ficam 2× mais caros desde dia 1. Cross-partition lock complica. DDIA p.200 documenta que mesmo DynamoDB GSI (term-partitioned built-in) tem trade-off de propagation delay assíncrono. Você está pagando custo agora para benefício hipotético futuro.
+**Certo:** document-partitioned como default. Migrar para term-partitioned **somente** quando query path super-admin medir > 5s P95 e for user-facing crítico.
+### Anti-pattern 4: Rebalancing automático
+**Errado:** script bash que detecta hot tenant via REQ TENANT-01 e automaticamente roda passos 2-3 do REQ TENANT-05.
+**Por quê:** DDIA p.204 documenta cascading failure clássica — node lento detectado como dead → rebalance automático → carga extra no resto do cluster → mais nodes ficam lentos → mais rebalance → cascade. Em B2B SaaS, equivalente: importação CSV grande detectada como hot → rebalance triggered → aplicação volta-volta no meio de transação user-facing → erros 500 em produção.
+**Certo:** detecção automática gera **alerta** (Slack/PagerDuty). Decisão de rebalance é humana (DBA + customer success), executada em janela de manutenção pré-comunicada.
+### Anti-pattern 5: Cleanup imediato após move (sem 7d)
+**Errado:**
+```sql
+-- Logo após Supavisor reroute (REQ TENANT-05 passo 3)
+drop schema tenant_<uuid> cascade;
+```
+**Por quê:** se instância dedicada tiver bug não detectado (RLS quebrada, schema diverge, performance pior), você não consegue rollback. Customer fica fora do ar até nova restore from backup (RTO horas).
+**Certo:** 7d de monitoring ativo (`pg_stat_user_tables.last_seq_scan`/`last_idx_scan` confirmados zero) antes do drop. Custo: 7d de storage duplicado (negligível vs custo de outage).
+## Ver também
+- [`../_shared-dados-distribuidos/glossary.md`](../_shared-dados-distribuidos/glossary.md) — glossário compartilhado da Suíte DDIA Foundations v1.22 (define `hot spot`, `scatter-gather`, `consistent hashing`, `key range partitioning`, etc.)
+- [`../multi-tenant-performance-scaling/SKILL.md`](../multi-tenant-performance-scaling/SKILL.md) — Supavisor pooling, partial indexes, helper functions STABLE (skill irmã v1.21 — base de scaling antes de mitigação de hot tenant)
+- [`../supabase-postgres-style/SKILL.md`](../supabase-postgres-style/SKILL.md) — style guide SQL canônico (snake_case, schema-qualified, `private.*` para helpers)
+- [`../multi-tenant-rls-hierarchy/SKILL.md`](../multi-tenant-rls-hierarchy/SKILL.md) — RLS hierarchical policies que coexistem com partições (RLS aplicada na tabela parent propaga para todas as partições)
+- [`../super-admin-platform-pattern/SKILL.md`](../super-admin-platform-pattern/SKILL.md) — cross-tenant views super-admin (caso canônico para REQ TENANT-04 term-partitioned trade-off)
+- DDIA Ch 6 (Designing Data-Intensive Applications, Martin Kleppmann) — Partitioning. Justin Bieber tenant: p.196 nota [13]. Hash vs range: p.194-196. Secondary indexes: p.197-200. Rebalancing: p.201-204.
+- [Postgres Declarative Partitioning Docs](https://www.postgresql.org/docs/current/ddl-partitioning.html#DDL-PARTITIONING-DECLARATIVE)
+- [Supavisor Multi-Pool Docs](https://supabase.com/docs/guides/database/connecting-to-postgres#supavisor)