RubyGems - bddgenx - Versions diffs - 2.4.5 → 2.4.7 - Mend

bddgenx 2.4.5 → 2.4.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (13) hide show

checksums.yaml +4 -4
data/VERSION +1 -1
data/lib/bddgenx/generators/generator.rb +22 -42
data/lib/bddgenx/generators/runner.rb +6 -6
data/lib/bddgenx/generators/steps_generator.rb +6 -18
data/lib/bddgenx/ia/chatgtp_cliente.rb +3 -21
data/lib/bddgenx/ia/gemini_cliente.rb +3 -21
data/lib/bddgenx/{support/gherkin_cleaner.rb → utils/gherkin_cleaner_helper.rb} +1 -1
data/lib/bddgenx/utils/language_helper.rb +45 -0
data/lib/bddgenx/utils/remover_steps_duplicados_helper.rb +79 -0
data/lib/env.rb +4 -2
metadata +4 -3
data/lib/bddgenx/support/remover_steps_duplicados.rb +0 -81

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: 35e8e21b724442b0cb35cda26d862a4aa3a1eccbfd1bdb050dba306c1606600e
-  data.tar.gz: 540d3c814c5621fb7184261c4f070b4f30fa7c0ea351028b6205739556864bc9
+  metadata.gz: 94b275818990d76f36659c7be2a611232c1dfa90d812ac0e70dbfa6ae9c6e3e9
+  data.tar.gz: 5219e00c5048c07aee0ad93617a8a140e5725610ea532fe06fea798c097fe5b7
 SHA512:
-  metadata.gz: 6942cf6d50f8f4f4a1ddd69f05a294f066907798f3b3dcfaac0cbc4bb04844267488bad866c65eef47c1bc9596efca105b366102d6eff3305025afbb70b8565e
-  data.tar.gz: ed96a04fa5b37f17f768f3f015eaed93e5a944ae9d041425743610b97b3dc1bbf58caef555c692d6cf732b1229d373a3f3b0fae6ebe02c719514eaa6f253b839
+  metadata.gz: 59b7b3e17525393b9cf63e6ef4b9a71ad3e2a49c69c35967180883d920ab0160400ba3ce42fe8dd5a1571c9246264dccc388faa5bcbae7808c6385dc79133ad5
+  data.tar.gz: 8dc211ad3e323a958fdb2e0b273fb5054d5f432d7be98677fbe1bf41eea2923284d763e0fe73181cc1740dfe2c5c9cfc88fa76d4fe299569f5af9e4decf0d5cc

data/VERSION CHANGED Viewed

	@@ -1 +1 @@
1	- 2.4.5
1	+ 2.4.7

data/lib/bddgenx/generators/generator.rb CHANGED Viewed

@@ -8,30 +8,6 @@
 module Bddgenx
   class Generator
-    # Palavras-chave do Gherkin em Português
-    GHERKIN_KEYS_PT = %w[Dado Quando Então E Mas].freeze
-    # Palavras-chave do Gherkin em Inglês
-    GHERKIN_KEYS_EN = %w[Given When Then And But].freeze
-    # Mapeamento PT → EN
-    GHERKIN_MAP_PT_EN = GHERKIN_KEYS_PT.zip(GHERKIN_KEYS_EN).to_h
-    # Mapeamento EN → PT
-    GHERKIN_MAP_EN_PT = GHERKIN_KEYS_EN.zip(GHERKIN_KEYS_PT).to_h
-    # Todas as palavras-chave reconhecidas pelos parsers
-    ALL_KEYS = GHERKIN_KEYS_PT + GHERKIN_KEYS_EN
-    ##
-    # Extrai todas as linhas de exemplo de um array de strings.
-    #
-    # @param raw [Array<String>] Array com linhas do grupo de passos
-    # @return [Array<String>] Somente as linhas que contêm exemplos (começam com '|')
-    def self.dividir_examples(raw)
-      raw.select { |l| l.strip.start_with?('|') }
-    end
     ##
     # Gera o conteúdo de um arquivo `.feature` baseado na história fornecida.
     # Pode operar em três modos:
@@ -42,51 +18,54 @@ module Bddgenx
     # @param input [String, Hash] Caminho para um `.txt` ou estrutura de história já processada
     # @param override_path [String, nil] Caminho alternativo de saída
     # @return [Array<String, String>] Caminho e conteúdo do `.feature`
     def self.gerar_feature(input, override_path = nil)
       modo = ENV['BDD_MODE']&.to_sym || :static
+      # Verifique o idioma antes de continuar
       if input.is_a?(String) && input.end_with?('.txt') && [:gemini, :chatgpt].include?(modo)
         # Geração com IA
         raw_txt = File.read(input)
         historia = {
-          idioma: 'pt',
+          idioma: 'pt', # Idioma inicial, caso não seja detectado no arquivo
           quero: File.basename(input, '.txt').tr('_', ' ').capitalize,
           como: '',
           para: '',
           grupos: []
         }
+        # Detecta idioma do arquivo
+        idioma = Utils::detecta_idioma_de_texto(raw_txt)
+        historia[:idioma] = idioma
         texto_gerado = if modo == :gemini
                          GeminiCliente.gerar_cenarios(raw_txt)
                        else
-                         ChatGPTCliente.gerar_cenarios(raw_txt)
+                         ChatGptCliente.gerar_cenarios(raw_txt)
                        end
         historia[:grupos] << {
           tipo: 'gerado',
           tag: 'ia',
-          passos: GherkinCleaner.limpar(texto_gerado).lines.map(&:strip).reject(&:empty?)
+          passos: Utils.limpar(texto_gerado).lines.map(&:strip).reject(&:empty?)
         }
       else
         # Geração estática
         historia = input.is_a?(String) ? Parser.ler_historia(input) : input
       end
-      idioma = historia[:idioma] || 'pt'
+      # Verifique o idioma que está sendo usado
+      idioma = historia[:idioma] || Utils::obter_idioma_do_arquivo(input)
+      # Verifique se o idioma está correto
+      puts "Idioma detectado: #{idioma}"
       cont = 1
       # Cria nome-base do arquivo .feature
-      nome_base = historia[:quero]
-                    .gsub(/[^a-z0-9]/i, '_')
-                    .downcase
-                    .split('_')
-                    .reject(&:empty?)
-                    .first(5)
-                    .join('_')
+      nome_base = historia[:quero].gsub(/[^a-z0-9]/i, '_').downcase.split('_').reject(&:empty?).first(5).join('_')
       caminho = override_path || "features/#{nome_base}.feature"
-      # Palavras-chave localizadas
       palavras = {
         feature:  idioma == 'en' ? 'Feature'          : 'Funcionalidade',
         contexto: idioma == 'en' ? 'Background'       : 'Contexto',
@@ -96,7 +75,6 @@ module Bddgenx
         regra:    idioma == 'en' ? 'Rule'             : 'Regra'
       }
-      # Cabeçalho do arquivo .feature
       conteudo = <<~GHK
         # language: #{idioma}
         #{palavras[:feature]}: #{historia[:quero].sub(/^Quero\s*/i,'')}
@@ -107,9 +85,9 @@ module Bddgenx
       # Controle para não repetir passos
       passos_unicos = Set.new
-      pt_map = GHERKIN_MAP_PT_EN
-      en_map = GHERKIN_MAP_EN_PT
-      detect = ALL_KEYS
+      pt_map = Utils::GHERKIN_MAP_PT_EN
+      en_map = Utils::GHERKIN_MAP_EN_PT
+      detect = Utils::ALL_KEYS
       historia[:grupos].each do |grupo|
         passos   = grupo[:passos]   || []
@@ -173,7 +151,9 @@ module Bddgenx
     def self.salvar_feature(caminho, conteudo)
       FileUtils.mkdir_p(File.dirname(caminho))
       File.write(caminho, conteudo)
-      puts "✅ Arquivo .feature gerado: #{caminho}"
+      puts I18n.t('messages.feature_created', caminho: caminho)
     end
   end
 end

data/lib/bddgenx/generators/runner.rb CHANGED Viewed

@@ -101,16 +101,18 @@ module Bddgenx
         puts "\n🔍 #{I18n.t('messages.processing')}: #{arquivo}"
         historia = Parser.ler_historia(arquivo)
+        idioma = Utils.obter_idioma_do_arquivo(arquivo) || historia[:idioma]
+        historia[:idioma] = idioma
         unless Validator.validar(historia)
           ignored += 1
           puts "❌ #{I18n.t('messages.invalid_story')}: #{arquivo}"
           next
         end
-        # Geração via IA (ChatGPT, Gemini, Deepseek)
-        if %w[gemini chatgpt deepseek].include?(modo)
+        # Geração via IA (ChatGPT, Gemini)
+        if %w[gemini chatgpt].include?(modo)
           puts I18n.t('messages.start_ia', modo: modo.capitalize)
-          idioma = IA::GeminiCliente.detecta_idioma_arquivo(arquivo)
+          idioma = Utils.obter_idioma_do_arquivo(arquivo) || historia[:idioma]
           feature_text = Support::Loader.run(I18n.t('messages.ia_waiting'), :default) do
             case modo
@@ -118,14 +120,12 @@ module Bddgenx
               IA::GeminiCliente.gerar_cenarios(historia, idioma)
             when 'chatgpt'
               IA::ChatGptCliente.gerar_cenarios(historia, idioma)
-            when 'deepseek'
-              IA::DeepseekCliente.gerar_cenarios(historia, idioma)
             end
           end
           if feature_text
             feature_path = Generator.path_para_feature(arquivo)
-            feature_content = Bddgenx::GherkinCleaner.limpar(feature_text)
+            feature_content = Utils.limpar(feature_text)
           else
             ignored += 1
             puts I18n.t('messages.feature_fail', arquivo: arquivo)

data/lib/bddgenx/generators/steps_generator.rb CHANGED Viewed

@@ -8,15 +8,6 @@
 module Bddgenx
   class StepsGenerator
-    # Palavras-chave Gherkin em Português
-    GHERKIN_KEYS_PT = %w[Dado Quando Então E Mas].freeze
-    # Palavras-chave Gherkin em Inglês
-    GHERKIN_KEYS_EN = %w[Given When Then And But].freeze
-    # Conjunto de todas as palavras-chave reconhecidas
-    ALL_KEYS = GHERKIN_KEYS_PT + GHERKIN_KEYS_EN
     ##
     # Transforma uma string em camelCase (sem alterar acentuação).
     #
@@ -38,23 +29,20 @@ module Bddgenx
       raise ArgumentError, I18n.t('errors.invalid_path', path: feature_path.class) unless feature_path.is_a?(String)
       linhas = File.readlines(feature_path)
+      lang = Utils::detecta_idioma_de_texto(linhas.join)
+      I18n.locale = lang.to_sym rescue :pt
-      # Detecta o idioma a partir da linha `# language:`
-      lang = if (m = linhas.find { |l| l =~ /^#\s*language:\s*(\w+)/i })
-               m[/^#\s*language:\s*(\w+)/i, 1].downcase
-             else
-               'pt'
-             end
       # Define o locale do I18n conforme idioma detectado
       I18n.locale = lang.to_sym rescue :pt
-      pt_para_en = GHERKIN_KEYS_PT.zip(GHERKIN_KEYS_EN).to_h
-      en_para_pt = GHERKIN_KEYS_EN.zip(GHERKIN_KEYS_PT).to_h
+      pt_para_en = Utils::GHERKIN_KEYS_PT.zip(Utils::GHERKIN_KEYS_EN).to_h
+      en_para_pt = Utils::GHERKIN_KEYS_EN.zip(Utils::GHERKIN_KEYS_PT).to_h
       # Seleciona apenas as linhas que representam passos
       linhas_passos = linhas.map(&:strip).select do |linha|
-        ALL_KEYS.any? { |chave| linha.start_with?(chave + ' ') }
+        Utils::ALL_KEYS.any? { |chave| linha.start_with?(chave + ' ') }
       end
       return false if linhas_passos.empty?

data/lib/bddgenx/ia/chatgtp_cliente.rb CHANGED Viewed

@@ -28,7 +28,7 @@ module Bddgenx
           return fallback_com_gemini(historia, idioma)
         end
-        # Palavras-chave Gherkin para português e inglês
         keywords_pt = {
           feature: "Funcionalidade",
           scenario: "Cenário",
@@ -104,8 +104,8 @@ module Bddgenx
           texto_ia = json.dig("choices", 0, "message", "content")
           if texto_ia
-            texto_limpo = Bddgenx::GherkinCleaner.limpar(texto_ia)
-            Utils::StepCleaner.remover_steps_duplicados(texto_ia, idioma)
+            texto_limpo = Utils.limpar(texto_ia)
+            Utils::remover_steps_duplicados(texto_ia, idioma)
             # Ajusta a linha de idioma no arquivo gerado
             texto_limpo.sub!(/^# language: .*/, "# language: #{idioma}")
@@ -137,24 +137,6 @@ module Bddgenx
         warn I18n.t('messages.fallback_gemini')
         GeminiCliente.gerar_cenarios(historia, idioma)
       end
-      ##
-      # Detecta o idioma de um arquivo de feature pela linha "# language:".
-      #
-      # @param caminho_arquivo [String] Caminho para o arquivo de feature.
-      # @return [String] Código do idioma detectado ('pt' por padrão).
-      #
-      def self.detecta_idioma_arquivo(caminho_arquivo)
-        return 'pt' unless File.exist?(caminho_arquivo)
-        File.foreach(caminho_arquivo) do |linha|
-          if linha =~ /^#\s*language:\s*(\w{2})/i
-            return $1.downcase
-          end
-        end
-        'pt'
-      end
     end
   end
 end

data/lib/bddgenx/ia/gemini_cliente.rb CHANGED Viewed

@@ -106,15 +106,15 @@ module Bddgenx
           texto_ia = json["candidates"].first.dig("content", "parts", 0, "text")
           if texto_ia
             # Limpeza e sanitização do texto para manter padrão Gherkin
-            texto_limpo = Bddgenx::GherkinCleaner.limpar(texto_ia)
-            Utils::StepCleaner.remover_steps_duplicados(texto_ia, idioma)
+            texto_limpo = Utils.limpar(texto_ia)
+            Utils.remover_steps_duplicados(texto_ia, idioma)
             # Ajuste da diretiva de idioma na saída gerada
             texto_limpo.sub!(/^# language: .*/, "# language: #{idioma}")
             texto_limpo.prepend("# language: #{idioma}\n") unless texto_limpo.start_with?("# language:")
             # Garante diretiva de idioma
-            feature_text = Bddgenx::GherkinCleaner.limpar(texto_ia)
+            feature_text = Utils.limpar(texto_ia)
             feature_text.sub!(/^# language: .*/, "") # remove qualquer # language: existente
             feature_text.prepend("# language: #{idioma}\n") # insere a correta
@@ -129,24 +129,6 @@ module Bddgenx
           return nil
         end
       end
-      ##
-      # Detecta o idioma do arquivo de feature pela linha "# language:".
-      #
-      # @param caminho_arquivo [String] Caminho do arquivo para detecção do idioma.
-      # @return [String] Código do idioma detectado (ex: 'pt'), padrão 'pt'.
-      #
-      def self.detecta_idioma_arquivo(caminho_arquivo)
-        return 'pt' unless File.exist?(caminho_arquivo)
-        File.foreach(caminho_arquivo) do |linha|
-          if linha =~ /^#\s*language:\s*(\w{2})/i
-            return $1.downcase
-          end
-        end
-        'pt' # idioma padrão caso não encontre
-      end
     end
   end
 end

data/lib/bddgenx/{support/gherkin_cleaner.rb → utils/gherkin_cleaner_helper.rb} RENAMED Viewed

@@ -1,5 +1,5 @@
 module Bddgenx
-  class GherkinCleaner
+  module Utils
     # Método principal para limpar o texto Gherkin recebido.
     # Executa uma sequência de operações para deixar o texto formatado e correto.
     #

data/lib/bddgenx/utils/language_helper.rb ADDED Viewed

@@ -0,0 +1,45 @@
+module Bddgenx
+  module Utils
+    # Palavras-chave do Gherkin em Português
+    GHERKIN_KEYS_PT = %w[Dado Quando Então E Mas].freeze
+    # Palavras-chave do Gherkin em Inglês
+    GHERKIN_KEYS_EN = %w[Given When Then And But].freeze
+    # Mapeamento PT → EN
+    GHERKIN_MAP_PT_EN = GHERKIN_KEYS_PT.zip(GHERKIN_KEYS_EN).to_h
+    # Mapeamento EN → PT
+    GHERKIN_MAP_EN_PT = GHERKIN_KEYS_EN.zip(GHERKIN_KEYS_PT).to_h
+    # Todas as palavras-chave reconhecidas
+    ALL_KEYS = GHERKIN_KEYS_PT + GHERKIN_KEYS_EN
+    ##
+    # Extrai o idioma do arquivo .txt, a partir da linha "# language:".
+    # @param txt_file [String] Caminho do arquivo .txt
+    # @return [String] O idioma extraído ou 'pt' como padrão
+    def self.obter_idioma_do_arquivo(caminho_arquivo)
+      return 'pt' unless File.exist?(caminho_arquivo)
+      File.foreach(caminho_arquivo) do |linha|
+        if linha =~ /^#\s*language:\s*(\w{2})/i
+          return $1.downcase
+        end
+      end
+      'pt' # idioma padrão caso não encontre
+    end
+    ##
+    # Detecta o idioma a partir de um texto (como conteúdo de arquivo ou string).
+    # @param texto [String] O texto onde o idioma será detectado
+    # @return [String] O idioma detectado ('pt' por padrão)
+    def self.detecta_idioma_de_texto(texto)
+      if texto =~ /^#\s*language:\s*(\w{2})/i
+        return $1.downcase
+      end
+      'pt' # Idioma padrão se o idioma não for detectado
+    end
+  end
+end

data/lib/bddgenx/utils/remover_steps_duplicados_helper.rb ADDED Viewed

@@ -0,0 +1,79 @@
+module Bddgenx
+  module Utils
+    # Remove passos duplicados em um texto de cenários BDD,
+    # levando em conta o idioma para identificar as keywords (Given, When, Then, And / Dado, Quando, Então, E)
+    #
+    # Parâmetros:
+    # - texto: string contendo o texto do cenário BDD
+    # - idioma: 'en' para inglês ou qualquer outro para português
+    #
+    # Retorna o texto com passos duplicados removidos, preservando a ordem original
+    def self.remover_steps_duplicados(texto, idioma)
+      # Define as keywords principais para o idioma
+      keywords = idioma == 'en' ? %w[Given When Then And] : %w[Dado Quando Então E]
+      # Conjunto para rastrear passos já vistos (versão canônica)
+      seen = Set.new
+      resultado = []
+      # Percorre linha a linha
+      texto.each_line do |linha|
+        # Verifica se a linha começa com uma das keywords
+        if keywords.any? { |kw| linha.strip.start_with?(kw) }
+          # Canonicaliza o passo para comparação sem variações irrelevantes
+          canonical = Utils::canonicalize_step(linha, keywords)
+          # Só adiciona se ainda não viu o passo canônico
+          unless seen.include?(canonical)
+            seen.add(canonical)
+            resultado << linha
+          end
+        else
+          # Linhas que não são passos são adicionadas normalmente
+          resultado << linha
+        end
+      end
+      # Retorna o texto reconstruído sem duplicatas
+      resultado.join
+    end
+    # Gera uma versão canônica (normalizada) do passo para facilitar
+    # a identificação de duplicatas mesmo com variações menores de texto.
+    #
+    # Exemplo: Dado "usuario" fez login  e Dado <usuario> fez login
+    # gerarão o mesmo canonical para evitar repetição.
+    #
+    # Passos:
+    # - Remove a keyword (Given, When, etc) do começo
+    # - Substitui textos entre aspas, placeholders <> e números por <param>
+    # - Remove acentuação e pontuação para normalizar
+    # - Converte para minúsculas e remove espaços extras
+    #
+    # Parâmetros:
+    # - linha: string com o passo completo
+    # - keywords: array com as keywords para remoção
+    #
+    # Retorna uma string normalizada representando o passo
+    def self.canonicalize_step(linha, keywords)
+      texto = linha.dup.strip
+      # Remove a keyword do início, se existir
+      keywords.each do |kw|
+        texto.sub!(/^#{kw}\s+/i, '')
+      end
+      # Substitui textos entre aspas, placeholders e números por <param>
+      texto.gsub!(/"[^"]*"|<[^>]*>|\b\d+\b/, '<param>')
+      # Remove acentos usando Unicode Normalization Form KD (decompõe caracteres)
+      texto = Unicode.normalize_KD(texto).gsub(/\p{Mn}/, '')
+      # Remove pontuação, deixando apenas letras, números, espaços e <>
+      texto.gsub!(/[^a-zA-Z0-9\s<>]/, '')
+      # Converte para minúsculas, remove espaços extras e retorna
+      texto.downcase.strip.squeeze(" ")
+    end
+  end
+end

data/lib/env.rb CHANGED Viewed

@@ -59,11 +59,13 @@ require 'bundler/setup' if File.exist?(File.expand_path('../../Gemfile', __FILE_
 # 🧩 Módulos utilitários da gem
 # --------------------------------------
-require_relative 'bddgenx/support/gherkin_cleaner'           # Sanitização de Gherkin gerado
-require_relative 'bddgenx/support/remover_steps_duplicados'  # Remove passos duplicados
 require_relative 'bddgenx/support/validator'                 # Valida estrutura de entrada
 require_relative 'bddgenx/support/font_loader'               # Carrega fontes do PDF
+require_relative 'bddgenx/utils/gherkin_cleaner_helper'           # Sanitização de Gherkin gerado
+require_relative 'bddgenx/utils/remover_steps_duplicados_helper'  # Remove passos duplicados
+require_relative 'bddgenx/utils/language_helper'
 # --------------------------------------
 # 🤖 Clientes de IA (ChatGPT, Gemini)
 # --------------------------------------

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: bddgenx
 version: !ruby/object:Gem::Version
-  version: 2.4.5
+  version: 2.4.7
 platform: ruby
 authors:
 - David Nascimento
@@ -139,10 +139,11 @@ files:
 - lib/bddgenx/reports/tracer.rb
 - lib/bddgenx/setup.rb
 - lib/bddgenx/support/font_loader.rb
-- lib/bddgenx/support/gherkin_cleaner.rb
 - lib/bddgenx/support/loader.rb
-- lib/bddgenx/support/remover_steps_duplicados.rb
 - lib/bddgenx/support/validator.rb
+- lib/bddgenx/utils/gherkin_cleaner_helper.rb
+- lib/bddgenx/utils/language_helper.rb
+- lib/bddgenx/utils/remover_steps_duplicados_helper.rb
 - lib/bddgenx/version.rb
 - lib/env.rb
 - lib/parser.rb

data/lib/bddgenx/support/remover_steps_duplicados.rb DELETED Viewed

@@ -1,81 +0,0 @@
-module Bddgenx
-  module Utils
-    class StepCleaner
-      # Remove passos duplicados em um texto de cenários BDD,
-      # levando em conta o idioma para identificar as keywords (Given, When, Then, And / Dado, Quando, Então, E)
-      #
-      # Parâmetros:
-      # - texto: string contendo o texto do cenário BDD
-      # - idioma: 'en' para inglês ou qualquer outro para português
-      #
-      # Retorna o texto com passos duplicados removidos, preservando a ordem original
-      def self.remover_steps_duplicados(texto, idioma)
-        # Define as keywords principais para o idioma
-        keywords = idioma == 'en' ? %w[Given When Then And] : %w[Dado Quando Então E]
-        # Conjunto para rastrear passos já vistos (versão canônica)
-        seen = Set.new
-        resultado = []
-        # Percorre linha a linha
-        texto.each_line do |linha|
-          # Verifica se a linha começa com uma das keywords
-          if keywords.any? { |kw| linha.strip.start_with?(kw) }
-            # Canonicaliza o passo para comparação sem variações irrelevantes
-            canonical = canonicalize_step(linha, keywords)
-            # Só adiciona se ainda não viu o passo canônico
-            unless seen.include?(canonical)
-              seen.add(canonical)
-              resultado << linha
-            end
-          else
-            # Linhas que não são passos são adicionadas normalmente
-            resultado << linha
-          end
-        end
-        # Retorna o texto reconstruído sem duplicatas
-        resultado.join
-      end
-      # Gera uma versão canônica (normalizada) do passo para facilitar
-      # a identificação de duplicatas mesmo com variações menores de texto.
-      #
-      # Exemplo: Dado "usuario" fez login  e Dado <usuario> fez login
-      # gerarão o mesmo canonical para evitar repetição.
-      #
-      # Passos:
-      # - Remove a keyword (Given, When, etc) do começo
-      # - Substitui textos entre aspas, placeholders <> e números por <param>
-      # - Remove acentuação e pontuação para normalizar
-      # - Converte para minúsculas e remove espaços extras
-      #
-      # Parâmetros:
-      # - linha: string com o passo completo
-      # - keywords: array com as keywords para remoção
-      #
-      # Retorna uma string normalizada representando o passo
-      def self.canonicalize_step(linha, keywords)
-        texto = linha.dup.strip
-        # Remove a keyword do início, se existir
-        keywords.each do |kw|
-          texto.sub!(/^#{kw}\s+/i, '')
-        end
-        # Substitui textos entre aspas, placeholders e números por <param>
-        texto.gsub!(/"[^"]*"|<[^>]*>|\b\d+\b/, '<param>')
-        # Remove acentos usando Unicode Normalization Form KD (decompõe caracteres)
-        texto = Unicode.normalize_KD(texto).gsub(/\p{Mn}/, '')
-        # Remove pontuação, deixando apenas letras, números, espaços e <>
-        texto.gsub!(/[^a-zA-Z0-9\s<>]/, '')
-        # Converte para minúsculas, remove espaços extras e retorna
-        texto.downcase.strip.squeeze(" ")
-      end
-    end
-  end
-end