PyPI - docs-cli - Versions diffs - 0.1.0__tar.gz → 0.1.1__tar.gz - Mend

docs-cli 0.1.0tar.gz → 0.1.1tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (22) hide show

docs_cli-0.1.1/PKG-INFO ADDED Viewed

@@ -0,0 +1,162 @@
+Metadata-Version: 2.4
+Name: docs-cli
+Version: 0.1.1
+Summary: Um toolkit para processamento e avaliação de documentação.
+Author-email: Paulo Guilherme Pilott <seuemail@example.com>
+License-Expression: MIT
+Classifier: Programming Language :: Python :: 3
+Classifier: Operating System :: OS Independent
+Classifier: Development Status :: 3 - Alpha
+Classifier: Intended Audience :: Developers
+Classifier: Topic :: Documentation
+Classifier: Topic :: Utilities
+Classifier: Environment :: Console
+Requires-Python: >=3.8
+Description-Content-Type: text/markdown
+Requires-Dist: google-generativeai
+Requires-Dist: python-dotenv
+Requires-Dist: numpy
+Requires-Dist: pandas
+# Docs CLI Toolkit
+Uma ferramenta de linha de comando para processamento e análise de documentação, com suporte a geração de embeddings usando a API do Google Gemini.
+## Instalação
+```bash
+pip install docs-cli-toolkit
+```
+## Configuração da API do Google Gemini
+A ferramenta oferece três maneiras de configurar a chave da API do Google Gemini:
+1. **Configuração Global (Recomendada)**:
+   ```bash
+   docs-cli api "sua-chave-api"
+   ```
+   Para verificar a chave configurada (parcialmente mascarada):
+   ```bash
+   docs-cli api --show
+   ```
+2. **Via Linha de Comando**:
+   ```bash
+   docs-cli --api "sua-chave-api" generate_embeddings input.json output.json
+   ```
+3. **Via Variável de Ambiente**:
+   Crie um arquivo `.env` no diretório do projeto:
+   ```
+   GOOGLE_API_KEY=sua-chave-api
+   ```
+## Comandos Disponíveis
+### 1. Merge de Documentos
+Consolida múltiplos arquivos Markdown em um único arquivo:
+```bash
+docs-cli merge <diretório_entrada> [--output_file arquivo_saída.md]
+```
+### 2. Extração de Dados
+Extrai dados estruturados do Markdown consolidado:
+```bash
+docs-cli extract [--input_file arquivo_entrada.md] [--output_file arquivo_saída.json]
+```
+### 3. Geração de Embeddings
+Gera embeddings para os documentos processados:
+```bash
+docs-cli generate_embeddings [--input_file arquivo_entrada.json] [--output_file arquivo_saída.json]
+```
+### 4. Limpeza de CSV
+Limpa e processa arquivos CSV de perguntas e respostas:
+```bash
+docs-cli clean_csv <arquivo_entrada.csv> [--output_file arquivo_saída.csv]
+```
+### 5. Avaliação de Cobertura
+Avalia a cobertura da documentação:
+```bash
+docs-cli evaluate <arquivo_qa.csv> <arquivo_embeddings.json> [-k N] [-o arquivo_saída.json]
+```
+### 6. Geração de Relatórios
+Gera relatórios em Markdown e HTML:
+```bash
+# Relatório em Markdown
+docs-cli report_md [--input_file arquivo_entrada.json] [--output_file relatório.md] [--top_k_chunks N]
+# Relatório em HTML
+docs-cli report_html [--input_file arquivo_entrada.json] [--output_file relatório.html] [--top_k_chunks N]
+```
+### 7. Fluxo Completo
+Executa todo o pipeline de processamento:
+```bash
+docs-cli full_flow <diretório_docs> <arquivo_qa.csv> [--eval_top_k N]
+```
+### 8. Fluxo Customizado
+Executa uma sequência personalizada de etapas:
+```bash
+docs-cli custom_flow <etapas...>
+```
+Etapas disponíveis: `merge`, `extract`, `generate_embeddings`, `clean_csv`, `evaluate`, `report_md`, `report_html`
+## Exemplos de Uso
+### Processamento Básico
+```bash
+# Configurar a API (uma única vez)
+docs-cli api "sua-chave-api"
+# Processar documentação
+docs-cli full_flow docs/ qa-data.csv
+```
+### Fluxo Customizado
+```bash
+# Executar apenas merge e extração
+docs-cli custom_flow merge extract
+# Executar geração de embeddings com chave API temporária
+docs-cli --api "chave-temporária" custom_flow generate_embeddings
+```
+### Geração de Relatórios
+```bash
+# Gerar relatório em Markdown
+docs-cli report_md --input_file evaluation_results.json --output_file coverage.md
+# Gerar relatório em HTML
+docs-cli report_html --input_file evaluation_results.json --output_file coverage.html
+```
+## Arquivos Intermediários
+A ferramenta utiliza os seguintes arquivos intermediários por padrão:
+- `corpus_consolidated.md`: Documentos Markdown consolidados
+- `raw_docs.json`: Dados estruturados extraídos
+- `embeddings.json`: Embeddings gerados
+- `gartner_filtrado_processed.csv`: CSV processado
+- `evaluation_results.json`: Resultados da avaliação
+- `coverage_report.md`: Relatório em Markdown
+- `coverage_report.html`: Relatório em HTML
+## Requisitos
+- Python 3.8+
+- Google Gemini API Key
+- Dependências listadas em `pyproject.toml`
+## Contribuindo
+Contribuições são bem-vindas! Por favor, sinta-se à vontade para enviar um Pull Request.
+## Licença
+Este projeto está licenciado sob a licença MIT - veja o arquivo LICENSE para detalhes.

docs_cli-0.1.1/README.md ADDED Viewed

@@ -0,0 +1,142 @@
+# Docs CLI Toolkit
+Uma ferramenta de linha de comando para processamento e análise de documentação, com suporte a geração de embeddings usando a API do Google Gemini.
+## Instalação
+```bash
+pip install docs-cli-toolkit
+```
+## Configuração da API do Google Gemini
+A ferramenta oferece três maneiras de configurar a chave da API do Google Gemini:
+1. **Configuração Global (Recomendada)**:
+   ```bash
+   docs-cli api "sua-chave-api"
+   ```
+   Para verificar a chave configurada (parcialmente mascarada):
+   ```bash
+   docs-cli api --show
+   ```
+2. **Via Linha de Comando**:
+   ```bash
+   docs-cli --api "sua-chave-api" generate_embeddings input.json output.json
+   ```
+3. **Via Variável de Ambiente**:
+   Crie um arquivo `.env` no diretório do projeto:
+   ```
+   GOOGLE_API_KEY=sua-chave-api
+   ```
+## Comandos Disponíveis
+### 1. Merge de Documentos
+Consolida múltiplos arquivos Markdown em um único arquivo:
+```bash
+docs-cli merge <diretório_entrada> [--output_file arquivo_saída.md]
+```
+### 2. Extração de Dados
+Extrai dados estruturados do Markdown consolidado:
+```bash
+docs-cli extract [--input_file arquivo_entrada.md] [--output_file arquivo_saída.json]
+```
+### 3. Geração de Embeddings
+Gera embeddings para os documentos processados:
+```bash
+docs-cli generate_embeddings [--input_file arquivo_entrada.json] [--output_file arquivo_saída.json]
+```
+### 4. Limpeza de CSV
+Limpa e processa arquivos CSV de perguntas e respostas:
+```bash
+docs-cli clean_csv <arquivo_entrada.csv> [--output_file arquivo_saída.csv]
+```
+### 5. Avaliação de Cobertura
+Avalia a cobertura da documentação:
+```bash
+docs-cli evaluate <arquivo_qa.csv> <arquivo_embeddings.json> [-k N] [-o arquivo_saída.json]
+```
+### 6. Geração de Relatórios
+Gera relatórios em Markdown e HTML:
+```bash
+# Relatório em Markdown
+docs-cli report_md [--input_file arquivo_entrada.json] [--output_file relatório.md] [--top_k_chunks N]
+# Relatório em HTML
+docs-cli report_html [--input_file arquivo_entrada.json] [--output_file relatório.html] [--top_k_chunks N]
+```
+### 7. Fluxo Completo
+Executa todo o pipeline de processamento:
+```bash
+docs-cli full_flow <diretório_docs> <arquivo_qa.csv> [--eval_top_k N]
+```
+### 8. Fluxo Customizado
+Executa uma sequência personalizada de etapas:
+```bash
+docs-cli custom_flow <etapas...>
+```
+Etapas disponíveis: `merge`, `extract`, `generate_embeddings`, `clean_csv`, `evaluate`, `report_md`, `report_html`
+## Exemplos de Uso
+### Processamento Básico
+```bash
+# Configurar a API (uma única vez)
+docs-cli api "sua-chave-api"
+# Processar documentação
+docs-cli full_flow docs/ qa-data.csv
+```
+### Fluxo Customizado
+```bash
+# Executar apenas merge e extração
+docs-cli custom_flow merge extract
+# Executar geração de embeddings com chave API temporária
+docs-cli --api "chave-temporária" custom_flow generate_embeddings
+```
+### Geração de Relatórios
+```bash
+# Gerar relatório em Markdown
+docs-cli report_md --input_file evaluation_results.json --output_file coverage.md
+# Gerar relatório em HTML
+docs-cli report_html --input_file evaluation_results.json --output_file coverage.html
+```
+## Arquivos Intermediários
+A ferramenta utiliza os seguintes arquivos intermediários por padrão:
+- `corpus_consolidated.md`: Documentos Markdown consolidados
+- `raw_docs.json`: Dados estruturados extraídos
+- `embeddings.json`: Embeddings gerados
+- `gartner_filtrado_processed.csv`: CSV processado
+- `evaluation_results.json`: Resultados da avaliação
+- `coverage_report.md`: Relatório em Markdown
+- `coverage_report.html`: Relatório em HTML
+## Requisitos
+- Python 3.8+
+- Google Gemini API Key
+- Dependências listadas em `pyproject.toml`
+## Contribuindo
+Contribuições são bem-vindas! Por favor, sinta-se à vontade para enviar um Pull Request.
+## Licença
+Este projeto está licenciado sob a licença MIT - veja o arquivo LICENSE para detalhes.

docs_cli-0.1.1/docs_cli.egg-info/PKG-INFO ADDED Viewed

@@ -0,0 +1,162 @@
+Metadata-Version: 2.4
+Name: docs-cli
+Version: 0.1.1
+Summary: Um toolkit para processamento e avaliação de documentação.
+Author-email: Paulo Guilherme Pilott <seuemail@example.com>
+License-Expression: MIT
+Classifier: Programming Language :: Python :: 3
+Classifier: Operating System :: OS Independent
+Classifier: Development Status :: 3 - Alpha
+Classifier: Intended Audience :: Developers
+Classifier: Topic :: Documentation
+Classifier: Topic :: Utilities
+Classifier: Environment :: Console
+Requires-Python: >=3.8
+Description-Content-Type: text/markdown
+Requires-Dist: google-generativeai
+Requires-Dist: python-dotenv
+Requires-Dist: numpy
+Requires-Dist: pandas
+# Docs CLI Toolkit
+Uma ferramenta de linha de comando para processamento e análise de documentação, com suporte a geração de embeddings usando a API do Google Gemini.
+## Instalação
+```bash
+pip install docs-cli-toolkit
+```
+## Configuração da API do Google Gemini
+A ferramenta oferece três maneiras de configurar a chave da API do Google Gemini:
+1. **Configuração Global (Recomendada)**:
+   ```bash
+   docs-cli api "sua-chave-api"
+   ```
+   Para verificar a chave configurada (parcialmente mascarada):
+   ```bash
+   docs-cli api --show
+   ```
+2. **Via Linha de Comando**:
+   ```bash
+   docs-cli --api "sua-chave-api" generate_embeddings input.json output.json
+   ```
+3. **Via Variável de Ambiente**:
+   Crie um arquivo `.env` no diretório do projeto:
+   ```
+   GOOGLE_API_KEY=sua-chave-api
+   ```
+## Comandos Disponíveis
+### 1. Merge de Documentos
+Consolida múltiplos arquivos Markdown em um único arquivo:
+```bash
+docs-cli merge <diretório_entrada> [--output_file arquivo_saída.md]
+```
+### 2. Extração de Dados
+Extrai dados estruturados do Markdown consolidado:
+```bash
+docs-cli extract [--input_file arquivo_entrada.md] [--output_file arquivo_saída.json]
+```
+### 3. Geração de Embeddings
+Gera embeddings para os documentos processados:
+```bash
+docs-cli generate_embeddings [--input_file arquivo_entrada.json] [--output_file arquivo_saída.json]
+```
+### 4. Limpeza de CSV
+Limpa e processa arquivos CSV de perguntas e respostas:
+```bash
+docs-cli clean_csv <arquivo_entrada.csv> [--output_file arquivo_saída.csv]
+```
+### 5. Avaliação de Cobertura
+Avalia a cobertura da documentação:
+```bash
+docs-cli evaluate <arquivo_qa.csv> <arquivo_embeddings.json> [-k N] [-o arquivo_saída.json]
+```
+### 6. Geração de Relatórios
+Gera relatórios em Markdown e HTML:
+```bash
+# Relatório em Markdown
+docs-cli report_md [--input_file arquivo_entrada.json] [--output_file relatório.md] [--top_k_chunks N]
+# Relatório em HTML
+docs-cli report_html [--input_file arquivo_entrada.json] [--output_file relatório.html] [--top_k_chunks N]
+```
+### 7. Fluxo Completo
+Executa todo o pipeline de processamento:
+```bash
+docs-cli full_flow <diretório_docs> <arquivo_qa.csv> [--eval_top_k N]
+```
+### 8. Fluxo Customizado
+Executa uma sequência personalizada de etapas:
+```bash
+docs-cli custom_flow <etapas...>
+```
+Etapas disponíveis: `merge`, `extract`, `generate_embeddings`, `clean_csv`, `evaluate`, `report_md`, `report_html`
+## Exemplos de Uso
+### Processamento Básico
+```bash
+# Configurar a API (uma única vez)
+docs-cli api "sua-chave-api"
+# Processar documentação
+docs-cli full_flow docs/ qa-data.csv
+```
+### Fluxo Customizado
+```bash
+# Executar apenas merge e extração
+docs-cli custom_flow merge extract
+# Executar geração de embeddings com chave API temporária
+docs-cli --api "chave-temporária" custom_flow generate_embeddings
+```
+### Geração de Relatórios
+```bash
+# Gerar relatório em Markdown
+docs-cli report_md --input_file evaluation_results.json --output_file coverage.md
+# Gerar relatório em HTML
+docs-cli report_html --input_file evaluation_results.json --output_file coverage.html
+```
+## Arquivos Intermediários
+A ferramenta utiliza os seguintes arquivos intermediários por padrão:
+- `corpus_consolidated.md`: Documentos Markdown consolidados
+- `raw_docs.json`: Dados estruturados extraídos
+- `embeddings.json`: Embeddings gerados
+- `gartner_filtrado_processed.csv`: CSV processado
+- `evaluation_results.json`: Resultados da avaliação
+- `coverage_report.md`: Relatório em Markdown
+- `coverage_report.html`: Relatório em HTML
+## Requisitos
+- Python 3.8+
+- Google Gemini API Key
+- Dependências listadas em `pyproject.toml`
+## Contribuindo
+Contribuições são bem-vindas! Por favor, sinta-se à vontade para enviar um Pull Request.
+## Licença
+Este projeto está licenciado sob a licença MIT - veja o arquivo LICENSE para detalhes.

{docs_cli-0.1.0 → docs_cli-0.1.1}/docs_cli.egg-info/entry_points.txt RENAMED Viewed

@@ -3,7 +3,7 @@ docs-cli = docs_tc:main
 docs-tc-clean-csv = limpa_csv:cli_main
 docs-tc-evaluate-coverage = evaluate_coverage:cli_main
 docs-tc-extract-data = extract_data_from_markdown:cli_main
-docs-tc-generate-embeddings = generate_embedings:cli_main
+docs-tc-generate-embeddings = generate_embeddings:cli_main
 docs-tc-generate-report-html = generate_report_html:cli_main
 docs-tc-generate-report-md = generate_report:cli_main
 docs-tc-merge-markdown = merge_markdown:cli_main

{docs_cli-0.1.0 → docs_cli-0.1.1}/docs_tc.py RENAMED Viewed

@@ -5,6 +5,8 @@ import argparse
 import subprocess
 import sys
 import os
+import json
+from pathlib import Path
 # Nomes de arquivo padrão intermediários e finais
 DEFAULT_CORPUS_CONSOLIDATED = "corpus_consolidated.md"
@@ -15,6 +17,31 @@ DEFAULT_QA_PROCESSED = "gartner_filtrado_processed.csv" # Saída do limpa_csv e
 DEFAULT_MD_REPORT = "coverage_report.md"
 DEFAULT_HTML_REPORT = "coverage_report.html"
+# Configuração da API
+CONFIG_DIR = Path.home() / ".docs-cli"
+CONFIG_FILE = CONFIG_DIR / "config.json"
+def ensure_config_dir():
+    """Garante que o diretório de configuração existe."""
+    CONFIG_DIR.mkdir(parents=True, exist_ok=True)
+def load_config():
+    """Carrega a configuração do arquivo config.json."""
+    ensure_config_dir()
+    if CONFIG_FILE.exists():
+        try:
+            with open(CONFIG_FILE, 'r') as f:
+                return json.load(f)
+        except json.JSONDecodeError:
+            return {}
+    return {}
+def save_config(config):
+    """Salva a configuração no arquivo config.json."""
+    ensure_config_dir()
+    with open(CONFIG_FILE, 'w') as f:
+        json.dump(config, f, indent=4)
 def run_script(command_args):
     """Executa um script (entry point) como um subprocesso."""
     # Espera que command_args[0] seja um executável no PATH (ex: 'docs-tc-extract-data')
@@ -45,8 +72,17 @@ def run_script(command_args):
 def main():
     parser = argparse.ArgumentParser(description="Docs Toolkit CLI - Orquestrador de scripts de processamento de documentação.")
+    # Adiciona argumento global para a chave da API
+    parser.add_argument("--api", help="Chave da API do Google Gemini (opcional, pode ser fornecida via GOOGLE_API_KEY no .env)")
     subparsers = parser.add_subparsers(dest="command", help="Comandos disponíveis", required=True)
+    # --- Subparser para configuração da API ---
+    parser_api = subparsers.add_parser("api", help="Configura a chave da API do Google Gemini.")
+    parser_api.add_argument("api_key", help="Chave da API do Google Gemini para ser salva globalmente.")
+    parser_api.add_argument("--show", action="store_true", help="Mostra a chave da API atual (parcialmente mascarada).")
     # --- Subparser para merge_markdown.py ---
     parser_merge = subparsers.add_parser("merge", help="Consolida arquivos Markdown de um diretório.")
     parser_merge.add_argument("input_dir", help="Diretório de entrada contendo os arquivos .md.")
@@ -123,11 +159,31 @@ def main():
     args = parser.parse_args()
+    # Carrega a configuração
+    config = load_config()
+    # Se o comando for 'api', lida com a configuração da API
+    if args.command == "api":
+        if args.show:
+            if "api_key" in config:
+                masked_key = config["api_key"][:8] + "..." + config["api_key"][-4:]
+                print(f"Chave da API atual: {masked_key}")
+            else:
+                print("Nenhuma chave da API configurada.")
+        else:
+            config["api_key"] = args.api_key
+            save_config(config)
+            print("✅ Chave da API configurada com sucesso!")
+        return
+    # Usa a chave da API da configuração se não for fornecida via linha de comando
+    api_key = args.api or config.get("api_key")
     # Nomes dos entry points (conforme definido em setup.py)
     SCRIPT_MAP = {
         "merge": "docs-tc-merge-markdown",
         "extract": "docs-tc-extract-data",
-        "generate_embeddings": "docs-tc-generate-embeddings", # Certifique-se que 'generate_embedings.py' (com typo) tem cli_main e o entry point no setup.py usa esse nome de módulo
+        "generate_embeddings": "docs-tc-generate-embeddings",
         "clean_csv": "docs-tc-clean-csv",
         "evaluate": "docs-tc-evaluate-coverage",
         "report_md": "docs-tc-generate-report-md",
@@ -139,7 +195,10 @@ def main():
     elif args.command == "extract":
         run_script([SCRIPT_MAP["extract"], args.input_file, args.output_file])
     elif args.command == "generate_embeddings":
-        run_script([SCRIPT_MAP["generate_embeddings"], args.input_file, args.output_file])
+        command_args = [SCRIPT_MAP["generate_embeddings"], args.input_file, args.output_file]
+        if api_key:
+            command_args.extend(["--api-key", api_key])
+        run_script(command_args)
     elif args.command == "clean_csv":
         run_script([SCRIPT_MAP["clean_csv"], args.input_file, args.output_file])
     elif args.command == "evaluate":
@@ -174,7 +233,13 @@ def main():
         run_step_or_exit([SCRIPT_MAP["merge"], args.doc_input_dir, args.corpus_file])
         run_step_or_exit([SCRIPT_MAP["clean_csv"], args.qa_input_file, args.cleaned_qa_file])
         run_step_or_exit([SCRIPT_MAP["extract"], args.corpus_file, args.raw_docs_file])
-        run_step_or_exit([SCRIPT_MAP["generate_embeddings"], args.raw_docs_file, args.embeddings_file])
+        # Adiciona a chave da API ao comando generate_embeddings se fornecida
+        generate_embeddings_args = [SCRIPT_MAP["generate_embeddings"], args.raw_docs_file, args.embeddings_file]
+        if api_key:
+            generate_embeddings_args.extend(["--api-key", api_key])
+        run_step_or_exit(generate_embeddings_args)
         run_step_or_exit([
             SCRIPT_MAP["evaluate"],
             args.cleaned_qa_file,
@@ -222,7 +287,10 @@ def main():
             elif step == "generate_embeddings":
                 if not os.path.exists(current_raw_docs_file):
                      current_raw_docs_file = input(f"Arquivo Raw Docs ({current_raw_docs_file}) não encontrado. Informe o caminho correto: ")
-                run_custom_step_or_exit([SCRIPT_MAP["generate_embeddings"], current_raw_docs_file, current_embeddings_file])
+                command_args = [SCRIPT_MAP["generate_embeddings"], current_raw_docs_file, current_embeddings_file]
+                if api_key:
+                    command_args.extend(["--api-key", api_key])
+                run_custom_step_or_exit(command_args)
             elif step == "clean_csv":
                 qa_input_file = input("Por favor, informe o arquivo CSV de Q&A original para 'clean_csv' (pressione Enter para usar 'qa-data.csv'): ") or "qa-data.csv"
                 run_custom_step_or_exit([SCRIPT_MAP["clean_csv"], qa_input_file, current_cleaned_qa_file])

{docs_cli-0.1.0 → docs_cli-0.1.1}/generate_embeddings.py RENAMED Viewed

@@ -11,10 +11,6 @@ import re
 load_dotenv()
 # --- Configuração da API do Google Gemini ---
-GOOGLE_API_KEY = os.getenv("GOOGLE_API_KEY")
-if not GOOGLE_API_KEY:
-    raise ValueError("A variável de ambiente GOOGLE_API_KEY não está configurada.")
-genai.configure(api_key=GOOGLE_API_KEY) # type: ignore
 EMBEDDING_MODEL = "models/embedding-001"
 # Limite de caracteres para o embedding, para evitar exceder o limite de tokens da API
@@ -25,6 +21,16 @@ REQUEST_LIMIT_PER_MINUTE = 150
 request_count = 0
 last_request_time = time.time() # Inicializa com o tempo atual
+def configure_api(api_key=None):
+    """
+    Configura a API do Google Gemini com a chave fornecida ou da variável de ambiente.
+    """
+    global GOOGLE_API_KEY
+    GOOGLE_API_KEY = api_key or os.getenv("GOOGLE_API_KEY")
+    if not GOOGLE_API_KEY:
+        raise ValueError("A chave da API do Google Gemini não está configurada. Use --api-key ou configure GOOGLE_API_KEY no arquivo .env")
+    genai.configure(api_key=GOOGLE_API_KEY) # type: ignore
 def clean_text_for_embedding(text):
     """
     Remove caracteres especiais e formatação markdown para texto que será EMBEDDADO.
@@ -142,11 +148,14 @@ def generate_embedding_with_retry(text_content):
                 return None
     return None
-def generate_embeddings_for_docs(input_json_path="raw_docs.json", output_json_path="embeddings.json"):
+def generate_embeddings_for_docs(input_json_path="raw_docs.json", output_json_path="embeddings.json", api_key=None):
     """
     Lê o JSON com dados de documentos (já separados), divide cada um em chunks,
     gera embeddings para cada chunk, e salva o resultado final em um novo JSON.
     """
+    # Configura a API com a chave fornecida
+    configure_api(api_key)
     if not os.path.exists(input_json_path):
         print(f"Erro: O arquivo '{input_json_path}' não foi encontrado. Por favor, execute o script de extração (ex: 'extract_consolidated_md_to_raw_json.py') primeiro.")
         return False
@@ -224,8 +233,9 @@ def cli_main():
     parser = argparse.ArgumentParser(description="Gera embeddings para documentos a partir de um JSON.")
     parser.add_argument("input_json_path", help="Caminho para o arquivo JSON de entrada (ex: raw_docs.json).")
     parser.add_argument("output_json_path", help="Caminho para o arquivo JSON de saída dos embeddings (ex: embeddings.json).")
+    parser.add_argument("--api-key", help="Chave da API do Google Gemini (opcional, pode ser fornecida via GOOGLE_API_KEY no .env)")
     args = parser.parse_args()
-    success = generate_embeddings_for_docs(args.input_json_path, args.output_json_path)
+    success = generate_embeddings_for_docs(args.input_json_path, args.output_json_path, args.api_key)
     if not success:
         print("A geração de embeddings falhou.")
         sys.exit(1) # Garante que sys está importado se for usar aqui

{docs_cli-0.1.0 → docs_cli-0.1.1}/pyproject.toml RENAMED Viewed

@@ -7,17 +7,16 @@ build-backend = "setuptools.build_meta"
 [project]
 name = "docs-cli"
-version = "0.1.0"
+version = "0.1.1"
 authors = [
   { name="Paulo Guilherme Pilott", email="seuemail@example.com" },
 ]
 description = "Um toolkit para processamento e avaliação de documentação."
 readme = "README.md"
 requires-python = ">=3.8" # Definido aqui
-license = { text = "MIT License" }
+license = "MIT"
 classifiers = [
     "Programming Language :: Python :: 3",
-    "License :: OSI Approved :: MIT License",
     "Operating System :: OS Independent",
     "Development Status :: 3 - Alpha",
     "Intended Audience :: Developers",
@@ -38,7 +37,7 @@ dependencies = [ # Equivalente a install_requires
 docs-cli = "docs_tc:main"
 docs-tc-merge-markdown = "merge_markdown:cli_main"
 docs-tc-extract-data = "extract_data_from_markdown:cli_main"
-docs-tc-generate-embeddings = "generate_embedings:cli_main" # Mantenha o nome do módulo com typo se o arquivo for assim
+docs-tc-generate-embeddings = "generate_embeddings:cli_main" # Corrigido o nome do módulo
 docs-tc-clean-csv = "limpa_csv:cli_main"
 docs-tc-evaluate-coverage = "evaluate_coverage:cli_main"
 docs-tc-generate-report-md = "generate_report:cli_main"

docs-cli 0.1.0__tar.gz → 0.1.1__tar.gz

docs-cli 0.1.0tar.gz → 0.1.1tar.gz