nia-etl-utils 0.1.0__py3-none-any.whl → 0.2.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
nia_etl_utils/__init__.py CHANGED
@@ -2,41 +2,72 @@
2
2
 
3
3
  Este pacote fornece funções reutilizáveis para:
4
4
  - Configuração de ambiente (env_config)
5
+ - Configurações de conexão e email (config)
6
+ - Exceções customizadas (exceptions)
7
+ - Resultados estruturados (results)
5
8
  - Envio de emails via SMTP (email_smtp)
6
9
  - Conexões com bancos de dados Oracle e PostgreSQL (database)
7
10
  - Configuração de logging padronizado (logger_config)
8
11
  - Processamento e exportação de CSV (processa_csv)
12
+ - Processamento paralelo de CSV grandes (processa_csv_paralelo)
9
13
  - Manipulação de arquivos e diretórios (limpeza_pastas)
10
14
 
11
15
  Exemplo de uso:
12
- from nia_etl_utils import obter_variavel_env, configurar_logger_padrao_nia
13
- from nia_etl_utils import conectar_postgresql_nia, exportar_para_csv
16
+
17
+ from nia_etl_utils import (
18
+ configurar_logger_padrao_nia,
19
+ conectar_postgresql_nia,
20
+ exportar_para_csv,
21
+ PostgresConfig,
22
+ )
23
+ from nia_etl_utils.exceptions import ConexaoError, ExtracaoVaziaError
14
24
 
15
25
  # Configuração
16
26
  configurar_logger_padrao_nia("meu_pipeline")
17
- db_host = obter_variavel_env('DB_POSTGRESQL_HOST')
18
27
 
19
- # Conexão e processamento
20
- cur, conn = conectar_postgresql_nia()
21
- # ... processar dados ...
22
- exportar_para_csv(df, "resultado", "2025_01_19", "/dados")
28
+ # Conexão com context manager
29
+ try:
30
+ with conectar_postgresql_nia() as conn:
31
+ conn.cursor.execute("SELECT * FROM tabela")
32
+ dados = conn.cursor.fetchall()
33
+ except ConexaoError as e:
34
+ logger.error(f"Falha na conexão: {e}")
35
+ sys.exit(1) # decisão do CHAMADOR
36
+
37
+ # Ou com configuração explícita (para testes)
38
+ config = PostgresConfig(
39
+ host="localhost",
40
+ port="5432",
41
+ database="teste",
42
+ user="user",
43
+ password="pass"
44
+ )
45
+ with conectar_postgresql(config) as conn:
46
+ # ...
23
47
  """
24
48
 
25
- __version__ = "0.1.0"
49
+ __version__ = "0.2.0"
26
50
  __author__ = "Nícolas Galdino Esmael"
27
51
 
28
- # ============================================================================
29
- # IMPORTS PRINCIPAIS - Funções mais usadas exportadas diretamente
30
- # ============================================================================
31
-
32
- # Configuração de ambiente
33
- from .env_config import obter_variavel_env
34
-
35
- # Email
36
- from .email_smtp import enviar_email_smtp, obter_destinatarios_padrao
52
+ # =============================================================================
53
+ # EXCEÇÕES - Importar primeiro para uso em type hints
54
+ # =============================================================================
55
+
56
+ # =============================================================================
57
+ # CONFIGURAÇÕES (Dataclasses)
58
+ # =============================================================================
59
+ from .config import (
60
+ LogConfig,
61
+ OracleConfig,
62
+ PostgresConfig,
63
+ SmtpConfig,
64
+ )
37
65
 
38
- # Database - PostgreSQL
66
+ # Database - Funções core
67
+ # Database - Wrappers de conveniência
39
68
  from .database import (
69
+ conectar_oracle,
70
+ conectar_oracle_ouvidorias,
40
71
  conectar_postgresql,
41
72
  conectar_postgresql_nia,
42
73
  conectar_postgresql_opengeo,
@@ -45,11 +76,55 @@ from .database import (
45
76
  obter_engine_postgresql_opengeo,
46
77
  )
47
78
 
48
- # Database - Oracle
49
- from .database import (
50
- conectar_oracle,
51
- conectar_oracle_ouvidorias,
52
- fechar_conexao,
79
+ # Email
80
+ from .email_smtp import (
81
+ enviar_email,
82
+ enviar_email_smtp,
83
+ obter_destinatarios_padrao,
84
+ )
85
+
86
+ # =============================================================================
87
+ # FUNÇÕES UTILITÁRIAS
88
+ # =============================================================================
89
+ # Configuração de ambiente
90
+ from .env_config import (
91
+ obter_variavel_env,
92
+ obter_variavel_env_bool,
93
+ obter_variavel_env_int,
94
+ obter_variavel_env_lista,
95
+ )
96
+ from .exceptions import (
97
+ # Arquivos
98
+ ArquivoError,
99
+ ConexaoError,
100
+ # Configuração
101
+ ConfiguracaoError,
102
+ # Database
103
+ DatabaseError,
104
+ DestinatarioError,
105
+ DiretorioError,
106
+ # Email
107
+ EmailError,
108
+ EscritaArquivoError,
109
+ # Extração
110
+ ExtracaoError,
111
+ ExtracaoVaziaError,
112
+ LeituraArquivoError,
113
+ # Base
114
+ NiaEtlError,
115
+ ProcessamentoError,
116
+ SmtpError,
117
+ # Validação
118
+ ValidacaoError,
119
+ VariavelAmbienteError,
120
+ )
121
+
122
+ # Manipulação de arquivos
123
+ from .limpeza_pastas import (
124
+ criar_pasta_se_nao_existir,
125
+ limpar_pasta,
126
+ listar_arquivos,
127
+ remover_pasta_recursivamente,
53
128
  )
54
129
 
55
130
  # Logging
@@ -61,66 +136,101 @@ from .logger_config import (
61
136
 
62
137
  # Processamento CSV
63
138
  from .processa_csv import (
139
+ exportar_multiplos_csv,
64
140
  exportar_para_csv,
65
141
  extrair_e_exportar_csv,
66
- exportar_multiplos_csv,
67
142
  )
68
143
 
69
144
  # Processamento CSV Paralelo
70
145
  from .processa_csv_paralelo import (
71
- processar_csv_paralelo,
72
146
  calcular_chunksize,
147
+ processar_csv_paralelo,
73
148
  )
74
149
 
75
- # Manipulação de arquivos
76
- from .limpeza_pastas import (
77
- limpar_pasta,
78
- remover_pasta_recursivamente,
79
- criar_pasta_se_nao_existir,
150
+ # =============================================================================
151
+ # RESULTADOS (Dataclasses)
152
+ # =============================================================================
153
+ from .results import (
154
+ Conexao,
155
+ ResultadoEmail,
156
+ ResultadoExtracao,
157
+ ResultadoLote,
80
158
  )
81
159
 
160
+ # =============================================================================
161
+ # __all__ - Exportações públicas
162
+ # =============================================================================
82
163
 
83
164
  __all__ = [
84
165
  # Metadata
85
166
  "__version__",
86
167
  "__author__",
87
-
168
+ # Exceções - Base
169
+ "NiaEtlError",
170
+ # Exceções - Configuração
171
+ "ConfiguracaoError",
172
+ "VariavelAmbienteError",
173
+ # Exceções - Database
174
+ "DatabaseError",
175
+ "ConexaoError",
176
+ # Exceções - Arquivos
177
+ "ArquivoError",
178
+ "DiretorioError",
179
+ "EscritaArquivoError",
180
+ "LeituraArquivoError",
181
+ # Exceções - Extração
182
+ "ExtracaoError",
183
+ "ExtracaoVaziaError",
184
+ "ProcessamentoError",
185
+ # Exceções - Email
186
+ "EmailError",
187
+ "DestinatarioError",
188
+ "SmtpError",
189
+ # Exceções - Validação
190
+ "ValidacaoError",
191
+ # Configurações
192
+ "PostgresConfig",
193
+ "OracleConfig",
194
+ "SmtpConfig",
195
+ "LogConfig",
196
+ # Resultados
197
+ "Conexao",
198
+ "ResultadoExtracao",
199
+ "ResultadoLote",
200
+ "ResultadoEmail",
88
201
  # Env config
89
202
  "obter_variavel_env",
90
-
203
+ "obter_variavel_env_int",
204
+ "obter_variavel_env_bool",
205
+ "obter_variavel_env_lista",
91
206
  # Email
207
+ "enviar_email",
92
208
  "enviar_email_smtp",
93
209
  "obter_destinatarios_padrao",
94
-
95
- # Database - PostgreSQL
210
+ # Database - Core
96
211
  "conectar_postgresql",
212
+ "conectar_oracle",
213
+ "obter_engine_postgresql",
214
+ # Database - Wrappers
97
215
  "conectar_postgresql_nia",
98
216
  "conectar_postgresql_opengeo",
99
- "obter_engine_postgresql",
217
+ "conectar_oracle_ouvidorias",
100
218
  "obter_engine_postgresql_nia",
101
219
  "obter_engine_postgresql_opengeo",
102
-
103
- # Database - Oracle
104
- "conectar_oracle",
105
- "conectar_oracle_ouvidorias",
106
- "fechar_conexao",
107
-
108
220
  # Logging
109
221
  "configurar_logger",
110
222
  "configurar_logger_padrao_nia",
111
223
  "remover_handlers_existentes",
112
-
113
224
  # CSV
114
225
  "exportar_para_csv",
115
226
  "extrair_e_exportar_csv",
116
227
  "exportar_multiplos_csv",
117
-
118
228
  # CSV Paralelo
119
229
  "processar_csv_paralelo",
120
230
  "calcular_chunksize",
121
-
122
231
  # Arquivos
123
232
  "limpar_pasta",
124
233
  "remover_pasta_recursivamente",
125
234
  "criar_pasta_se_nao_existir",
235
+ "listar_arquivos",
126
236
  ]
@@ -0,0 +1,391 @@
1
+ """Dataclasses de configuração para o pacote nia_etl_utils.
2
+
3
+ Este módulo define estruturas de dados imutáveis para configuração
4
+ de conexões, email e outras operações do pacote.
5
+
6
+ As configurações podem ser criadas de três formas:
7
+ 1. Instanciação direta com valores explícitos
8
+ 2. Factory method `from_env()` para carregar de variáveis de ambiente
9
+ 3. Wrappers de conveniência para casos comuns
10
+
11
+ Examples:
12
+ Configuração explícita (recomendado para testes):
13
+
14
+ >>> config = PostgresConfig(
15
+ ... host="localhost",
16
+ ... port="5432",
17
+ ... database="teste",
18
+ ... user="user",
19
+ ... password="pass"
20
+ ... )
21
+
22
+ Configuração via ambiente (recomendado para produção):
23
+
24
+ >>> config = PostgresConfig.from_env() # usa variáveis padrão
25
+ >>> config = PostgresConfig.from_env("_OPENGEO") # usa sufixo
26
+
27
+ Uso com funções de conexão:
28
+
29
+ >>> from nia_etl_utils import conectar_postgresql
30
+ >>> with conectar_postgresql(config) as conn:
31
+ ... conn.cursor.execute("SELECT 1")
32
+ """
33
+
34
+ from dataclasses import dataclass
35
+ from typing import TYPE_CHECKING
36
+
37
+ import cx_Oracle
38
+
39
+ from .exceptions import ConfiguracaoError
40
+
41
+ if TYPE_CHECKING:
42
+ pass
43
+
44
+
45
+ @dataclass(frozen=True)
46
+ class PostgresConfig:
47
+ """Configuração de conexão PostgreSQL.
48
+
49
+ Dataclass imutável contendo todos os parâmetros necessários
50
+ para estabelecer conexão com um banco PostgreSQL.
51
+
52
+ Attributes:
53
+ host: Endereço do servidor PostgreSQL.
54
+ port: Porta de conexão (geralmente 5432).
55
+ database: Nome do banco de dados.
56
+ user: Usuário de autenticação.
57
+ password: Senha de autenticação.
58
+
59
+ Examples:
60
+ Criação direta:
61
+
62
+ >>> config = PostgresConfig(
63
+ ... host="localhost",
64
+ ... port="5432",
65
+ ... database="meu_banco",
66
+ ... user="usuario",
67
+ ... password="senha"
68
+ ... )
69
+
70
+ A partir de variáveis de ambiente:
71
+
72
+ >>> config = PostgresConfig.from_env()
73
+ >>> config = PostgresConfig.from_env("_OPENGEO")
74
+
75
+ Acessando connection string:
76
+
77
+ >>> config.connection_string
78
+ 'postgresql+psycopg2://usuario:senha@localhost:5432/meu_banco'
79
+ """
80
+
81
+ host: str
82
+ port: str
83
+ database: str
84
+ user: str
85
+ password: str
86
+
87
+ @classmethod
88
+ def from_env(cls, sufixo: str = "") -> "PostgresConfig":
89
+ """Cria configuração a partir de variáveis de ambiente.
90
+
91
+ Busca as seguintes variáveis (com sufixo opcional):
92
+ - DB_POSTGRESQL_HOST{sufixo}
93
+ - DB_POSTGRESQL_PORT{sufixo}
94
+ - DB_POSTGRESQL_DATABASE{sufixo}
95
+ - DB_POSTGRESQL_USER{sufixo}
96
+ - DB_POSTGRESQL_PASSWORD{sufixo}
97
+
98
+ Args:
99
+ sufixo: Sufixo das variáveis de ambiente. Use "" para
100
+ variáveis padrão ou "_OPENGEO", "_PROD", etc para
101
+ ambientes específicos.
102
+
103
+ Returns:
104
+ PostgresConfig com valores das variáveis de ambiente.
105
+
106
+ Raises:
107
+ ConfiguracaoError: Se alguma variável obrigatória não existir.
108
+
109
+ Examples:
110
+ >>> config = PostgresConfig.from_env()
111
+ >>> config = PostgresConfig.from_env("_OPENGEO")
112
+ """
113
+ from .env_config import obter_variavel_env
114
+
115
+ try:
116
+ return cls(
117
+ host=obter_variavel_env(f"DB_POSTGRESQL_HOST{sufixo}"),
118
+ port=obter_variavel_env(f"DB_POSTGRESQL_PORT{sufixo}"),
119
+ database=obter_variavel_env(f"DB_POSTGRESQL_DATABASE{sufixo}"),
120
+ user=obter_variavel_env(f"DB_POSTGRESQL_USER{sufixo}"),
121
+ password=obter_variavel_env(f"DB_POSTGRESQL_PASSWORD{sufixo}"),
122
+ )
123
+ except Exception as e:
124
+ raise ConfiguracaoError(
125
+ f"Variáveis de ambiente PostgreSQL incompletas (sufixo='{sufixo}')",
126
+ details={"sufixo": sufixo, "erro_original": str(e)}
127
+ ) from e
128
+
129
+ @property
130
+ def connection_string(self) -> str:
131
+ """String de conexão SQLAlchemy.
132
+
133
+ Returns:
134
+ String formatada para uso com SQLAlchemy create_engine().
135
+
136
+ Examples:
137
+ >>> config = PostgresConfig(
138
+ ... host="localhost",
139
+ ... port="5432",
140
+ ... database="teste",
141
+ ... user="user",
142
+ ... password="pass"
143
+ ... )
144
+ >>> config.connection_string
145
+ 'postgresql+psycopg2://user:pass@localhost:5432/teste'
146
+ """
147
+ return (
148
+ f"postgresql+psycopg2://{self.user}:{self.password}"
149
+ f"@{self.host}:{self.port}/{self.database}"
150
+ )
151
+
152
+ def __repr__(self) -> str:
153
+ """Representação segura (sem expor senha)."""
154
+ return (
155
+ f"PostgresConfig(host='{self.host}', port='{self.port}', "
156
+ f"database='{self.database}', user='{self.user}', password='***')"
157
+ )
158
+
159
+
160
+ @dataclass(frozen=True)
161
+ class OracleConfig:
162
+ """Configuração de conexão Oracle.
163
+
164
+ Dataclass imutável contendo todos os parâmetros necessários
165
+ para estabelecer conexão com um banco Oracle.
166
+
167
+ Attributes:
168
+ host: Endereço do servidor Oracle.
169
+ port: Porta de conexão (geralmente 1521).
170
+ service_name: Nome do serviço Oracle.
171
+ user: Usuário de autenticação.
172
+ password: Senha de autenticação.
173
+
174
+ Examples:
175
+ Criação direta:
176
+
177
+ >>> config = OracleConfig(
178
+ ... host="oracle.empresa.com",
179
+ ... port="1521",
180
+ ... service_name="PROD",
181
+ ... user="usuario",
182
+ ... password="senha"
183
+ ... )
184
+
185
+ A partir de variáveis de ambiente:
186
+
187
+ >>> config = OracleConfig.from_env()
188
+ """
189
+
190
+ host: str
191
+ port: str
192
+ service_name: str
193
+ user: str
194
+ password: str
195
+
196
+ @classmethod
197
+ def from_env(cls, sufixo: str = "") -> "OracleConfig":
198
+ """Cria configuração a partir de variáveis de ambiente.
199
+
200
+ Busca as seguintes variáveis (com sufixo opcional):
201
+ - DB_ORACLE_HOST{sufixo}
202
+ - DB_ORACLE_PORT{sufixo}
203
+ - DB_ORACLE_SERVICE_NAME{sufixo}
204
+ - DB_ORACLE_USER{sufixo}
205
+ - DB_ORACLE_PASSWORD{sufixo}
206
+
207
+ Args:
208
+ sufixo: Sufixo das variáveis de ambiente.
209
+
210
+ Returns:
211
+ OracleConfig com valores das variáveis de ambiente.
212
+
213
+ Raises:
214
+ ConfiguracaoError: Se alguma variável obrigatória não existir.
215
+
216
+ Examples:
217
+ >>> config = OracleConfig.from_env()
218
+ >>> config = OracleConfig.from_env("_PROD")
219
+ """
220
+ from .env_config import obter_variavel_env
221
+
222
+ try:
223
+ return cls(
224
+ host=obter_variavel_env(f"DB_ORACLE_HOST{sufixo}"),
225
+ port=obter_variavel_env(f"DB_ORACLE_PORT{sufixo}"),
226
+ service_name=obter_variavel_env(f"DB_ORACLE_SERVICE_NAME{sufixo}"),
227
+ user=obter_variavel_env(f"DB_ORACLE_USER{sufixo}"),
228
+ password=obter_variavel_env(f"DB_ORACLE_PASSWORD{sufixo}"),
229
+ )
230
+ except Exception as e:
231
+ raise ConfiguracaoError(
232
+ f"Variáveis de ambiente Oracle incompletas (sufixo='{sufixo}')",
233
+ details={"sufixo": sufixo, "erro_original": str(e)}
234
+ ) from e
235
+
236
+ @property
237
+ def dsn(self) -> str:
238
+ """DSN para conexão cx_Oracle.
239
+
240
+ Returns:
241
+ DSN formatado para uso com cx_Oracle.connect().
242
+
243
+ Examples:
244
+ >>> config = OracleConfig(
245
+ ... host="oracle.empresa.com",
246
+ ... port="1521",
247
+ ... service_name="PROD",
248
+ ... user="user",
249
+ ... password="pass"
250
+ ... )
251
+ >>> # dsn é gerado internamente por cx_Oracle.makedsn()
252
+ """
253
+ return cx_Oracle.makedsn(self.host, self.port, service_name=self.service_name)
254
+
255
+ def __repr__(self) -> str:
256
+ """Representação segura (sem expor senha)."""
257
+ return (
258
+ f"OracleConfig(host='{self.host}', port='{self.port}', "
259
+ f"service_name='{self.service_name}', user='{self.user}', password='***')"
260
+ )
261
+
262
+
263
+ @dataclass(frozen=True)
264
+ class SmtpConfig:
265
+ """Configuração de servidor SMTP para envio de emails.
266
+
267
+ Attributes:
268
+ servidor: Endereço do servidor SMTP.
269
+ porta: Porta de conexão (geralmente 25, 465 ou 587).
270
+ remetente: Endereço de email do remetente.
271
+ destinatarios_padrao: Lista de destinatários padrão.
272
+ cc: Endereço para cópia (opcional).
273
+
274
+ Examples:
275
+ Criação direta:
276
+
277
+ >>> config = SmtpConfig(
278
+ ... servidor="smtp.empresa.com",
279
+ ... porta=587,
280
+ ... remetente="sistema@empresa.com",
281
+ ... destinatarios_padrao=["admin@empresa.com"]
282
+ ... )
283
+
284
+ A partir de variáveis de ambiente:
285
+
286
+ >>> config = SmtpConfig.from_env()
287
+ """
288
+
289
+ servidor: str
290
+ porta: int
291
+ remetente: str
292
+ destinatarios_padrao: list[str]
293
+ cc: str | None = None
294
+
295
+ @classmethod
296
+ def from_env(cls) -> "SmtpConfig":
297
+ """Cria configuração a partir de variáveis de ambiente.
298
+
299
+ Busca as seguintes variáveis:
300
+ - MAIL_SMTP_SERVER
301
+ - MAIL_SMTP_PORT
302
+ - MAIL_SENDER
303
+ - EMAIL_DESTINATARIOS (separados por vírgula)
304
+ - MAIL_CC (opcional)
305
+
306
+ Returns:
307
+ SmtpConfig com valores das variáveis de ambiente.
308
+
309
+ Raises:
310
+ ConfiguracaoError: Se alguma variável obrigatória não existir.
311
+
312
+ Examples:
313
+ >>> config = SmtpConfig.from_env()
314
+ """
315
+ from .env_config import obter_variavel_env
316
+
317
+ try:
318
+ destinatarios_str = obter_variavel_env("EMAIL_DESTINATARIOS").strip()
319
+ destinatarios = [
320
+ email.strip()
321
+ for email in destinatarios_str.split(',')
322
+ if email.strip()
323
+ ]
324
+
325
+ import os
326
+ cc = os.getenv("MAIL_CC")
327
+
328
+ return cls(
329
+ servidor=obter_variavel_env("MAIL_SMTP_SERVER"),
330
+ porta=int(obter_variavel_env("MAIL_SMTP_PORT")),
331
+ remetente=obter_variavel_env("MAIL_SENDER"),
332
+ destinatarios_padrao=destinatarios,
333
+ cc=cc,
334
+ )
335
+ except Exception as e:
336
+ raise ConfiguracaoError(
337
+ "Variáveis de ambiente SMTP incompletas",
338
+ details={"erro_original": str(e)}
339
+ ) from e
340
+
341
+
342
+ @dataclass(frozen=True)
343
+ class LogConfig:
344
+ """Configuração de logging.
345
+
346
+ Attributes:
347
+ prefixo: Nome do módulo/pipeline para identificação.
348
+ pasta_logs: Diretório onde os logs serão salvos.
349
+ rotation: Critério de rotação (tamanho ou tempo).
350
+ retention: Tempo de retenção dos logs.
351
+ level: Nível mínimo de log.
352
+
353
+ Examples:
354
+ >>> config = LogConfig(
355
+ ... prefixo="etl_ouvidorias",
356
+ ... pasta_logs="/var/log/nia",
357
+ ... rotation="50 MB",
358
+ ... retention="30 days",
359
+ ... level="INFO"
360
+ ... )
361
+ """
362
+
363
+ prefixo: str
364
+ pasta_logs: str = "logs"
365
+ rotation: str = "10 MB"
366
+ retention: str = "7 days"
367
+ level: str = "DEBUG"
368
+
369
+ @classmethod
370
+ def padrao_nia(cls, prefixo: str) -> "LogConfig":
371
+ """Cria configuração com padrões do NIA.
372
+
373
+ Args:
374
+ prefixo: Nome do pipeline.
375
+
376
+ Returns:
377
+ LogConfig com configurações padrão NIA:
378
+ - Rotação: 50 MB
379
+ - Retenção: 30 dias
380
+ - Nível: INFO
381
+
382
+ Examples:
383
+ >>> config = LogConfig.padrao_nia("ouvidorias_etl")
384
+ """
385
+ return cls(
386
+ prefixo=prefixo,
387
+ pasta_logs="logs",
388
+ rotation="50 MB",
389
+ retention="30 days",
390
+ level="INFO"
391
+ )