PyPI - pyield - Versions diffs - 0.49.4__tar.gz → 0.49.5__tar.gz - Mend

pyield 0.49.4tar.gz → 0.49.5tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (69) hide show

{pyield-0.49.4 → pyield-0.49.5}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.3
 Name: pyield
-Version: 0.49.4
+Version: 0.49.5
 Summary: A Python library for analysis of fixed income instruments in Brazil
 Keywords: fixed-income,brazil,finance,analysis,bonds
 Author: Carlos Carvalho
@@ -46,6 +46,7 @@ Description-Content-Type: text/markdown
 [![Made with Python](https://img.shields.io/badge/Python->=3.12-blue?logo=python&logoColor=white)](https://python.org "Go to Python homepage")
 [![License](https://img.shields.io/badge/License-MIT-blue)](https://github.com/crdcj/PYield/blob/main/LICENSE)
 [![Docs](https://img.shields.io/badge/docs-GitHub%20Pages-blue?logo=readthedocs&logoColor=white)](https://crdcj.github.io/PYield/)
+[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/crdcj/PYield/blob/main/examples/pyield_quickstart.ipynb)
 # PYield: Toolkit de Renda Fixa Brasileira

{pyield-0.49.4 → pyield-0.49.5}/README.md RENAMED Viewed

@@ -2,6 +2,7 @@
 [![Made with Python](https://img.shields.io/badge/Python->=3.12-blue?logo=python&logoColor=white)](https://python.org "Go to Python homepage")
 [![License](https://img.shields.io/badge/License-MIT-blue)](https://github.com/crdcj/PYield/blob/main/LICENSE)
 [![Docs](https://img.shields.io/badge/docs-GitHub%20Pages-blue?logo=readthedocs&logoColor=white)](https://crdcj.github.io/PYield/)
+[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/crdcj/PYield/blob/main/examples/pyield_quickstart.ipynb)
 # PYield: Toolkit de Renda Fixa Brasileira

{pyield-0.49.4 → pyield-0.49.5}/pyield/b3/di_over.py RENAMED Viewed

@@ -13,9 +13,12 @@ Notas de implementação:
 """
 import datetime as dt
-import ftplib
 import logging
+import time
+import urllib.error
+import urllib.request
+from pyield import du
 from pyield._internal.cache import ttl_cache
 from pyield._internal.converters import converter_datas
 from pyield._internal.types import DateLike, any_is_empty
@@ -28,36 +31,36 @@ DATA_INICIO = dt.date(2012, 8, 20)
 # 4 casas decimais na taxa = 2 casas decimais em percentual
 CASAS_DECIMAIS_DI_OVER = 4
+_URL_BASE = "ftp://ftp.cetip.com.br/MediaCDI/"
+_MAX_TENTATIVAS = 3
+_ESPERA = 2.0  # segundos entre tentativas (erro 421 é transitório)
 @ttl_cache()
 def _buscar_taxa(nome_arquivo: str) -> float:
     """Busca a taxa DI no FTP da CETIP para o arquivo informado."""
-    try:
-        with ftplib.FTP("ftp.cetip.com.br", timeout=10) as ftp:
-            ftp.login()
-            ftp.cwd("/MediaCDI")
-            linhas = []
-            try:
-                ftp.retrlines(f"RETR {nome_arquivo}", linhas.append)
-            except ftplib.error_perm as e:
-                # Código 550 = arquivo não encontrado (feriado/fim de semana)
-                if str(e).startswith("550"):
-                    return float("nan")
-                raise
-            if not linhas:
-                registro.error("Arquivo %s está vazio.", nome_arquivo)
-                return float("nan")
-            # Formato usual: "00001315" -> 13.15% -> 0.1315
-            taxa_bruta = linhas[0].strip()
-            taxa = int(taxa_bruta) / 10**CASAS_DECIMAIS_DI_OVER
+    for tentativa in range(1, _MAX_TENTATIVAS + 1):
+        try:
+            with urllib.request.urlopen(_URL_BASE + nome_arquivo, timeout=10) as r:
+                conteudo = r.read().decode().strip()
+            taxa = int(conteudo) / 10**CASAS_DECIMAIS_DI_OVER
             return round(taxa, CASAS_DECIMAIS_DI_OVER)
+        except urllib.error.URLError as e:
+            motivo = str(e.reason)
+            # Código 550 = arquivo não encontrado (feriado/fim de semana)
+            if "550" in motivo:
+                return float("nan")
+            # Código 421 = muitas conexões simultâneas; erro transitório
+            if "421" in motivo and tentativa < _MAX_TENTATIVAS:
+                registro.warning(
+                    "Erro FTP transitório (tentativa %s): %s", tentativa, e.reason
+                )
+                time.sleep(_ESPERA)
+                continue
+            raise ConnectionError(f"Falha ao buscar taxa DI via FTP: {e.reason}") from e
-    except ftplib.all_errors as e:
-        registro.error("Erro de conexão ou transferência FTP: %s", e)
-        raise ConnectionError(f"Falha ao buscar taxa DI via FTP: {e}") from e
+    msg = "Fluxo de retry inválido."
+    raise RuntimeError(msg)
 def di_over(data: DateLike) -> float:
@@ -85,7 +88,7 @@ def di_over(data: DateLike) -> float:
         return float("nan")
     data_ref = converter_datas(data)
-    if data_ref < DATA_INICIO:
+    if data_ref < DATA_INICIO or not du.eh_dia_util(data_ref):
         return float("nan")
     return _buscar_taxa(data_ref.strftime("%Y%m%d.txt"))

pyield-0.49.5/pyield/tpf/rmd/__init__.py ADDED Viewed

@@ -0,0 +1,81 @@
+"""Relatório Mensal da Dívida (RMD) do Tesouro Nacional."""
+import logging
+import polars as pl
+from . import _aba_1_3, _aba_2_1
+from ._download import baixar_planilha_rmd as _carregar_planilha_rmd
+registro = logging.getLogger(__name__)
+_IMPLEMENTACOES = {
+    "1.3": _aba_1_3.estruturar_dados,
+    "2.1": _aba_2_1.estruturar_dados,
+}
+def rmd(aba: str) -> pl.DataFrame:
+    """Retorna dados do Relatório Mensal da Dívida (RMD) do Tesouro Nacional.
+    Baixa e processa a planilha do RMD, extraindo dados da aba solicitada. A
+    publicação mais recente é descoberta automaticamente via parse HTML da página
+    oficial do Tesouro Transparente.
+    Args:
+        aba: Número da aba a processar. Abas implementadas: ``"1.3"`` e ``"2.1"``.
+    Returns:
+        DataFrame Polars no schema específico da aba solicitada. Em caso de erro,
+        retorna DataFrame vazio e registra o erro em log.
+    Output Columns:
+        Aba ``"1.3"``:
+            * periodo (Date): primeiro dia do mês de referência.
+            * grupo (String): seção principal — ``"Emissões"`` ou ``"Resgates"``.
+            * subgrupo (String): categoria dentro do grupo.
+            * titulo (String): tipo de título ou ``null`` para subgrupos sem
+                detalhamento por título.
+            * valor (Float64): valor em R$.
+        Aba ``"2.1"``:
+            * periodo (Date): primeiro dia do mês de referência.
+            * detentor (String): quem detém o estoque — ``"Público"`` ou
+                ``"Banco Central"``.
+            * tipo (String): classificação da dívida — ``"DPMFi"`` (interna) ou
+                ``"DPFe"`` (externa).
+            * categoria (String): subdivisão dentro do tipo, quando houver —
+                ``"Tesouro Nacional"``, ``"Banco Central"`` (emitente dentro da
+                DPMFi pública), ``"Mobiliária"``, ``"Contratual"``; ``null``
+                quando não há subdivisão (ex.: DPMFi em poder do Banco Central).
+            * titulo (String): título ou instrumento de dívida.
+            * valor (Float64): valor em R$. Somente registros folha; subtotais
+                devem ser calculados pelo usuário via agregação.
+    Raises:
+        ValueError: Se ``aba`` não estiver entre as abas implementadas.
+    Notes:
+        - A publicação mais recente é descoberta automaticamente via parse HTML
+          do Tesouro Transparente.
+        - A aba ``"1.3"`` traz emissões e resgates da DPMFi.
+        - A aba ``"2.1"`` traz a série histórica de estoque da DPF.
+    Examples:
+        >>> df = yd.tpf.rmd(aba="1.3")  # doctest: +SKIP
+        >>> df = yd.tpf.rmd(aba="2.1")  # doctest: +SKIP
+    """
+    if aba not in _IMPLEMENTACOES:
+        disponiveis = ", ".join(f'"{t}"' for t in sorted(_IMPLEMENTACOES))
+        raise ValueError(
+            f"Aba '{aba}' não disponível. Abas implementadas: {disponiveis}."
+        )
+    try:
+        conteudo_excel = _carregar_planilha_rmd()
+        df = _IMPLEMENTACOES[aba](conteudo_excel)
+    except Exception as e:
+        registro.exception(f"Erro ao coletar dados do RMD (aba {aba!r}): {e}")
+        return pl.DataFrame()
+    registro.info(f"Dados do RMD (aba {aba!r}) processados. Shape: {df.shape}.")
+    return df

pyield-0.49.5/pyield/tpf/rmd/_aba_1_3.py ADDED Viewed

@@ -0,0 +1,107 @@
+"""Parser da aba 1.3 do RMD."""
+import datetime as dt
+import polars as pl
+from ._common import parsear_periodo
+_LINHA_PERIODOS = 2
+_LINHA_INICIO_DADOS = _LINHA_PERIODOS + 1
+_TITULOS = ("LFT", "LTN", "NTN-B", "NTN-B1", "NTN-F", "NTN-C", "NTN-D", "Demais")
+_SECOES = {"I - EMISSÕES": "Emissões", "II - RESGATES": "Resgates"}
+_SUBGRUPOS = {"Vendas", "Trocas", "Vencimentos", "Compras"}
+_SUBGRUPO_TD = "Tesouro Direto"
+_SUBGRUPOS_DIRETOS = (
+    "Transferência de Carteira",
+    "Emissão Direta com Financeiro",
+    "Emissão Direta sem Financeiro",
+    "Pagamento de Dividendos",
+    "Cancelamentos",
+)
+_PREFIXOS_IGNORAR = ("IMPACTO", "OPERAÇÕES", "III -", "RESGATE")
+def _classificar_categorias(
+    categorias: list[str],
+) -> list[tuple[int, str, str, str | None]]:
+    """Percorre rótulos de categoria e classifica linhas de dados."""
+    grupo = ""
+    subgrupo = ""
+    eventos: list[tuple[int, str, str, str | None]] = []
+    for i, cat in enumerate(categorias):
+        c = cat.strip()
+        if c in _SECOES:
+            grupo, subgrupo = _SECOES[c], ""
+        elif any(c.startswith(p) for p in _PREFIXOS_IGNORAR):
+            grupo = ""
+        elif grupo:
+            if c in _SUBGRUPOS:
+                subgrupo = c
+            elif c.startswith(_SUBGRUPO_TD):
+                subgrupo = _SUBGRUPO_TD
+            elif c in _TITULOS:
+                eventos.append((i, grupo, subgrupo, c))
+            else:
+                prefixo = next((p for p in _SUBGRUPOS_DIRETOS if c.startswith(p)), None)
+                if prefixo:
+                    eventos.append((i, grupo, prefixo, None))
+    return eventos
+def _montar_registros(
+    eventos: list[tuple[int, str, str, str | None]],
+    datas_mensais: list[dt.date],
+    matriz: pl.DataFrame,
+) -> pl.DataFrame:
+    """Monta DataFrame longo com todos os registros de emissões e resgates."""
+    linhas = [
+        (data, grupo, subgrupo, titulo, valor)
+        for idx, grupo, subgrupo, titulo in eventos
+        for data, valor in zip(datas_mensais, matriz.row(idx))
+    ]
+    return pl.DataFrame(
+        linhas,
+        schema={
+            "periodo": pl.Date,
+            "grupo": pl.String,
+            "subgrupo": pl.String,
+            "titulo": pl.String,
+            "valor": pl.Float64,
+        },
+        orient="row",
+    )
+def estruturar_dados(conteudo_excel: bytes) -> pl.DataFrame:
+    """Lê a aba ``1.3`` do Excel e retorna DataFrame longo."""
+    df_bruto = pl.read_excel(
+        conteudo_excel,
+        sheet_name="1.3",
+        has_header=False,
+    )
+    periodos_raw = [str(p) for p in df_bruto.row(_LINHA_PERIODOS)[1:] if p is not None]
+    datas_e_indices = [
+        (i, data)
+        for i, periodo in enumerate(periodos_raw)
+        if (data := parsear_periodo(periodo)) is not None
+    ]
+    indices_mensais = [i for i, _ in datas_e_indices]
+    datas_mensais = [data for _, data in datas_e_indices]
+    df_dados = df_bruto[_LINHA_INICIO_DADOS:]
+    df_dados = df_dados.filter(df_dados[:, 0].is_not_null())
+    eventos = _classificar_categorias([str(c) for c in df_dados[:, 0].to_list()])
+    matriz = df_dados[:, 1:].cast(pl.Float64, strict=False)[:, indices_mensais]
+    return (
+        _montar_registros(eventos, datas_mensais, matriz)
+        .with_columns(valor=pl.col("valor").mul(1_000_000).round(2))
+        .filter(pl.col("valor").is_not_null() & (pl.col("valor") != 0))
+    )

pyield-0.49.5/pyield/tpf/rmd/_aba_2_1.py ADDED Viewed

@@ -0,0 +1,97 @@
+"""Parser da aba 2.1 do RMD."""
+from datetime import date
+import polars as pl
+from ._common import limpar_rotulo, parsear_periodo
+_LINHA_PERIODOS = 2
+_LINHA_INICIO_DADOS = _LINHA_PERIODOS + 1
+# Rótulos (uppercase) que definem transições de estado hierárquico.
+# Valor: (detentor, tipo, categoria, pode_emitir)
+# pode_emitir=False indica estado intermediário; linhas folha são ignoradas até
+# a próxima transição com pode_emitir=True.
+_TRANSICOES: dict[str, tuple[str | None, str | None, str | None, bool]] = {
+    "DPF EM PODER DO PÚBLICO": (None, None, None, False),
+    "DPMFI": ("Público", "DPMFi", None, False),
+    "TESOURO NACIONAL": ("Público", "DPMFi", "Tesouro Nacional", True),
+    "BANCO CENTRAL": ("Público", "DPMFi", "Banco Central", True),
+    "DPFE": ("Público", "DPFe", None, False),
+    "DÍVIDA MOBILIÁRIA": ("Público", "DPFe", "Mobiliária", True),
+    "DÍVIDA CONTRATUAL": ("Público", "DPFe", "Contratual", True),
+    "DPMFI EM PODER DO BANCO CENTRAL": ("Banco Central", "DPMFi", None, True),
+}
+def _obter_periodos_mensais(
+    df_bruto: pl.DataFrame,
+) -> list[tuple[int, date]]:
+    """Extrai os pares (índice_coluna, data) dos períodos mensais válidos."""
+    periodos_raw = [str(p) for p in df_bruto.row(_LINHA_PERIODOS)[1:] if p is not None]
+    return [
+        (i, data)
+        for i, periodo in enumerate(periodos_raw)
+        if (data := parsear_periodo(periodo)) is not None
+    ]
+def _montar_registros(df_bruto: pl.DataFrame) -> list[tuple[object, ...]]:
+    """Converte o bloco hierárquico da aba em registros longos (somente folhas)."""
+    periodos = _obter_periodos_mensais(df_bruto)
+    linhas = df_bruto[_LINHA_INICIO_DADOS:]
+    detentor: str | None = None
+    tipo: str | None = None
+    categoria: str | None = None
+    pode_emitir: bool = False
+    registros: list[tuple[object, ...]] = []
+    for linha in linhas.iter_rows():
+        bruto = linha[0]
+        if bruto is None:
+            continue
+        rotulo = limpar_rotulo(bruto)
+        if not rotulo:
+            continue
+        transicao = _TRANSICOES.get(rotulo.upper())
+        if transicao is not None:
+            detentor, tipo, categoria, pode_emitir = transicao
+            continue
+        if not pode_emitir:
+            continue
+        valores = linha[1:]
+        for indice, data in periodos:
+            registros.append((data, detentor, tipo, categoria, rotulo, valores[indice]))
+    return registros
+def estruturar_dados(conteudo_excel: bytes) -> pl.DataFrame:
+    """Lê a aba ``2.1`` do Excel e retorna DataFrame longo."""
+    df_bruto = pl.read_excel(
+        conteudo_excel,
+        sheet_name="2.1",
+        has_header=False,
+    )
+    return (
+        pl.DataFrame(
+            _montar_registros(df_bruto),
+            schema={
+                "periodo": pl.Date,
+                "detentor": pl.String,
+                "tipo": pl.String,
+                "categoria": pl.String,
+                "titulo": pl.String,
+                "valor": pl.Float64,
+            },
+            orient="row",
+        )
+        .with_columns(valor=pl.col("valor").mul(1_000_000_000).round(2))
+        .filter(pl.col("valor").is_not_null())
+    )

pyield-0.49.5/pyield/tpf/rmd/_common.py ADDED Viewed

@@ -0,0 +1,41 @@
+"""Helpers compartilhados pelos parsers do RMD."""
+import datetime as dt
+import re
+_MESES_PT = {
+    "Jan": 1,
+    "Fev": 2,
+    "Mar": 3,
+    "Abr": 4,
+    "Mai": 5,
+    "Jun": 6,
+    "Jul": 7,
+    "Ago": 8,
+    "Set": 9,
+    "Out": 10,
+    "Nov": 11,
+    "Dez": 12,
+}
+_PADRAO_ESPACOS = re.compile(r"\s+")
+def parsear_periodo(periodo: str) -> dt.date | None:
+    """Converte string de período para ``datetime.date`` ou ``None``."""
+    try:
+        mes_str, ano_str = periodo.split("/")
+    except ValueError:
+        return None
+    mes = _MESES_PT.get(mes_str)
+    if mes is None:
+        return None
+    return dt.date(2000 + int(ano_str), mes, 1)
+def limpar_rotulo(valor: object) -> str:
+    """Remove espaços e notas de rodapé do rótulo lido do Excel."""
+    texto = str(valor).replace("¹", "").replace("²", "").strip()
+    return _PADRAO_ESPACOS.sub(" ", texto)

pyield-0.49.5/pyield/tpf/rmd/_download.py ADDED Viewed

@@ -0,0 +1,55 @@
+"""Download e extração da planilha do RMD."""
+import io
+import zipfile as zf
+import requests
+from lxml import html
+from pyield._internal.cache import ttl_cache
+from pyield._internal.retry import retry_padrao
+URL_BASE = (
+    "https://www.tesourotransparente.gov.br/publicacoes/relatorio-mensal-da-divida-rmd"
+)
+_TIMEOUT_SEGUNDOS = 60
+_TTL_UM_DIA = 86_400  # segundos
+@retry_padrao
+def _buscar_conteudo(url: str) -> bytes:
+    """Busca o conteúdo de uma URL, seguindo redirects, com retry."""
+    resposta = requests.get(url, timeout=_TIMEOUT_SEGUNDOS)
+    resposta.raise_for_status()
+    return resposta.content
+def _buscar_url_anexo() -> str:
+    """Encontra a URL do arquivo ZIP do anexo mais recente do RMD."""
+    conteudo_pagina = _buscar_conteudo(URL_BASE)
+    arvore = html.fromstring(conteudo_pagina)
+    resultado = arvore.xpath("//a[contains(@href, 'publicacao-anexo')]/@href")
+    if not isinstance(resultado, list) or not resultado:
+        raise ValueError("Link do anexo ZIP não encontrado na página do RMD.")
+    return str(resultado[0])
+def _extrair_excel(conteudo_zip: bytes) -> bytes:
+    """Extrai o arquivo Excel do ZIP."""
+    with zf.ZipFile(io.BytesIO(conteudo_zip), "r") as arquivo_zip:
+        nomes_excel = [
+            nome
+            for nome in arquivo_zip.namelist()
+            if nome.lower().endswith((".xlsx", ".xls"))
+        ]
+        if not nomes_excel:
+            raise ValueError("Nenhum arquivo Excel encontrado no ZIP do RMD.")
+        return arquivo_zip.read(nomes_excel[0])
+@ttl_cache(ttl=_TTL_UM_DIA)
+def baixar_planilha_rmd() -> bytes:
+    """Baixa e extrai a planilha Excel do anexo mais recente do RMD."""
+    url_anexo = _buscar_url_anexo()
+    conteudo_zip = _buscar_conteudo(url_anexo)
+    return _extrair_excel(conteudo_zip)

{pyield-0.49.4 → pyield-0.49.5}/pyproject.toml RENAMED Viewed

@@ -19,7 +19,7 @@ dependencies = [
     "fastexcel>=0.19.0",
     "tzdata>=2024.1; platform_system == 'Windows'",
 ]
-version = "0.49.4"
+version = "0.49.5"
 [project.urls]
 Homepage = "https://github.com/crdcj/PYield"

pyield-0.49.4/pyield/tpf/rmd.py DELETED Viewed

@@ -1,262 +0,0 @@
-"""Módulo para buscar dados do Relatório Mensal da Dívida (RMD) do Tesouro Nacional."""
-import datetime
-import io
-import logging
-import zipfile as zf
-import polars as pl
-import requests
-from lxml import html
-from pyield._internal.retry import retry_padrao
-registro = logging.getLogger(__name__)
-URL_BASE = (
-    "https://www.tesourotransparente.gov.br/publicacoes/relatorio-mensal-da-divida-rmd"
-)
-_ABAS_DISPONIVEIS = ("1.3",)
-_TIMEOUT_SEGUNDOS = 60
-# Índices de linha (0-based) na planilha após leitura com fastexcel (sem cabeçalho)
-# O fastexcel compacta linhas totalmente vazias, resultando em 81 linhas ao invés das
-# 101 do Excel bruto. Os índices abaixo refletem o layout observado no arquivo atual.
-_LINHA_PERIODOS = 2  # Rótulos de período: "Nov/06", "Dez/06", ..., "2025"
-_LINHA_INICIO_DADOS = 3  # Primeira linha de dados: "I - EMISSÕES"
-_LINHA_FIM_DADOS = 67  # Exclusivo: notas de rodapé a partir desta linha
-# Tipos de título que viram colunas (em ordem)
-_TITULOS = ("LFT", "LTN", "NTN-B", "NTN-B1", "NTN-F", "NTN-C", "NTN-D", "Demais")
-# Mapeamento de rótulo de seção → nome limpo
-_SECOES = {"I - EMISSÕES": "Emissões", "II - RESGATES": "Resgates"}
-# Rótulos de subgrupo conhecidos e prefixo do Tesouro Direto
-_SUBGRUPOS = {"Vendas", "Trocas", "Vencimentos", "Compras"}
-_SUBGRUPO_TD = "Tesouro Direto"
-# Subgrupos sem detalhamento por tipo de título (valor direto na linha)
-# Tuple para ordem determinística; correspondência por prefixo (ignora notas de rodapé)
-_SUBGRUPOS_DIRETOS = (
-    "Transferência de Carteira",
-    "Emissão Direta com Financeiro",
-    "Emissão Direta sem Financeiro",
-    "Pagamento de Dividendos",
-    "Cancelamentos",
-)
-# Prefixos que sinalizam fim da área de interesse (seções a ignorar)
-_PREFIXOS_IGNORAR = ("IMPACTO", "OPERAÇÕES", "III -", "RESGATE")
-_MESES_PT = {
-    "Jan": 1,
-    "Fev": 2,
-    "Mar": 3,
-    "Abr": 4,
-    "Mai": 5,
-    "Jun": 6,
-    "Jul": 7,
-    "Ago": 8,
-    "Set": 9,
-    "Out": 10,
-    "Nov": 11,
-    "Dez": 12,
-}
-def _parsear_periodo(periodo: str) -> datetime.date | None:
-    """Converte string de período para datetime.date ou None para totais anuais."""
-    try:
-        mes_str, ano_str = periodo.split("/")
-    except ValueError:
-        return None  # ex: "2025" (total anual) → descartado
-    mes = _MESES_PT.get(mes_str)
-    if mes is None:
-        return None
-    ano = 2000 + int(ano_str)
-    return datetime.date(ano, mes, 1)
-@retry_padrao
-def _buscar_conteudo(url: str) -> bytes:
-    """Busca o conteúdo de uma URL, seguindo redirects, com retry."""
-    resposta = requests.get(url, timeout=_TIMEOUT_SEGUNDOS)
-    resposta.raise_for_status()
-    return resposta.content
-def _buscar_url_anexo() -> str:
-    """Encontra a URL do arquivo ZIP do anexo mais recente do RMD.
-    A URL base redireciona automaticamente para a página do mês atual.
-    O lxml localiza o link do anexo ZIP nessa página.
-    """
-    conteudo_pagina = _buscar_conteudo(URL_BASE)
-    arvore = html.fromstring(conteudo_pagina)
-    resultado = arvore.xpath("//a[contains(@href, 'publicacao-anexo')]/@href")
-    if not isinstance(resultado, list) or not resultado:
-        raise ValueError("Link do anexo ZIP não encontrado na página do RMD.")
-    return str(resultado[0])
-def _extrair_excel(conteudo_zip: bytes) -> bytes:
-    """Extrai o arquivo Excel do ZIP."""
-    with zf.ZipFile(io.BytesIO(conteudo_zip), "r") as arquivo_zip:
-        nomes_excel = [
-            n for n in arquivo_zip.namelist() if n.lower().endswith((".xlsx", ".xls"))
-        ]
-        if not nomes_excel:
-            raise ValueError("Nenhum arquivo Excel encontrado no ZIP do RMD.")
-        return arquivo_zip.read(nomes_excel[0])
-def _classificar_categorias(
-    categorias: list[str],
-) -> list[tuple[int, str, str, str | None]]:
-    """Percorre rótulos de categoria e classifica linhas de dados.
-    Máquina de estados que rastreia grupo (Emissões/Resgates) e subgrupo.
-    Retorna lista de eventos (idx, grupo, subgrupo, titulo). Para subgrupos
-    sem detalhamento por título, titulo é None.
-    Args:
-        categorias: Lista de rótulos de categoria lidos da coluna 0 do Excel.
-    Returns:
-        Lista de eventos (idx, grupo, subgrupo, titulo) detectados.
-    """
-    grupo = ""
-    subgrupo = ""
-    eventos: list[tuple[int, str, str, str | None]] = []
-    for i, cat in enumerate(categorias):
-        c = cat.strip()
-        if c in _SECOES:
-            grupo, subgrupo = _SECOES[c], ""
-        elif any(c.startswith(p) for p in _PREFIXOS_IGNORAR):
-            grupo = ""
-        elif grupo:
-            if c in _SUBGRUPOS:
-                subgrupo = c
-            elif c.startswith(_SUBGRUPO_TD):
-                subgrupo = _SUBGRUPO_TD
-            elif c in _TITULOS:
-                eventos.append((i, grupo, subgrupo, c))
-            else:
-                prefixo = next((p for p in _SUBGRUPOS_DIRETOS if c.startswith(p)), None)
-                if prefixo:
-                    eventos.append((i, grupo, prefixo, None))
-    return eventos
-def _montar_registros(
-    eventos: list[tuple[int, str, str, str | None]],
-    datas_mensais: list[datetime.date],
-    matriz: pl.DataFrame,
-) -> pl.DataFrame:
-    """Monta DataFrame longo com todos os registros de emissões e resgates."""
-    linhas = [
-        (data, grupo, subgrupo, titulo, val)
-        for idx, grupo, subgrupo, titulo in eventos
-        for data, val in zip(datas_mensais, matriz.row(idx))
-    ]
-    return pl.DataFrame(
-        linhas,
-        schema={
-            "periodo": pl.Date,
-            "grupo": pl.String,
-            "subgrupo": pl.String,
-            "titulo": pl.String,
-            "valor": pl.Float64,
-        },
-        orient="row",
-    )
-def _estruturar_dados(conteudo_excel: bytes) -> pl.DataFrame:
-    """Lê a aba '1.3' do Excel e retorna DataFrame longo com emissões e resgates."""
-    df_bruto = pl.read_excel(
-        conteudo_excel,
-        sheet_name="1.3",
-        has_header=False,
-    )
-    periodos_raw = [str(p) for p in df_bruto.row(_LINHA_PERIODOS)[1:] if p is not None]
-    datas_e_indices = [
-        (i, d)
-        for i, periodo in enumerate(periodos_raw)
-        if (d := _parsear_periodo(periodo)) is not None
-    ]
-    indices_mensais = [i for i, _ in datas_e_indices]
-    datas_mensais = [d for _, d in datas_e_indices]
-    df_dados = df_bruto[_LINHA_INICIO_DADOS:_LINHA_FIM_DADOS]
-    df_dados = df_dados.filter(df_dados[:, 0].is_not_null())
-    eventos = _classificar_categorias([str(c) for c in df_dados[:, 0].to_list()])
-    matriz = df_dados[:, 1:].cast(pl.Float64, strict=False)[:, indices_mensais]
-    return (
-        _montar_registros(eventos, datas_mensais, matriz)
-        .with_columns(valor=pl.col("valor").mul(1_000_000).round(2))
-        .filter(pl.col("valor").is_not_null() & (pl.col("valor") != 0))
-    )
-def rmd(aba: str) -> pl.DataFrame:
-    """Retorna dados do Relatório Mensal da Dívida (RMD) do Tesouro Nacional.
-    Baixa e processa a planilha do RMD, extraindo dados de emissões e resgates
-    de Títulos Públicos Federais da Dívida Pública Mobiliária Federal interna
-    (DPMFi). A publicação mais recente é descoberta automaticamente via parse
-    HTML da página oficial.
-    Args:
-        aba: Número da aba a processar (ex: ``"1.3"``). Abas implementadas: ``"1.3"``.
-    Returns:
-        DataFrame longo com dados de emissões e resgates por período, seção,
-        subgrupo e tipo de título. Registros com valor nulo ou zero são excluídos.
-        Em caso de erro, retorna DataFrame vazio e registra log da excessão.
-    Output Columns:
-        * periodo (Date): primeiro dia do mês de referência.
-        * grupo (String): seção principal — ``"Emissões"`` ou ``"Resgates"``.
-        * subgrupo (String): categoria dentro do grupo.
-        * titulo (String): tipo de título (``"LFT"``, ``"LTN"``, ``"NTN-B"``,
-            ``"NTN-B1"``, ``"NTN-F"``, ``"NTN-C"``, ``"NTN-D"``, ``"Demais"``,
-            ou ``null`` para subgrupos sem detalhamento por título).
-        * valor (Float64): valor em R$.
-    Raises:
-        ValueError: Se ``aba`` não estiver entre as abas implementadas.
-    Notes:
-        - A função sempre busca a publicação mais recente disponível.
-        - Totais anuais são excluídos; podem ser recalculados via group_by.
-        - Totais de referência para 2025:
-            Emissões = R$ 1.840.946.621.648,18
-            Resgates = R$ 1.395.109.062.272,45.
-    Examples:
-        >>> df = yd.tpf.rmd(aba="1.3")  # doctest: +SKIP
-    """
-    if aba not in _ABAS_DISPONIVEIS:
-        disponiveis = ", ".join(f'"{t}"' for t in sorted(_ABAS_DISPONIVEIS))
-        raise ValueError(
-            f"Aba '{aba}' não disponível. Abas implementadas: {disponiveis}."
-        )
-    try:
-        url_anexo = _buscar_url_anexo()
-        registro.debug(f"URL do anexo RMD: {url_anexo}")
-        conteudo_zip = _buscar_conteudo(url_anexo)
-        conteudo_excel = _extrair_excel(conteudo_zip)
-        df = _estruturar_dados(conteudo_excel)
-    except Exception as e:
-        registro.exception(f"Erro ao coletar dados do RMD (aba {aba!r}): {e}")
-        return pl.DataFrame()
-    registro.info(f"Dados do RMD (aba {aba!r}) processados. Shape: {df.shape}.")
-    return df