PyPI - leads-cli - Versions diffs - 0.1.0__py3-none-any.whl - Mend

leads-cli 0.1.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (72) hide show

company_discovery/__init__.py +4 -0
company_discovery/adapters/__init__.py +5 -0
company_discovery/adapters/apollo.py +189 -0
company_discovery/adapters/exa.py +112 -0
company_discovery/adapters/llm.py +118 -0
company_discovery/adapters/protocols.py +58 -0
company_discovery/adapters/website.py +154 -0
company_discovery/bundled_skills/__init__.py +1 -0
company_discovery/bundled_skills/company-discovery-operator/SKILL.md +72 -0
company_discovery/bundled_skills/company-discovery-operator/agents/openai.yaml +4 -0
company_discovery/bundled_skills/company-enrichment-operator/SKILL.md +94 -0
company_discovery/bundled_skills/company-enrichment-operator/agents/openai.yaml +4 -0
company_discovery/bundled_skills/company-search-spec-writer/SKILL.md +109 -0
company_discovery/bundled_skills/company-search-spec-writer/agents/openai.yaml +4 -0
company_discovery/bundled_skills/contact-discovery-operator/SKILL.md +80 -0
company_discovery/bundled_skills/contact-discovery-operator/agents/openai.yaml +4 -0
company_discovery/bundled_skills/contact-enrichment-operator/SKILL.md +86 -0
company_discovery/bundled_skills/contact-enrichment-operator/agents/openai.yaml +4 -0
company_discovery/bundled_skills/contact-search-spec-writer/SKILL.md +86 -0
company_discovery/bundled_skills/contact-search-spec-writer/agents/openai.yaml +4 -0
company_discovery/bundled_skills/leads-update-operator/SKILL.md +60 -0
company_discovery/bundled_skills/leads-update-operator/agents/openai.yaml +4 -0
company_discovery/cli.py +1789 -0
company_discovery/db/__init__.py +5 -0
company_discovery/db/contact_enrichment_repository.py +268 -0
company_discovery/db/contact_repository.py +366 -0
company_discovery/db/enrichment_repository.py +207 -0
company_discovery/db/models.py +324 -0
company_discovery/db/repository.py +363 -0
company_discovery/db/session.py +48 -0
company_discovery/domain/__init__.py +24 -0
company_discovery/domain/contact_models.py +178 -0
company_discovery/domain/contact_spec.py +86 -0
company_discovery/domain/models.py +287 -0
company_discovery/domain/spec.py +263 -0
company_discovery/migrations.py +190 -0
company_discovery/prompts/__init__.py +8 -0
company_discovery/prompts/candidate_evaluation/system.md +13 -0
company_discovery/prompts/company_enrichment/system.md +42 -0
company_discovery/prompts/contact_evaluation/system.md +18 -0
company_discovery/prompts/query_generation/system.md +10 -0
company_discovery/release_manifest.json +7 -0
company_discovery/reports/__init__.py +4 -0
company_discovery/reports/contact_enrichment_exporter.py +108 -0
company_discovery/reports/contact_exporter.py +132 -0
company_discovery/reports/enrichment_exporter.py +125 -0
company_discovery/reports/exporter.py +135 -0
company_discovery/runtime.py +336 -0
company_discovery/services/__init__.py +4 -0
company_discovery/services/contact_enrichment_pipeline.py +344 -0
company_discovery/services/contact_enrichment_progress.py +37 -0
company_discovery/services/contact_evaluator.py +110 -0
company_discovery/services/contact_pipeline.py +295 -0
company_discovery/services/contact_progress.py +38 -0
company_discovery/services/enrichment_extractor.py +61 -0
company_discovery/services/enrichment_pipeline.py +526 -0
company_discovery/services/enrichment_progress.py +20 -0
company_discovery/services/enrichment_resolver.py +148 -0
company_discovery/services/evaluator.py +40 -0
company_discovery/services/hygiene.py +51 -0
company_discovery/services/memory.py +150 -0
company_discovery/services/normalization.py +98 -0
company_discovery/services/pipeline.py +628 -0
company_discovery/services/progress.py +48 -0
company_discovery/services/query_planner.py +47 -0
company_discovery/settings.py +152 -0
company_discovery/skill_installer.py +197 -0
company_discovery/update_plan.py +79 -0
leads_cli-0.1.0.dist-info/METADATA +277 -0
leads_cli-0.1.0.dist-info/RECORD +72 -0
leads_cli-0.1.0.dist-info/WHEEL +4 -0
leads_cli-0.1.0.dist-info/entry_points.txt +2 -0

company_discovery/reports/exporter.py ADDED Viewed

@@ -0,0 +1,135 @@
+from __future__ import annotations
+import csv
+import json
+from pathlib import Path
+from typing import Any
+from company_discovery.domain.models import RunSummary
+from company_discovery.domain.spec import CompanySearchSpec
+class ArtifactExporter:
+    def __init__(self, artifacts_root: Path) -> None:
+        self._artifacts_root = artifacts_root
+    def export(self, run_payload: dict[str, Any], summary: RunSummary) -> dict[str, str]:
+        run_id = run_payload["run_id"]
+        run_dir = self._artifacts_root / run_id
+        run_dir.mkdir(parents=True, exist_ok=True)
+        paths: dict[str, str] = {
+            bucket: str((run_dir / f"{bucket}.csv").resolve())
+            for bucket in ("selected", "reserve", "rejected")
+        }
+        paths["summary"] = str((run_dir / "summary.md").resolve())
+        paths["json"] = str((run_dir / "run.json").resolve())
+        for bucket in ("selected", "reserve", "rejected"):
+            path = Path(paths[bucket])
+            self._write_csv(path, run_payload["candidates"], bucket)
+        report_path = Path(paths["summary"])
+        report_path.write_text(self._markdown(run_payload, summary), encoding="utf-8")
+        json_path = Path(paths["json"])
+        full_payload = dict(run_payload)
+        full_payload["summary"] = summary.model_dump(mode="json")
+        full_payload["artifacts"] = paths
+        json_path.write_text(json.dumps(full_payload, indent=2, ensure_ascii=True), encoding="utf-8")
+        return paths
+    @staticmethod
+    def _write_csv(path: Path, candidates: list[dict[str, Any]], bucket: str) -> None:
+        rows = [item for item in candidates if item["bucket"] == bucket]
+        fieldnames = [
+            "company_name",
+            "domain",
+            "vertical",
+            "target_vertical",
+            "country",
+            "state",
+            "employee_min",
+            "employee_max",
+            "ownership_type",
+            "fit",
+            "reason",
+            "reason_codes",
+            "evidence",
+            "source",
+        ]
+        with path.open("w", newline="", encoding="utf-8") as handle:
+            writer = csv.DictWriter(handle, fieldnames=fieldnames)
+            writer.writeheader()
+            for item in rows:
+                company = item["company"]
+                evaluation = item["evaluation"]
+                writer.writerow(
+                    {
+                        "company_name": company["company_name"],
+                        "domain": company["domain"],
+                        "vertical": company.get("vertical") or "",
+                        "target_vertical": evaluation.get("target_vertical") or "",
+                        "country": company.get("country") or "",
+                        "state": company.get("state") or "",
+                        "employee_min": company.get("employee_min") or "",
+                        "employee_max": company.get("employee_max") or "",
+                        "ownership_type": company.get("ownership_type") or "",
+                        "fit": evaluation["fit"],
+                        "reason": evaluation["reason"],
+                        "reason_codes": "; ".join(evaluation.get("reason_codes", [])),
+                        "evidence": " | ".join(evaluation.get("evidence", [])),
+                        "source": item["source"],
+                    }
+                )
+    @staticmethod
+    def _markdown(run_payload: dict[str, Any], summary: RunSummary) -> str:
+        spec = run_payload["spec"]
+        lines = [
+            f"# Company Discovery Run {run_payload['run_id']}",
+            "",
+            f"- Status: {run_payload['status']}",
+            "- Verticals: "
+            + ", ".join(
+                f"{vertical['label']} (`{vertical['key']}`)"
+                for vertical in spec["verticals"]
+            ),
+            f"- Balance mode: {spec.get('balance_mode', 'soft')}",
+            f"- Country: {spec['geography']['country']}",
+            f"- States: {', '.join(spec['geography']['states']) or 'all'}",
+            f"- Requested: {spec['count']}",
+            "",
+            "## Results",
+            "",
+            f"- Memory matched: {summary.memory_matched}",
+            f"- Memory reused: {summary.memory_reused}",
+            f"- External gap: {summary.external_gap}",
+            f"- Queries generated: {summary.queries_generated}",
+            f"- Raw results: {summary.raw_results}",
+            f"- Unique candidates: {summary.unique_candidates}",
+            f"- Selected: {summary.selected}",
+            f"- Reserve: {summary.reserve}",
+            f"- Rejected: {summary.rejected}",
+            "",
+        ]
+        normalized_spec = CompanySearchSpec.model_validate(spec)
+        if normalized_spec.missing_constraints:
+            lines.extend(
+                ["## Open Modes", ""]
+                + [f"- {condition}" for condition in normalized_spec.missing_constraints]
+                + [""]
+            )
+        for bucket in ("selected", "reserve", "rejected"):
+            title = bucket.title()
+            lines.extend([f"## {title}", ""])
+            items = [item for item in run_payload["candidates"] if item["bucket"] == bucket]
+            if not items:
+                lines.extend(["None.", ""])
+                continue
+            for item in items:
+                company = item["company"]
+                evaluation = item["evaluation"]
+                lines.append(
+                    f"- **{company['company_name']}** ({company['domain']}): {evaluation['reason']}"
+                )
+            lines.append("")
+        return "\n".join(lines)

company_discovery/runtime.py ADDED Viewed

@@ -0,0 +1,336 @@
+from __future__ import annotations
+import json
+import logging
+from logging.handlers import RotatingFileHandler
+import sys
+import tomllib
+from copy import deepcopy
+from dataclasses import dataclass
+from datetime import datetime, timezone
+from pathlib import Path
+from typing import Any
+from platformdirs import user_data_dir
+PRODUCT_NAME = "leads"
+DISPLAY_NAME = "Leads"
+SCHEMA_VERSION = 1
+SKILL_BUNDLE_VERSION = "2026.06.1"
+LOGGER_NAME = "company_discovery"
+WORKSPACE_POINTER_FILE = "workspace.json"
+DEFAULT_CONFIG: dict[str, Any] = {
+    "llm": {
+        "provider": "openai",
+        "base_url": "https://api.openai.com/v1",
+        "model": "gpt-5-mini",
+        "response_format": "auto",
+    },
+    "providers": {
+        "exa": {
+            "enabled": False,
+            "base_url": "https://api.exa.ai",
+        },
+        "apollo": {
+            "enabled": False,
+            "base_url": "https://api.apollo.io",
+            "webhook_url": "",
+        },
+    },
+}
+DEFAULT_SECRETS: dict[str, Any] = {
+    "llm": {"api_key": ""},
+    "providers": {
+        "exa": {"api_key": ""},
+        "apollo": {"api_key": ""},
+    },
+}
+@dataclass(frozen=True)
+class WorkspacePaths:
+    root: Path
+    config_dir: Path
+    config_file: Path
+    secrets_file: Path
+    runtime_file: Path
+    data_dir: Path
+    database_file: Path
+    runs_dir: Path
+    specs_dir: Path
+    company_specs_dir: Path
+    contact_specs_dir: Path
+    backups_dir: Path
+    logs_dir: Path
+    skills_dir: Path
+    skill_bundle_dir: Path
+    skill_installs_file: Path
+def default_workspace_root() -> Path:
+    """Return the OS-appropriate default workspace root for leads."""
+    app_name = PRODUCT_NAME if sys.platform.startswith("linux") else DISPLAY_NAME
+    return Path(user_data_dir(app_name, appauthor=False, roaming=True))
+def workspace_pointer_file() -> Path:
+    return default_workspace_root() / "config" / WORKSPACE_POINTER_FILE
+def read_workspace_pointer() -> Path | None:
+    payload = read_json(workspace_pointer_file(), {})
+    raw = payload.get("workspace_root")
+    if not isinstance(raw, str) or not raw.strip():
+        return None
+    return Path(raw).expanduser()
+def write_workspace_pointer(root: Path) -> Path:
+    path = workspace_pointer_file()
+    write_json(
+        path,
+        {
+            "product": PRODUCT_NAME,
+            "workspace_root": str(root.expanduser().resolve()),
+            "updated_at": datetime.now(timezone.utc).isoformat(),
+        },
+    )
+    return path
+def workspace_paths(root: Path) -> WorkspacePaths:
+    root = root.expanduser()
+    config_dir = root / "config"
+    data_dir = root / "data"
+    specs_dir = root / "specs"
+    skills_dir = root / "skills"
+    return WorkspacePaths(
+        root=root,
+        config_dir=config_dir,
+        config_file=config_dir / "config.toml",
+        secrets_file=config_dir / "secrets.toml",
+        runtime_file=config_dir / "runtime.json",
+        data_dir=data_dir,
+        database_file=data_dir / "company_memory.db",
+        runs_dir=root / "runs",
+        specs_dir=specs_dir,
+        company_specs_dir=specs_dir / "companies",
+        contact_specs_dir=specs_dir / "contacts",
+        backups_dir=root / "backups",
+        logs_dir=root / "logs",
+        skills_dir=skills_dir,
+        skill_bundle_dir=skills_dir / "bundle",
+        skill_installs_file=skills_dir / "installs.json",
+    )
+def default_runtime_metadata() -> dict[str, Any]:
+    return {
+        "product": PRODUCT_NAME,
+        "created_at": datetime.now(timezone.utc).isoformat(),
+        "schema_version": SCHEMA_VERSION,
+        "skill_bundle_version": None,
+        "installs": [],
+    }
+def ensure_workspace(root: Path) -> WorkspacePaths:
+    paths = workspace_paths(root)
+    for directory in (
+        paths.root,
+        paths.config_dir,
+        paths.data_dir,
+        paths.runs_dir,
+        paths.company_specs_dir,
+        paths.contact_specs_dir,
+        paths.backups_dir,
+        paths.logs_dir,
+        paths.skills_dir,
+        paths.skill_bundle_dir,
+    ):
+        directory.mkdir(parents=True, exist_ok=True)
+    if not paths.config_file.exists():
+        write_toml(paths.config_file, DEFAULT_CONFIG)
+    if not paths.secrets_file.exists():
+        write_toml(paths.secrets_file, DEFAULT_SECRETS)
+        try:
+            paths.secrets_file.chmod(0o600)
+        except OSError:
+            pass
+    if not paths.runtime_file.exists():
+        write_json(paths.runtime_file, default_runtime_metadata())
+    if not paths.skill_installs_file.exists():
+        write_json(paths.skill_installs_file, {"skill_bundle_version": None, "installs": []})
+    return paths
+def configure_workspace_logging(root: Path) -> Path:
+    paths = ensure_workspace(root)
+    log_file = paths.logs_dir / "leads.log"
+    logger = logging.getLogger(LOGGER_NAME)
+    logger.setLevel(logging.INFO)
+    logger.propagate = False
+    target = str(log_file.resolve())
+    for handler in list(logger.handlers):
+        if getattr(handler, "baseFilename", None) == target:
+            return log_file
+        if isinstance(handler, RotatingFileHandler):
+            logger.removeHandler(handler)
+            handler.close()
+    handler = RotatingFileHandler(log_file, maxBytes=1_000_000, backupCount=3, encoding="utf-8")
+    handler.setFormatter(
+        logging.Formatter("%(asctime)s %(levelname)s %(name)s: %(message)s")
+    )
+    logger.addHandler(handler)
+    logger.info("workspace logging initialized")
+    return log_file
+def read_toml(path: Path) -> dict[str, Any]:
+    if not path.exists():
+        return {}
+    with path.open("rb") as handle:
+        return tomllib.load(handle)
+def write_toml(path: Path, data: dict[str, Any]) -> None:
+    path.parent.mkdir(parents=True, exist_ok=True)
+    path.write_text(_dump_toml(data), encoding="utf-8")
+def read_json(path: Path, default: dict[str, Any] | None = None) -> dict[str, Any]:
+    if not path.exists():
+        return deepcopy(default or {})
+    return json.loads(path.read_text(encoding="utf-8"))
+def write_json(path: Path, data: dict[str, Any]) -> None:
+    path.parent.mkdir(parents=True, exist_ok=True)
+    path.write_text(json.dumps(data, indent=2, sort_keys=True) + "\n", encoding="utf-8")
+def load_local_settings(root: Path) -> dict[str, Any]:
+    paths = workspace_paths(root)
+    config = read_toml(paths.config_file)
+    secrets = read_toml(paths.secrets_file)
+    values: dict[str, Any] = {}
+    llm = config.get("llm", {})
+    llm_secrets = secrets.get("llm", {})
+    _copy(values, "llm_provider", llm.get("provider"))
+    _copy(values, "llm_base_url", llm.get("base_url"))
+    _copy(values, "llm_model", llm.get("model"))
+    _copy(values, "llm_response_format", llm.get("response_format"))
+    _copy(values, "llm_api_key", _blank_to_none(llm_secrets.get("api_key")))
+    providers = config.get("providers", {})
+    provider_secrets = secrets.get("providers", {})
+    exa = providers.get("exa", {})
+    exa_secrets = provider_secrets.get("exa", {})
+    _copy(values, "exa_base_url", exa.get("base_url"))
+    _copy(values, "exa_api_key", _blank_to_none(exa_secrets.get("api_key")))
+    apollo = providers.get("apollo", {})
+    apollo_secrets = provider_secrets.get("apollo", {})
+    _copy(values, "apollo_base_url", apollo.get("base_url"))
+    _copy(values, "apollo_webhook_url", _blank_to_none(apollo.get("webhook_url")))
+    _copy(values, "apollo_api_key", _blank_to_none(apollo_secrets.get("api_key")))
+    return values
+def update_config_value(root: Path, key: str, value: Any, *, secret: bool = False) -> Path:
+    paths = ensure_workspace(root)
+    target = paths.secrets_file if secret else paths.config_file
+    data = read_toml(target)
+    set_nested_value(data, key.split("."), _coerce_value(value))
+    write_toml(target, data)
+    if secret:
+        try:
+            target.chmod(0o600)
+        except OSError:
+            pass
+    return target
+def set_nested_value(data: dict[str, Any], keys: list[str], value: Any) -> None:
+    cursor = data
+    for key in keys[:-1]:
+        next_value = cursor.setdefault(key, {})
+        if not isinstance(next_value, dict):
+            raise ValueError(f"Cannot set nested key through scalar value at {key!r}")
+        cursor = next_value
+    cursor[keys[-1]] = value
+def merge_dicts(base: dict[str, Any], updates: dict[str, Any]) -> dict[str, Any]:
+    merged = deepcopy(base)
+    for key, value in updates.items():
+        if isinstance(value, dict) and isinstance(merged.get(key), dict):
+            merged[key] = merge_dicts(merged[key], value)
+        else:
+            merged[key] = value
+    return merged
+def _dump_toml(data: dict[str, Any]) -> str:
+    lines: list[str] = []
+    scalars = {key: value for key, value in data.items() if not isinstance(value, dict)}
+    for key, value in scalars.items():
+        lines.append(f"{key} = {_format_toml_value(value)}")
+    if scalars:
+        lines.append("")
+    _write_toml_sections(lines, [], {key: value for key, value in data.items() if isinstance(value, dict)})
+    return "\n".join(lines).rstrip() + "\n"
+def _write_toml_sections(lines: list[str], prefix: list[str], sections: dict[str, Any]) -> None:
+    for section, values in sections.items():
+        path = [*prefix, section]
+        scalars = {key: value for key, value in values.items() if not isinstance(value, dict)}
+        nested = {key: value for key, value in values.items() if isinstance(value, dict)}
+        if scalars:
+            if lines and lines[-1] != "":
+                lines.append("")
+            lines.append(f"[{'.'.join(path)}]")
+            for key, value in scalars.items():
+                lines.append(f"{key} = {_format_toml_value(value)}")
+        if nested:
+            _write_toml_sections(lines, path, nested)
+def _format_toml_value(value: Any) -> str:
+    if isinstance(value, bool):
+        return "true" if value else "false"
+    if isinstance(value, int | float):
+        return str(value)
+    return json.dumps("" if value is None else str(value))
+def _coerce_value(value: Any) -> Any:
+    if not isinstance(value, str):
+        return value
+    normalized = value.strip()
+    if normalized.lower() in {"true", "false"}:
+        return normalized.lower() == "true"
+    try:
+        return int(normalized)
+    except ValueError:
+        pass
+    try:
+        return float(normalized)
+    except ValueError:
+        return value
+def _copy(values: dict[str, Any], key: str, value: Any) -> None:
+    if value is not None:
+        values[key] = value
+def _blank_to_none(value: Any) -> Any:
+    if value == "":
+        return None
+    return value

company_discovery/services/__init__.py ADDED Viewed

@@ -0,0 +1,4 @@
+from company_discovery.services.pipeline import DiscoveryPipeline
+__all__ = ["DiscoveryPipeline"]