PyPI - speaker-detector - Versions diffs - 0.1.5__py3-none-any.whl → 0.1.6__py3-none-any.whl - Mend

speaker-detector 0.1.5py3-none-any.whl → 0.1.6py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (30) hide show

speaker_detector/cli.py +12 -26
speaker_detector/core.py +78 -65
speaker_detector/model/classifier.ckpt +0 -0
speaker_detector/model/embedding_model.ckpt +0 -0
speaker_detector/model/hyperparams.yaml +58 -0
speaker_detector/model/label_encoder.ckpt +7207 -0
speaker_detector/model/mean_var_norm_emb.ckpt +0 -0
speaker_detector/server copy.py +296 -0
speaker_detector/server.py +82 -0
speaker_detector/state.py +69 -0
speaker_detector/web/static/favicon.ico +0 -0
speaker_detector/web/static/index.html +29 -0
speaker_detector/web/static/scripts/loader copy.js +10 -0
speaker_detector/web/static/scripts/loader.js +14 -0
speaker_detector/web/static/scripts/script copy.js +954 -0
speaker_detector/web/static/scripts/script.js +22 -0
speaker_detector/web/static/style.css +133 -0
{speaker_detector-0.1.5.dist-info → speaker_detector-0.1.6.dist-info}/METADATA +28 -3
speaker_detector-0.1.6.dist-info/RECORD +25 -0
{speaker_detector-0.1.5.dist-info → speaker_detector-0.1.6.dist-info}/WHEEL +1 -1
speaker_detector/analyze.py +0 -59
speaker_detector/combine.py +0 -22
speaker_detector/export_embeddings.py +0 -62
speaker_detector/export_model.py +0 -40
speaker_detector/generate_summary.py +0 -110
speaker_detector-0.1.5.dist-info/RECORD +0 -15
/speaker_detector/{ECAPA_TDNN.py → model/ECAPA_TDNN.py} +0 -0
/speaker_detector/{__init__.py → web/static/__init__.py} +0 -0
{speaker_detector-0.1.5.dist-info → speaker_detector-0.1.6.dist-info}/entry_points.txt +0 -0
{speaker_detector-0.1.5.dist-info → speaker_detector-0.1.6.dist-info}/top_level.txt +0 -0

speaker_detector/model/mean_var_norm_emb.ckpt ADDED Viewed

Binary file

speaker_detector/server copy.py ADDED Viewed

@@ -0,0 +1,296 @@
+# server.py
+import os
+import tempfile
+import threading
+import time
+import signal
+import json
+import sounddevice as sd
+import soundfile as sf
+from datetime import datetime
+from pathlib import Path
+from flask import Flask, request, jsonify, send_from_directory
+from flask_cors import CORS
+from pydub import AudioSegment
+import numpy as np
+from speaker_detector.utils.generate_index import regenerate_component_index
+regenerate_component_index(verbose=False)
+from speaker_detector.core import (
+    identify_speaker,
+    rebuild_embedding,
+    compute_background_embedding,
+    get_speakers_needing_rebuild,
+)
+from speaker_detector.utils.paths import (
+    STATIC_DIR,
+    STORAGE_DIR,
+    SPEAKERS_DIR,
+    NOISE_DIR,
+    EXPORTS_DIR,
+    MEETINGS_DIR,
+    COMPONENTS_DIR,
+    INDEX_JSON,
+)
+# ── Flask Setup ─────────────────────────────────────────────────────
+app = Flask(
+    __name__,
+    static_folder=str(STATIC_DIR)
+)
+# ── State ───────────────────────────────────────────────────────────
+current_speaker = {"speaker": None, "confidence": None}
+MIC_AVAILABLE = True
+stop_event = threading.Event()
+LISTENING_MODE = {"mode": "single"}  # off, single, multi
+DETECTION_INTERVAL_MS = 3000
+DETECTION_THRESHOLD = 0.75
+# ── Setup ───────────────────────────────────────────────────────────
+for d in [SPEAKERS_DIR, NOISE_DIR, EXPORTS_DIR, MEETINGS_DIR]:
+    d.mkdir(parents=True, exist_ok=True)
+def get_speaker_folder(name: str) -> Path:
+    return SPEAKERS_DIR / name
+# ── Routes ──────────────────────────────────────────────────────────
+@app.route("/")
+def index():
+    return send_from_directory(STATIC_DIR, "index.html")
+@app.route("/api/settings", methods=["GET", "POST"])
+def update_settings():
+    global DETECTION_INTERVAL_MS, DETECTION_THRESHOLD, LISTENING_MODE
+    if request.method == "POST":
+        data = request.get_json() or {}
+        DETECTION_INTERVAL_MS = int(data.get("interval_ms", DETECTION_INTERVAL_MS))
+        DETECTION_THRESHOLD = float(data.get("threshold", DETECTION_THRESHOLD))
+        LISTENING_MODE["mode"] = data.get("mode", LISTENING_MODE["mode"])
+    return jsonify({
+        "interval_ms": DETECTION_INTERVAL_MS,
+        "threshold": DETECTION_THRESHOLD,
+        "mode": LISTENING_MODE["mode"]
+    })
+@app.route("/api/active-speaker")
+def get_active_speaker():
+    if LISTENING_MODE["mode"] == "off":
+        return jsonify({"speaker": None, "confidence": None, "status": "disabled"})
+    if not MIC_AVAILABLE:
+        return jsonify({"speaker": None, "confidence": None, "status": "mic unavailable"}), 503
+    return jsonify({**current_speaker, "status": "listening"})
+@app.route("/api/identify", methods=["POST"])
+def api_identify():
+    if "file" not in request.files:
+        return jsonify({"error": "Missing file"}), 400
+    audio = request.files["file"]
+    suffix = Path(audio.filename).suffix.lower()
+    with tempfile.NamedTemporaryFile(suffix=suffix, delete=False) as tmp:
+        tmp_path = tmp.name
+        audio.save(tmp_path)
+    try:
+        if suffix in [".webm", ".ogg", ".mp3"]:
+            wav_path = tmp_path.replace(suffix, ".wav")
+            AudioSegment.from_file(tmp_path).export(wav_path, format="wav")
+            os.remove(tmp_path)
+        else:
+            wav_path = tmp_path
+        speaker, score = identify_speaker(wav_path, threshold=DETECTION_THRESHOLD)
+        os.remove(wav_path)
+        return jsonify({"speaker": speaker, "score": round(score or 0, 3)})
+    except Exception as e:
+        if os.path.exists(tmp_path):
+            os.remove(tmp_path)
+        return jsonify({"error": str(e)}), 500
+@app.route("/api/speakers")
+def api_speakers():
+    speakers = []
+    for spk_dir in SPEAKERS_DIR.iterdir():
+        if spk_dir.is_dir():
+            wavs = list(spk_dir.glob("*.wav"))
+            speakers.append({
+                "name": spk_dir.name,
+                "recordings": len(wavs)
+            })
+    return jsonify(speakers)
+@app.route("/api/enroll/<name>", methods=["POST"])
+def api_enroll(name):
+    if "file" not in request.files:
+        return jsonify({"error": "Missing audio file"}), 400
+    audio = request.files["file"]
+    folder = get_speaker_folder(name)
+    folder.mkdir(exist_ok=True)
+    suffix = Path(audio.filename).suffix
+    with tempfile.NamedTemporaryFile(suffix=suffix, delete=False) as tmp:
+        audio.save(tmp.name)
+        path = Path(tmp.name)
+    try:
+        if suffix != ".wav":
+            wav_path = path.with_suffix(".wav")
+            AudioSegment.from_file(path).export(wav_path, format="wav")
+            os.remove(path)
+        else:
+            wav_path = path
+        dest_path = folder / f"{name}_{int(time.time())}.wav"
+        Path(wav_path).rename(dest_path)
+        return jsonify({"status": "enrolled", "file": dest_path.name})
+    except Exception as e:
+        return jsonify({"error": str(e)}), 500
+@app.route("/api/speakers/<name>", methods=["DELETE"])
+def api_delete_speaker(name):
+    folder = get_speaker_folder(name)
+    emb_path = STORAGE_DIR / "embeddings" / f"{name}.pt"
+    try:
+        if folder.exists():
+            for file in folder.glob("*"):
+                file.unlink()
+            folder.rmdir()
+        if emb_path.exists():
+            emb_path.unlink()
+        return jsonify({"deleted": True})
+    except Exception as e:
+        return jsonify({"error": str(e)}), 500
+@app.route("/api/speakers/<name>/improve", methods=["POST"])
+def api_improve(name):
+    if "file" not in request.files:
+        return jsonify({"error": "Missing audio file"}), 400
+    folder = get_speaker_folder(name)
+    if not folder.exists():
+        return jsonify({"error": f"Speaker '{name}' not found"}), 404
+    audio = request.files["file"]
+    suffix = Path(audio.filename).suffix
+    with tempfile.NamedTemporaryFile(suffix=suffix, delete=False) as tmp:
+        audio.save(tmp.name)
+        path = Path(tmp.name)
+    try:
+        if suffix != ".wav":
+            wav_path = path.with_suffix(".wav")
+            AudioSegment.from_file(path).export(wav_path, format="wav")
+            os.remove(path)
+        else:
+            wav_path = path
+        dest_path = folder / f"{name}_imp_{int(time.time())}.wav"
+        Path(wav_path).rename(dest_path)
+        return jsonify({"status": "improved", "file": dest_path.name})
+    except Exception as e:
+        return jsonify({"error": str(e)}), 500
+@app.route("/api/background_noise", methods=["POST"])
+def api_background_noise():
+    if "audio" not in request.files:
+        return jsonify({"error": "Missing audio file"}), 400
+    audio = request.files["audio"]
+    suffix = Path(audio.filename).suffix
+    with tempfile.NamedTemporaryFile(suffix=suffix, delete=False) as tmp:
+        audio.save(tmp.name)
+        path = Path(tmp.name)
+    try:
+        if suffix != ".wav":
+            wav_path = path.with_suffix(".wav")
+            AudioSegment.from_file(path).export(wav_path, format="wav")
+            os.remove(path)
+        else:
+            wav_path = path
+        final_path = NOISE_DIR / f"noise_{int(time.time())}.wav"
+        Path(wav_path).rename(final_path)
+        return jsonify({"success": True})
+    except Exception as e:
+        return jsonify({"error": str(e)}), 500
+@app.route("/api/rebuild-all", methods=["POST"])
+def api_rebuild_all():
+    rebuilt = []
+    errors = {}
+    for spk_dir in SPEAKERS_DIR.iterdir():
+        if spk_dir.is_dir():
+            name = spk_dir.name
+            try:
+                rebuild_embedding(name)
+                rebuilt.append(name)
+            except Exception as e:
+                errors[name] = str(e)
+    if errors:
+        return jsonify({"status": "partial", "rebuilt": rebuilt, "errors": errors}), 207
+    return jsonify({"status": "rebuilt", "rebuilt": rebuilt})
+@app.route("/api/rebuild/<name>", methods=["POST"])
+def api_rebuild_one(name):
+    try:
+        rebuild_embedding(name)
+        return jsonify({"status": "rebuilt", "name": name})
+    except Exception as e:
+        return jsonify({"error": str(e)}), 500
+@app.route("/api/rebuild-background", methods=["POST"])
+def api_rebuild_background():
+    try:
+        compute_background_embedding()
+        return jsonify({"status": "success"})
+    except Exception as e:
+        return jsonify({"error": str(e)}), 500
+@app.route("/api/speakers/needs-rebuild")
+def api_needs_rebuild():
+    try:
+        to_rebuild = get_speakers_needing_rebuild()
+        return jsonify({"toRebuild": to_rebuild})
+    except Exception as e:
+        return jsonify({"error": str(e)}), 500
+@app.after_request
+def remove_favicon_warnings(response):
+    if request.path.endswith("favicon.ico"):
+        response.status_code = 204
+    return response
+# ── Background Detection Loop ──────────────────────────────────────
+def background_speaker_loop():
+    global current_speaker, MIC_AVAILABLE
+    samplerate = 16000
+    duration = 2
+    while not stop_event.is_set():
+        try:
+            audio = sd.rec(int(duration * samplerate), samplerate=samplerate, channels=1, dtype="int16")
+            sd.wait()
+            tmp = tempfile.NamedTemporaryFile(suffix=".wav", delete=False)
+            sf.write(tmp.name, audio, samplerate)
+            MIC_AVAILABLE = True
+            speaker, conf = identify_speaker(tmp.name, threshold=DETECTION_THRESHOLD)
+            os.remove(tmp.name)
+            current_speaker.update(speaker=speaker, confidence=conf)
+            print(f"{datetime.now().strftime('%H:%M:%S')} 🧠 Detected: {speaker} ({conf:.2f})")
+        except Exception as e:
+            print(f"❌ Loop error: {e}")
+            current_speaker.update(speaker=None, confidence=None)
+            if isinstance(e, sd.PortAudioError):
+                MIC_AVAILABLE = False
+        time.sleep(0.5)
+def handle_interrupt(sig, frame):
+    print("🛑 Shutting down cleanly...")
+    stop_event.set()
+    time.sleep(1)
+    exit(0)
+signal.signal(signal.SIGINT, handle_interrupt)
+if __name__ == "__main__":
+    thread = threading.Thread(target=background_speaker_loop, daemon=True)
+    thread.start()
+    print("🎤 Speaker detection loop started.")
+    time.sleep(2)
+    print("🌐 Server running on http://0.0.0.0:9000")
+    app.run(host="0.0.0.0", port=9000)

speaker_detector/server.py ADDED Viewed

@@ -0,0 +1,82 @@
+# ── Core Imports ─────────────────────────────────────────────
+import os, signal, time
+from flask import Flask, request, send_from_directory, send_file
+from flask_cors import CORS
+from pathlib import Path
+# ── Internal Modules ─────────────────────────────────────────
+from speaker_detector.state import stop_event
+from speaker_detector.utils.paths import STATIC_DIR, INDEX_HTML, COMPONENTS_DIR
+# ── App Setup ────────────────────────────────────────────────
+app = Flask(__name__, static_folder=str(STATIC_DIR))
+CORS(app)
+# ── Routes ──────────────────────────────────────────────────
+@app.after_request
+def apply_csp(response):
+    response.headers["Content-Security-Policy"] = (
+        "default-src 'self'; script-src 'self'; style-src 'self'; object-src 'none';"
+    )
+    return response
+@app.route("/")
+def serve_index():
+    return send_file(INDEX_HTML)
+@app.route("/index.html")
+def serve_index_html():
+    return send_file(INDEX_HTML)
+@app.route("/static/<path:filename>")
+def serve_static_file(filename):
+    return send_from_directory(STATIC_DIR, filename)
+@app.route("/static/components/<path:filename>")
+def serve_component_file(filename):
+    return send_from_directory(COMPONENTS_DIR, filename)
+@app.route("/favicon.ico")
+def serve_favicon():
+    return send_from_directory(STATIC_DIR, "favicon.ico")
+@app.errorhandler(404)
+def not_found(e):
+    return {"error": "Resource not found"}, 404
+# ── Route Registrations ─────────────────────────────────────
+from speaker_detector.routes.index_routes import index_bp
+from speaker_detector.routes.settings_routes import settings_bp
+from speaker_detector.routes.speaker_routes import speakers_bp
+from speaker_detector.routes.background_routes import background_bp
+from speaker_detector.routes.rebuild_routes import rebuild_bp
+from speaker_detector.routes.identify_routes import identify_bp
+from speaker_detector.routes.recordings_routes import recordings_bp
+from speaker_detector.routes.meetings_routes import meetings_bp
+app.register_blueprint(index_bp)
+app.register_blueprint(settings_bp)
+app.register_blueprint(speakers_bp)
+app.register_blueprint(background_bp)
+app.register_blueprint(rebuild_bp)
+app.register_blueprint(identify_bp)
+app.register_blueprint(recordings_bp)
+app.register_blueprint(meetings_bp)
+# ── Interrupt Handler ───────────────────────────────────────
+def handle_interrupt(sig, frame):
+    print("🛑 Shutting down cleanly...")
+    stop_event.set()
+    time.sleep(1)
+    exit(0)
+signal.signal(signal.SIGINT, handle_interrupt)
+# ── Entrypoint ───────────────────────────────────────────────
+if __name__ == "__main__":
+    print("🌐 Server running on http://0.0.0.0:9000")
+    print(f"🚀 Static folder:     {STATIC_DIR}")
+    print(f"📁 Component folder: {COMPONENTS_DIR}")
+    print(f"📄 Index HTML:       {INDEX_HTML}")
+    app.run(host="0.0.0.0", port=9000, debug=True)

speaker_detector/state.py ADDED Viewed

@@ -0,0 +1,69 @@
+# speaker_detector/state.py
+import threading
+import tempfile
+import time
+import sounddevice as sd
+import soundfile as sf
+from datetime import datetime
+from pathlib import Path
+from speaker_detector.core import identify_speaker  # ✅ safe import — no circular loop
+# ── Global State ─────────────────────────────────────────────
+current_speaker = {"speaker": None, "confidence": None}
+LISTENING_MODE = {"mode": "off"}  # Values: "off", "single", "multi"
+DETECTION_INTERVAL_MS = 3000
+DETECTION_THRESHOLD = 0.75
+MIC_AVAILABLE = True
+stop_event = threading.Event()  # ✅ defined here, no self-import
+detection_thread = None
+# ── Background Detection Loop ────────────────────────────────
+def detection_loop():
+    global MIC_AVAILABLE
+    samplerate = 16000
+    duration = 2
+    while not stop_event.is_set():
+        try:
+            audio = sd.rec(int(duration * samplerate), samplerate=samplerate, channels=1, dtype="int16")
+            sd.wait()
+            with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as tmp:
+                sf.write(tmp.name, audio, samplerate)
+                MIC_AVAILABLE = True
+                speaker, conf = identify_speaker(tmp.name, threshold=DETECTION_THRESHOLD)
+                current_speaker.update(speaker=speaker, confidence=conf)
+                print(f"{datetime.now().strftime('%H:%M:%S')} 🧠 Detected: {speaker} ({conf:.2f})")
+        except Exception as e:
+            print(f"❌ Detection loop error: {e}")
+            current_speaker.update(speaker=None, confidence=None)
+            if isinstance(e, sd.PortAudioError):
+                MIC_AVAILABLE = False
+        time.sleep(DETECTION_INTERVAL_MS / 1000.0)
+# ── Control Functions ────────────────────────────────────────
+def start_detection_loop():
+    global detection_thread
+    if detection_thread and detection_thread.is_alive():
+        return
+    print("🔁 Starting detection loop...")
+    stop_event.clear()
+    detection_thread = threading.Thread(target=detection_loop, daemon=True)
+    detection_thread.start()
+def stop_detection_loop():
+    if detection_thread and detection_thread.is_alive():
+        print("⏹️ Stopping detection loop...")
+        stop_event.set()
+def get_active_speaker():
+    if LISTENING_MODE["mode"] == "off":
+        return {"speaker": None, "confidence": None, "status": "disabled"}
+    if not MIC_AVAILABLE:
+        return {"speaker": None, "confidence": None, "status": "mic unavailable"}
+    return {**current_speaker, "status": "listening"}

speaker_detector/web/static/favicon.ico ADDED Viewed

Binary file

speaker_detector/web/static/index.html ADDED Viewed

@@ -0,0 +1,29 @@
+<!DOCTYPE html>
+<html lang="en">
+<head>
+  <meta charset="UTF-8" />
+  <title>Speaker Detector</title>
+  <link rel="icon" type="image/x-icon" href="/favicon.ico" />
+  <link rel="stylesheet" href="/static/style.css" />
+</head>
+<body>
+  <div id="loading-overlay">
+  <div class="loader">🔄 Loading Speaker Detector...</div>
+</div>
+  <h1>🎡️ Speaker Detector</h1>
+  <!-- Include all component templates -->
+  <div include-html="/static/components/accordion-nav/accordion-nav.html"></div>
+  <div include-html="/static/components/mic-test/mic-test.html"></div>
+  <div include-html="/static/components/enroll-speaker/enroll-speaker.html"></div>
+  <div include-html="/static/components/identify-speaker/identify-speaker.html"></div>
+  <div include-html="/static/components/meeting-mode/meeting-mode.html"></div>
+  <div include-html="/static/components/recordings-tab/recordings-tab.html"></div>
+  <div include-html="/static/components/mic-popup/mic-popup.html"></div>
+  <div include-html="/static/components/correction/correction.html"></div>
+  <!-- ✅ External module to handle includes + script setup -->
+  <script type="module" src="/static/scripts/loader.js"></script>
+</body>
+</html>

speaker_detector/web/static/scripts/loader copy.js ADDED Viewed

@@ -0,0 +1,10 @@
+import { includeHTML } from "/static/scripts/utils/include-html.js";
+includeHTML(() => {
+  import("/static/scripts/script.js")
+    .then(mod => {
+      console.log("✅ script.js loaded");
+      mod.runSetup(); // ✅ only run after includes finish
+    })
+    .catch(err => console.error("❌ Failed to load script.js:", err));
+});

speaker_detector/web/static/scripts/loader.js ADDED Viewed

@@ -0,0 +1,14 @@
+import { includeHTML } from "/static/scripts/utils/include-html.js";
+includeHTML(() => {
+  import("/static/scripts/script.js")
+    .then(mod => {
+      console.log("✅ script.js loaded");
+      mod.runSetup(); // ✅ only run after includes finish
+      // ✅ Hide loading screen now that setup is complete
+      const loadingEl = document.getElementById("loading-overlay");
+      if (loadingEl) loadingEl.remove();
+    })
+    .catch(err => console.error("❌ Failed to load script.js:", err));
+});

speaker-detector 0.1.5__py3-none-any.whl → 0.1.6__py3-none-any.whl

speaker-detector 0.1.5py3-none-any.whl → 0.1.6py3-none-any.whl