PayPerTranscript 0.2.0__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (45) hide show
  1. paypertranscript-0.2.0/LICENSE +21 -0
  2. paypertranscript-0.2.0/PKG-INFO +159 -0
  3. paypertranscript-0.2.0/PayPerTranscript.egg-info/PKG-INFO +159 -0
  4. paypertranscript-0.2.0/PayPerTranscript.egg-info/SOURCES.txt +43 -0
  5. paypertranscript-0.2.0/PayPerTranscript.egg-info/dependency_links.txt +1 -0
  6. paypertranscript-0.2.0/PayPerTranscript.egg-info/entry_points.txt +2 -0
  7. paypertranscript-0.2.0/PayPerTranscript.egg-info/requires.txt +15 -0
  8. paypertranscript-0.2.0/PayPerTranscript.egg-info/top_level.txt +1 -0
  9. paypertranscript-0.2.0/README.md +130 -0
  10. paypertranscript-0.2.0/paypertranscript/__init__.py +3 -0
  11. paypertranscript-0.2.0/paypertranscript/__main__.py +51 -0
  12. paypertranscript-0.2.0/paypertranscript/assets/icons/app.ico +0 -0
  13. paypertranscript-0.2.0/paypertranscript/assets/icons/app.png +0 -0
  14. paypertranscript-0.2.0/paypertranscript/assets/icons/arrow_down.svg +3 -0
  15. paypertranscript-0.2.0/paypertranscript/assets/sounds/start.wav +0 -0
  16. paypertranscript-0.2.0/paypertranscript/assets/sounds/stop.wav +0 -0
  17. paypertranscript-0.2.0/paypertranscript/assets/styles/dark.qss +388 -0
  18. paypertranscript-0.2.0/paypertranscript/core/__init__.py +0 -0
  19. paypertranscript-0.2.0/paypertranscript/core/audio_manager.py +142 -0
  20. paypertranscript-0.2.0/paypertranscript/core/config.py +360 -0
  21. paypertranscript-0.2.0/paypertranscript/core/cost_tracker.py +87 -0
  22. paypertranscript-0.2.0/paypertranscript/core/hotkey.py +294 -0
  23. paypertranscript-0.2.0/paypertranscript/core/logging.py +65 -0
  24. paypertranscript-0.2.0/paypertranscript/core/paths.py +28 -0
  25. paypertranscript-0.2.0/paypertranscript/core/recorder.py +167 -0
  26. paypertranscript-0.2.0/paypertranscript/core/session_logger.py +138 -0
  27. paypertranscript-0.2.0/paypertranscript/core/text_inserter.py +131 -0
  28. paypertranscript-0.2.0/paypertranscript/core/window_detector.py +58 -0
  29. paypertranscript-0.2.0/paypertranscript/pipeline/__init__.py +0 -0
  30. paypertranscript-0.2.0/paypertranscript/pipeline/transcription.py +361 -0
  31. paypertranscript-0.2.0/paypertranscript/providers/__init__.py +85 -0
  32. paypertranscript-0.2.0/paypertranscript/providers/base.py +78 -0
  33. paypertranscript-0.2.0/paypertranscript/providers/groq_provider.py +182 -0
  34. paypertranscript-0.2.0/paypertranscript/ui/__init__.py +0 -0
  35. paypertranscript-0.2.0/paypertranscript/ui/app.py +370 -0
  36. paypertranscript-0.2.0/paypertranscript/ui/dashboard.py +92 -0
  37. paypertranscript-0.2.0/paypertranscript/ui/overlay.py +396 -0
  38. paypertranscript-0.2.0/paypertranscript/ui/settings.py +550 -0
  39. paypertranscript-0.2.0/paypertranscript/ui/setup_wizard.py +690 -0
  40. paypertranscript-0.2.0/paypertranscript/ui/statistics.py +412 -0
  41. paypertranscript-0.2.0/paypertranscript/ui/tray.py +256 -0
  42. paypertranscript-0.2.0/paypertranscript/ui/window_mapping.py +460 -0
  43. paypertranscript-0.2.0/paypertranscript/ui/word_list.py +183 -0
  44. paypertranscript-0.2.0/pyproject.toml +57 -0
  45. paypertranscript-0.2.0/setup.cfg +4 -0
@@ -0,0 +1,21 @@
1
+ MIT License
2
+
3
+ Copyright (c) 2026 PayPerTranscript Contributors
4
+
5
+ Permission is hereby granted, free of charge, to any person obtaining a copy
6
+ of this software and associated documentation files (the "Software"), to deal
7
+ in the Software without restriction, including without limitation the rights
8
+ to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
9
+ copies of the Software, and to permit persons to whom the Software is
10
+ furnished to do so, subject to the following conditions:
11
+
12
+ The above copyright notice and this permission notice shall be included in all
13
+ copies or substantial portions of the Software.
14
+
15
+ THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
16
+ IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
17
+ FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
18
+ AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
19
+ LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
20
+ OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
21
+ SOFTWARE.
@@ -0,0 +1,159 @@
1
+ Metadata-Version: 2.4
2
+ Name: PayPerTranscript
3
+ Version: 0.2.0
4
+ Summary: Open-Source Voice-to-Text mit Pay-per-Use Pricing
5
+ Author: PayPerTranscript Contributors
6
+ License-Expression: MIT
7
+ Project-URL: Homepage, https://github.com/jxnxts/PayPerTranscript
8
+ Classifier: Operating System :: Microsoft :: Windows
9
+ Classifier: Programming Language :: Python :: 3.12
10
+ Classifier: Topic :: Multimedia :: Sound/Audio :: Speech
11
+ Requires-Python: >=3.12
12
+ Description-Content-Type: text/markdown
13
+ License-File: LICENSE
14
+ Requires-Dist: PySide6
15
+ Requires-Dist: sounddevice
16
+ Requires-Dist: numpy
17
+ Requires-Dist: groq
18
+ Requires-Dist: pynput
19
+ Requires-Dist: pywin32
20
+ Requires-Dist: psutil
21
+ Requires-Dist: pyperclip
22
+ Requires-Dist: pyautogui
23
+ Requires-Dist: keyring
24
+ Requires-Dist: soundfile
25
+ Provides-Extra: dev
26
+ Requires-Dist: build; extra == "dev"
27
+ Requires-Dist: pytest; extra == "dev"
28
+ Dynamic: license-file
29
+
30
+ <p align="center">
31
+ <h1 align="center">PayPerTranscript</h1>
32
+ <p align="center">
33
+ Open-Source Voice-to-Text für Windows — Pay-per-Use statt Abo.
34
+ <br />
35
+ Hotkey drücken, sprechen, loslassen — Text erscheint an der Cursor-Position.
36
+ </p>
37
+ </p>
38
+
39
+ ---
40
+
41
+ ## Warum PayPerTranscript?
42
+
43
+ Kommerzielle Diktierdienste kosten $12–15 pro Monat — egal ob du sie 5 Minuten oder 5 Stunden nutzt.
44
+
45
+ PayPerTranscript nutzt Cloud-basierte KI-Modelle direkt über deinen eigenen API-Key. Du zahlst nur, was du tatsächlich verbrauchst: **~0.024 Cent pro Transkription**.
46
+
47
+ > 100 Transkriptionen kosten ca. 2.4 Cent. Ein kommerzielles Abo kostet dafür $15/Monat.
48
+
49
+ ---
50
+
51
+ ## Features
52
+
53
+ | Feature | Beschreibung |
54
+ |---------|-------------|
55
+ | **Hold-to-Record** | Hotkey halten, sprechen, loslassen — Text erscheint |
56
+ | **Toggle-Modus** | Alternativ: einmal drücken = Start, nochmal = Stop |
57
+ | **App-spezifische Formatierung** | Chat-Apps: locker. E-Mail: professionell. Per LLM, frei konfigurierbar. |
58
+ | **Wortliste** | Namen und Fachbegriffe immer korrekt transkribieren |
59
+ | **Kosten-Dashboard** | Jederzeit sehen, was verbraucht wurde |
60
+ | **Privatsphäre** | Dein API-Key, deine Daten. Keine Telemetrie, kein Tracking. |
61
+ | **Open Source** | MIT-Lizenz — vollständig transparent und erweiterbar |
62
+
63
+ ---
64
+
65
+ ## Installation
66
+
67
+ **Voraussetzungen:** Windows 10/11, Python 3.12+
68
+
69
+ ### Option 1: pip install (empfohlen)
70
+
71
+ ```bash
72
+ pip install paypertranscript
73
+ ```
74
+
75
+ Nach der Installation einfach starten:
76
+
77
+ ```bash
78
+ paypertranscript
79
+ ```
80
+
81
+ Beim ersten Start öffnet sich ein **Setup-Wizard**, der durch die Konfiguration führt.
82
+
83
+ ### Option 2: Aus dem Quellcode
84
+
85
+ ```bash
86
+ # Repository klonen
87
+ git clone https://github.com/jxnxts/PayPerTranscript.git
88
+ cd PayPerTranscript
89
+
90
+ # Virtuelle Umgebung erstellen & aktivieren
91
+ python -m venv venv
92
+ venv\Scripts\activate
93
+
94
+ # Im Entwicklungsmodus installieren
95
+ pip install -e .
96
+
97
+ # App starten
98
+ paypertranscript
99
+
100
+ # Oder mit Debug-Logging
101
+ python -m paypertranscript --debug
102
+ ```
103
+
104
+ ---
105
+
106
+ ## Nutzung
107
+
108
+ 1. **Hotkey halten** — `Ctrl+Win` gedrückt halten und sprechen
109
+ 2. **Loslassen** — die Aufnahme stoppt, Text wird transkribiert
110
+ 3. **Text erscheint** — direkt an der Cursor-Position eingefügt
111
+ 4. **Tray-Icon** — Rechtsklick für Einstellungen, Statistiken und mehr
112
+
113
+ ### Kosten
114
+
115
+ | Dienst | Preis |
116
+ |--------|-------|
117
+ | STT (Whisper) | $0.04 pro Stunde Audio (~0.01 Cent pro 10s) |
118
+ | LLM-Formatierung | ~$0.00002 pro Transkription (optional) |
119
+ | **Gesamt** | **~0.024 Cent pro Transkription** |
120
+
121
+ Alle Preise basieren auf GroqCloud-Tarifen. Du nutzt deinen eigenen API-Key — kein Abo, kein Mittelsmann.
122
+
123
+ ---
124
+
125
+ ## Konfiguration
126
+
127
+ Die gesamte Konfiguration ist über die grafische Oberfläche möglich:
128
+
129
+ - **Einstellungen** — Sprache, Hotkeys, API-Key, Overlay-Position
130
+ - **Wortliste** — Namen und Fachbegriffe für korrekte Transkription
131
+ - **Fenster-Zuordnung** — Welche App bekommt welchen Schreibstil (casual, professionell, ...)
132
+ - **Statistiken** — Kosten, Nutzung, Ersparnis gegenüber Abo-Diensten
133
+
134
+ Alle Daten werden lokal unter `%APPDATA%\PayPerTranscript\` gespeichert.
135
+
136
+ ---
137
+
138
+ ## FAQ
139
+
140
+ ### Text wird nicht in Admin-Fenster eingefügt
141
+
142
+ Windows blockiert Tastatureingaben von nicht-erhöhten Prozessen in erhöhte Fenster (UAC). Wenn du PayPerTranscript in Admin-Fenstern nutzen möchtest, starte die App als Administrator.
143
+
144
+ ### Mikrofon wird nicht erkannt
145
+
146
+ - Prüfe, ob ein Mikrofon angeschlossen und in den Windows-Soundeinstellungen aktiviert ist
147
+ - Prüfe die Datenschutz-Einstellungen: Windows-Einstellungen → Datenschutz → Mikrofon
148
+
149
+ ### Wie erhalte ich einen API-Key?
150
+
151
+ 1. Erstelle einen Account bei [GroqCloud](https://console.groq.com)
152
+ 2. Gehe zu API Keys → "Create API Key"
153
+ 3. Kopiere den Key und füge ihn im Setup-Wizard ein
154
+
155
+ ---
156
+
157
+ ## Lizenz
158
+
159
+ MIT — siehe [LICENSE](LICENSE)
@@ -0,0 +1,159 @@
1
+ Metadata-Version: 2.4
2
+ Name: PayPerTranscript
3
+ Version: 0.2.0
4
+ Summary: Open-Source Voice-to-Text mit Pay-per-Use Pricing
5
+ Author: PayPerTranscript Contributors
6
+ License-Expression: MIT
7
+ Project-URL: Homepage, https://github.com/jxnxts/PayPerTranscript
8
+ Classifier: Operating System :: Microsoft :: Windows
9
+ Classifier: Programming Language :: Python :: 3.12
10
+ Classifier: Topic :: Multimedia :: Sound/Audio :: Speech
11
+ Requires-Python: >=3.12
12
+ Description-Content-Type: text/markdown
13
+ License-File: LICENSE
14
+ Requires-Dist: PySide6
15
+ Requires-Dist: sounddevice
16
+ Requires-Dist: numpy
17
+ Requires-Dist: groq
18
+ Requires-Dist: pynput
19
+ Requires-Dist: pywin32
20
+ Requires-Dist: psutil
21
+ Requires-Dist: pyperclip
22
+ Requires-Dist: pyautogui
23
+ Requires-Dist: keyring
24
+ Requires-Dist: soundfile
25
+ Provides-Extra: dev
26
+ Requires-Dist: build; extra == "dev"
27
+ Requires-Dist: pytest; extra == "dev"
28
+ Dynamic: license-file
29
+
30
+ <p align="center">
31
+ <h1 align="center">PayPerTranscript</h1>
32
+ <p align="center">
33
+ Open-Source Voice-to-Text für Windows — Pay-per-Use statt Abo.
34
+ <br />
35
+ Hotkey drücken, sprechen, loslassen — Text erscheint an der Cursor-Position.
36
+ </p>
37
+ </p>
38
+
39
+ ---
40
+
41
+ ## Warum PayPerTranscript?
42
+
43
+ Kommerzielle Diktierdienste kosten $12–15 pro Monat — egal ob du sie 5 Minuten oder 5 Stunden nutzt.
44
+
45
+ PayPerTranscript nutzt Cloud-basierte KI-Modelle direkt über deinen eigenen API-Key. Du zahlst nur, was du tatsächlich verbrauchst: **~0.024 Cent pro Transkription**.
46
+
47
+ > 100 Transkriptionen kosten ca. 2.4 Cent. Ein kommerzielles Abo kostet dafür $15/Monat.
48
+
49
+ ---
50
+
51
+ ## Features
52
+
53
+ | Feature | Beschreibung |
54
+ |---------|-------------|
55
+ | **Hold-to-Record** | Hotkey halten, sprechen, loslassen — Text erscheint |
56
+ | **Toggle-Modus** | Alternativ: einmal drücken = Start, nochmal = Stop |
57
+ | **App-spezifische Formatierung** | Chat-Apps: locker. E-Mail: professionell. Per LLM, frei konfigurierbar. |
58
+ | **Wortliste** | Namen und Fachbegriffe immer korrekt transkribieren |
59
+ | **Kosten-Dashboard** | Jederzeit sehen, was verbraucht wurde |
60
+ | **Privatsphäre** | Dein API-Key, deine Daten. Keine Telemetrie, kein Tracking. |
61
+ | **Open Source** | MIT-Lizenz — vollständig transparent und erweiterbar |
62
+
63
+ ---
64
+
65
+ ## Installation
66
+
67
+ **Voraussetzungen:** Windows 10/11, Python 3.12+
68
+
69
+ ### Option 1: pip install (empfohlen)
70
+
71
+ ```bash
72
+ pip install paypertranscript
73
+ ```
74
+
75
+ Nach der Installation einfach starten:
76
+
77
+ ```bash
78
+ paypertranscript
79
+ ```
80
+
81
+ Beim ersten Start öffnet sich ein **Setup-Wizard**, der durch die Konfiguration führt.
82
+
83
+ ### Option 2: Aus dem Quellcode
84
+
85
+ ```bash
86
+ # Repository klonen
87
+ git clone https://github.com/jxnxts/PayPerTranscript.git
88
+ cd PayPerTranscript
89
+
90
+ # Virtuelle Umgebung erstellen & aktivieren
91
+ python -m venv venv
92
+ venv\Scripts\activate
93
+
94
+ # Im Entwicklungsmodus installieren
95
+ pip install -e .
96
+
97
+ # App starten
98
+ paypertranscript
99
+
100
+ # Oder mit Debug-Logging
101
+ python -m paypertranscript --debug
102
+ ```
103
+
104
+ ---
105
+
106
+ ## Nutzung
107
+
108
+ 1. **Hotkey halten** — `Ctrl+Win` gedrückt halten und sprechen
109
+ 2. **Loslassen** — die Aufnahme stoppt, Text wird transkribiert
110
+ 3. **Text erscheint** — direkt an der Cursor-Position eingefügt
111
+ 4. **Tray-Icon** — Rechtsklick für Einstellungen, Statistiken und mehr
112
+
113
+ ### Kosten
114
+
115
+ | Dienst | Preis |
116
+ |--------|-------|
117
+ | STT (Whisper) | $0.04 pro Stunde Audio (~0.01 Cent pro 10s) |
118
+ | LLM-Formatierung | ~$0.00002 pro Transkription (optional) |
119
+ | **Gesamt** | **~0.024 Cent pro Transkription** |
120
+
121
+ Alle Preise basieren auf GroqCloud-Tarifen. Du nutzt deinen eigenen API-Key — kein Abo, kein Mittelsmann.
122
+
123
+ ---
124
+
125
+ ## Konfiguration
126
+
127
+ Die gesamte Konfiguration ist über die grafische Oberfläche möglich:
128
+
129
+ - **Einstellungen** — Sprache, Hotkeys, API-Key, Overlay-Position
130
+ - **Wortliste** — Namen und Fachbegriffe für korrekte Transkription
131
+ - **Fenster-Zuordnung** — Welche App bekommt welchen Schreibstil (casual, professionell, ...)
132
+ - **Statistiken** — Kosten, Nutzung, Ersparnis gegenüber Abo-Diensten
133
+
134
+ Alle Daten werden lokal unter `%APPDATA%\PayPerTranscript\` gespeichert.
135
+
136
+ ---
137
+
138
+ ## FAQ
139
+
140
+ ### Text wird nicht in Admin-Fenster eingefügt
141
+
142
+ Windows blockiert Tastatureingaben von nicht-erhöhten Prozessen in erhöhte Fenster (UAC). Wenn du PayPerTranscript in Admin-Fenstern nutzen möchtest, starte die App als Administrator.
143
+
144
+ ### Mikrofon wird nicht erkannt
145
+
146
+ - Prüfe, ob ein Mikrofon angeschlossen und in den Windows-Soundeinstellungen aktiviert ist
147
+ - Prüfe die Datenschutz-Einstellungen: Windows-Einstellungen → Datenschutz → Mikrofon
148
+
149
+ ### Wie erhalte ich einen API-Key?
150
+
151
+ 1. Erstelle einen Account bei [GroqCloud](https://console.groq.com)
152
+ 2. Gehe zu API Keys → "Create API Key"
153
+ 3. Kopiere den Key und füge ihn im Setup-Wizard ein
154
+
155
+ ---
156
+
157
+ ## Lizenz
158
+
159
+ MIT — siehe [LICENSE](LICENSE)
@@ -0,0 +1,43 @@
1
+ LICENSE
2
+ README.md
3
+ pyproject.toml
4
+ PayPerTranscript.egg-info/PKG-INFO
5
+ PayPerTranscript.egg-info/SOURCES.txt
6
+ PayPerTranscript.egg-info/dependency_links.txt
7
+ PayPerTranscript.egg-info/entry_points.txt
8
+ PayPerTranscript.egg-info/requires.txt
9
+ PayPerTranscript.egg-info/top_level.txt
10
+ paypertranscript/__init__.py
11
+ paypertranscript/__main__.py
12
+ paypertranscript/assets/icons/app.ico
13
+ paypertranscript/assets/icons/app.png
14
+ paypertranscript/assets/icons/arrow_down.svg
15
+ paypertranscript/assets/sounds/start.wav
16
+ paypertranscript/assets/sounds/stop.wav
17
+ paypertranscript/assets/styles/dark.qss
18
+ paypertranscript/core/__init__.py
19
+ paypertranscript/core/audio_manager.py
20
+ paypertranscript/core/config.py
21
+ paypertranscript/core/cost_tracker.py
22
+ paypertranscript/core/hotkey.py
23
+ paypertranscript/core/logging.py
24
+ paypertranscript/core/paths.py
25
+ paypertranscript/core/recorder.py
26
+ paypertranscript/core/session_logger.py
27
+ paypertranscript/core/text_inserter.py
28
+ paypertranscript/core/window_detector.py
29
+ paypertranscript/pipeline/__init__.py
30
+ paypertranscript/pipeline/transcription.py
31
+ paypertranscript/providers/__init__.py
32
+ paypertranscript/providers/base.py
33
+ paypertranscript/providers/groq_provider.py
34
+ paypertranscript/ui/__init__.py
35
+ paypertranscript/ui/app.py
36
+ paypertranscript/ui/dashboard.py
37
+ paypertranscript/ui/overlay.py
38
+ paypertranscript/ui/settings.py
39
+ paypertranscript/ui/setup_wizard.py
40
+ paypertranscript/ui/statistics.py
41
+ paypertranscript/ui/tray.py
42
+ paypertranscript/ui/window_mapping.py
43
+ paypertranscript/ui/word_list.py
@@ -0,0 +1,2 @@
1
+ [gui_scripts]
2
+ paypertranscript = paypertranscript.__main__:main
@@ -0,0 +1,15 @@
1
+ PySide6
2
+ sounddevice
3
+ numpy
4
+ groq
5
+ pynput
6
+ pywin32
7
+ psutil
8
+ pyperclip
9
+ pyautogui
10
+ keyring
11
+ soundfile
12
+
13
+ [dev]
14
+ build
15
+ pytest
@@ -0,0 +1 @@
1
+ paypertranscript
@@ -0,0 +1,130 @@
1
+ <p align="center">
2
+ <h1 align="center">PayPerTranscript</h1>
3
+ <p align="center">
4
+ Open-Source Voice-to-Text für Windows — Pay-per-Use statt Abo.
5
+ <br />
6
+ Hotkey drücken, sprechen, loslassen — Text erscheint an der Cursor-Position.
7
+ </p>
8
+ </p>
9
+
10
+ ---
11
+
12
+ ## Warum PayPerTranscript?
13
+
14
+ Kommerzielle Diktierdienste kosten $12–15 pro Monat — egal ob du sie 5 Minuten oder 5 Stunden nutzt.
15
+
16
+ PayPerTranscript nutzt Cloud-basierte KI-Modelle direkt über deinen eigenen API-Key. Du zahlst nur, was du tatsächlich verbrauchst: **~0.024 Cent pro Transkription**.
17
+
18
+ > 100 Transkriptionen kosten ca. 2.4 Cent. Ein kommerzielles Abo kostet dafür $15/Monat.
19
+
20
+ ---
21
+
22
+ ## Features
23
+
24
+ | Feature | Beschreibung |
25
+ |---------|-------------|
26
+ | **Hold-to-Record** | Hotkey halten, sprechen, loslassen — Text erscheint |
27
+ | **Toggle-Modus** | Alternativ: einmal drücken = Start, nochmal = Stop |
28
+ | **App-spezifische Formatierung** | Chat-Apps: locker. E-Mail: professionell. Per LLM, frei konfigurierbar. |
29
+ | **Wortliste** | Namen und Fachbegriffe immer korrekt transkribieren |
30
+ | **Kosten-Dashboard** | Jederzeit sehen, was verbraucht wurde |
31
+ | **Privatsphäre** | Dein API-Key, deine Daten. Keine Telemetrie, kein Tracking. |
32
+ | **Open Source** | MIT-Lizenz — vollständig transparent und erweiterbar |
33
+
34
+ ---
35
+
36
+ ## Installation
37
+
38
+ **Voraussetzungen:** Windows 10/11, Python 3.12+
39
+
40
+ ### Option 1: pip install (empfohlen)
41
+
42
+ ```bash
43
+ pip install paypertranscript
44
+ ```
45
+
46
+ Nach der Installation einfach starten:
47
+
48
+ ```bash
49
+ paypertranscript
50
+ ```
51
+
52
+ Beim ersten Start öffnet sich ein **Setup-Wizard**, der durch die Konfiguration führt.
53
+
54
+ ### Option 2: Aus dem Quellcode
55
+
56
+ ```bash
57
+ # Repository klonen
58
+ git clone https://github.com/jxnxts/PayPerTranscript.git
59
+ cd PayPerTranscript
60
+
61
+ # Virtuelle Umgebung erstellen & aktivieren
62
+ python -m venv venv
63
+ venv\Scripts\activate
64
+
65
+ # Im Entwicklungsmodus installieren
66
+ pip install -e .
67
+
68
+ # App starten
69
+ paypertranscript
70
+
71
+ # Oder mit Debug-Logging
72
+ python -m paypertranscript --debug
73
+ ```
74
+
75
+ ---
76
+
77
+ ## Nutzung
78
+
79
+ 1. **Hotkey halten** — `Ctrl+Win` gedrückt halten und sprechen
80
+ 2. **Loslassen** — die Aufnahme stoppt, Text wird transkribiert
81
+ 3. **Text erscheint** — direkt an der Cursor-Position eingefügt
82
+ 4. **Tray-Icon** — Rechtsklick für Einstellungen, Statistiken und mehr
83
+
84
+ ### Kosten
85
+
86
+ | Dienst | Preis |
87
+ |--------|-------|
88
+ | STT (Whisper) | $0.04 pro Stunde Audio (~0.01 Cent pro 10s) |
89
+ | LLM-Formatierung | ~$0.00002 pro Transkription (optional) |
90
+ | **Gesamt** | **~0.024 Cent pro Transkription** |
91
+
92
+ Alle Preise basieren auf GroqCloud-Tarifen. Du nutzt deinen eigenen API-Key — kein Abo, kein Mittelsmann.
93
+
94
+ ---
95
+
96
+ ## Konfiguration
97
+
98
+ Die gesamte Konfiguration ist über die grafische Oberfläche möglich:
99
+
100
+ - **Einstellungen** — Sprache, Hotkeys, API-Key, Overlay-Position
101
+ - **Wortliste** — Namen und Fachbegriffe für korrekte Transkription
102
+ - **Fenster-Zuordnung** — Welche App bekommt welchen Schreibstil (casual, professionell, ...)
103
+ - **Statistiken** — Kosten, Nutzung, Ersparnis gegenüber Abo-Diensten
104
+
105
+ Alle Daten werden lokal unter `%APPDATA%\PayPerTranscript\` gespeichert.
106
+
107
+ ---
108
+
109
+ ## FAQ
110
+
111
+ ### Text wird nicht in Admin-Fenster eingefügt
112
+
113
+ Windows blockiert Tastatureingaben von nicht-erhöhten Prozessen in erhöhte Fenster (UAC). Wenn du PayPerTranscript in Admin-Fenstern nutzen möchtest, starte die App als Administrator.
114
+
115
+ ### Mikrofon wird nicht erkannt
116
+
117
+ - Prüfe, ob ein Mikrofon angeschlossen und in den Windows-Soundeinstellungen aktiviert ist
118
+ - Prüfe die Datenschutz-Einstellungen: Windows-Einstellungen → Datenschutz → Mikrofon
119
+
120
+ ### Wie erhalte ich einen API-Key?
121
+
122
+ 1. Erstelle einen Account bei [GroqCloud](https://console.groq.com)
123
+ 2. Gehe zu API Keys → "Create API Key"
124
+ 3. Kopiere den Key und füge ihn im Setup-Wizard ein
125
+
126
+ ---
127
+
128
+ ## Lizenz
129
+
130
+ MIT — siehe [LICENSE](LICENSE)
@@ -0,0 +1,3 @@
1
+ """PayPerTranscript — Voice-to-Text mit Pay-per-Use Pricing."""
2
+
3
+ __version__ = "0.2.0"
@@ -0,0 +1,51 @@
1
+ """PayPerTranscript — Entry Point.
2
+
3
+ Open-Source Voice-to-Text mit Pay-per-Use Pricing.
4
+ Supports: python -m paypertranscript
5
+ """
6
+
7
+ import ctypes
8
+ import os
9
+ import sys
10
+ from pathlib import Path
11
+
12
+ # DPI-Awareness setzen BEVOR Qt oder andere Libraries es tun.
13
+ # Verhindert "SetProcessDpiAwarenessContext() failed: Zugriff verweigert".
14
+ try:
15
+ ctypes.windll.user32.SetProcessDpiAwarenessContext(ctypes.c_void_p(-4))
16
+ except Exception:
17
+ pass
18
+
19
+
20
+ def _load_dotenv() -> None:
21
+ """Laedt .env-Datei aus dem Arbeitsverzeichnis (falls vorhanden)."""
22
+ env_file = Path.cwd() / ".env"
23
+ if not env_file.exists():
24
+ return
25
+ for line in env_file.read_text(encoding="utf-8").splitlines():
26
+ line = line.strip()
27
+ if not line or line.startswith("#") or "=" not in line:
28
+ continue
29
+ key, _, value = line.partition("=")
30
+ key = key.strip()
31
+ value = value.strip().strip("'\"")
32
+ if key and key not in os.environ:
33
+ os.environ[key] = value
34
+
35
+
36
+ def main() -> None:
37
+ """Hauptfunktion — initialisiert Logging und startet die PySide6-App."""
38
+ _load_dotenv()
39
+
40
+ from paypertranscript.core.logging import setup_logging
41
+
42
+ setup_logging(debug="--debug" in sys.argv)
43
+
44
+ from paypertranscript.ui.app import PayPerTranscriptApp
45
+
46
+ app = PayPerTranscriptApp()
47
+ sys.exit(app.run())
48
+
49
+
50
+ if __name__ == "__main__":
51
+ main()
@@ -0,0 +1,3 @@
1
+ <svg xmlns="http://www.w3.org/2000/svg" width="10" height="6" viewBox="0 0 10 6">
2
+ <path d="M0 0 L5 6 L10 0Z" fill="#a0a0a0"/>
3
+ </svg>