PayPerTranscript 0.2.0__tar.gz
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- paypertranscript-0.2.0/LICENSE +21 -0
- paypertranscript-0.2.0/PKG-INFO +159 -0
- paypertranscript-0.2.0/PayPerTranscript.egg-info/PKG-INFO +159 -0
- paypertranscript-0.2.0/PayPerTranscript.egg-info/SOURCES.txt +43 -0
- paypertranscript-0.2.0/PayPerTranscript.egg-info/dependency_links.txt +1 -0
- paypertranscript-0.2.0/PayPerTranscript.egg-info/entry_points.txt +2 -0
- paypertranscript-0.2.0/PayPerTranscript.egg-info/requires.txt +15 -0
- paypertranscript-0.2.0/PayPerTranscript.egg-info/top_level.txt +1 -0
- paypertranscript-0.2.0/README.md +130 -0
- paypertranscript-0.2.0/paypertranscript/__init__.py +3 -0
- paypertranscript-0.2.0/paypertranscript/__main__.py +51 -0
- paypertranscript-0.2.0/paypertranscript/assets/icons/app.ico +0 -0
- paypertranscript-0.2.0/paypertranscript/assets/icons/app.png +0 -0
- paypertranscript-0.2.0/paypertranscript/assets/icons/arrow_down.svg +3 -0
- paypertranscript-0.2.0/paypertranscript/assets/sounds/start.wav +0 -0
- paypertranscript-0.2.0/paypertranscript/assets/sounds/stop.wav +0 -0
- paypertranscript-0.2.0/paypertranscript/assets/styles/dark.qss +388 -0
- paypertranscript-0.2.0/paypertranscript/core/__init__.py +0 -0
- paypertranscript-0.2.0/paypertranscript/core/audio_manager.py +142 -0
- paypertranscript-0.2.0/paypertranscript/core/config.py +360 -0
- paypertranscript-0.2.0/paypertranscript/core/cost_tracker.py +87 -0
- paypertranscript-0.2.0/paypertranscript/core/hotkey.py +294 -0
- paypertranscript-0.2.0/paypertranscript/core/logging.py +65 -0
- paypertranscript-0.2.0/paypertranscript/core/paths.py +28 -0
- paypertranscript-0.2.0/paypertranscript/core/recorder.py +167 -0
- paypertranscript-0.2.0/paypertranscript/core/session_logger.py +138 -0
- paypertranscript-0.2.0/paypertranscript/core/text_inserter.py +131 -0
- paypertranscript-0.2.0/paypertranscript/core/window_detector.py +58 -0
- paypertranscript-0.2.0/paypertranscript/pipeline/__init__.py +0 -0
- paypertranscript-0.2.0/paypertranscript/pipeline/transcription.py +361 -0
- paypertranscript-0.2.0/paypertranscript/providers/__init__.py +85 -0
- paypertranscript-0.2.0/paypertranscript/providers/base.py +78 -0
- paypertranscript-0.2.0/paypertranscript/providers/groq_provider.py +182 -0
- paypertranscript-0.2.0/paypertranscript/ui/__init__.py +0 -0
- paypertranscript-0.2.0/paypertranscript/ui/app.py +370 -0
- paypertranscript-0.2.0/paypertranscript/ui/dashboard.py +92 -0
- paypertranscript-0.2.0/paypertranscript/ui/overlay.py +396 -0
- paypertranscript-0.2.0/paypertranscript/ui/settings.py +550 -0
- paypertranscript-0.2.0/paypertranscript/ui/setup_wizard.py +690 -0
- paypertranscript-0.2.0/paypertranscript/ui/statistics.py +412 -0
- paypertranscript-0.2.0/paypertranscript/ui/tray.py +256 -0
- paypertranscript-0.2.0/paypertranscript/ui/window_mapping.py +460 -0
- paypertranscript-0.2.0/paypertranscript/ui/word_list.py +183 -0
- paypertranscript-0.2.0/pyproject.toml +57 -0
- paypertranscript-0.2.0/setup.cfg +4 -0
|
@@ -0,0 +1,21 @@
|
|
|
1
|
+
MIT License
|
|
2
|
+
|
|
3
|
+
Copyright (c) 2026 PayPerTranscript Contributors
|
|
4
|
+
|
|
5
|
+
Permission is hereby granted, free of charge, to any person obtaining a copy
|
|
6
|
+
of this software and associated documentation files (the "Software"), to deal
|
|
7
|
+
in the Software without restriction, including without limitation the rights
|
|
8
|
+
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
|
|
9
|
+
copies of the Software, and to permit persons to whom the Software is
|
|
10
|
+
furnished to do so, subject to the following conditions:
|
|
11
|
+
|
|
12
|
+
The above copyright notice and this permission notice shall be included in all
|
|
13
|
+
copies or substantial portions of the Software.
|
|
14
|
+
|
|
15
|
+
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
|
|
16
|
+
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
|
|
17
|
+
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
|
|
18
|
+
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
|
|
19
|
+
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
|
|
20
|
+
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
|
|
21
|
+
SOFTWARE.
|
|
@@ -0,0 +1,159 @@
|
|
|
1
|
+
Metadata-Version: 2.4
|
|
2
|
+
Name: PayPerTranscript
|
|
3
|
+
Version: 0.2.0
|
|
4
|
+
Summary: Open-Source Voice-to-Text mit Pay-per-Use Pricing
|
|
5
|
+
Author: PayPerTranscript Contributors
|
|
6
|
+
License-Expression: MIT
|
|
7
|
+
Project-URL: Homepage, https://github.com/jxnxts/PayPerTranscript
|
|
8
|
+
Classifier: Operating System :: Microsoft :: Windows
|
|
9
|
+
Classifier: Programming Language :: Python :: 3.12
|
|
10
|
+
Classifier: Topic :: Multimedia :: Sound/Audio :: Speech
|
|
11
|
+
Requires-Python: >=3.12
|
|
12
|
+
Description-Content-Type: text/markdown
|
|
13
|
+
License-File: LICENSE
|
|
14
|
+
Requires-Dist: PySide6
|
|
15
|
+
Requires-Dist: sounddevice
|
|
16
|
+
Requires-Dist: numpy
|
|
17
|
+
Requires-Dist: groq
|
|
18
|
+
Requires-Dist: pynput
|
|
19
|
+
Requires-Dist: pywin32
|
|
20
|
+
Requires-Dist: psutil
|
|
21
|
+
Requires-Dist: pyperclip
|
|
22
|
+
Requires-Dist: pyautogui
|
|
23
|
+
Requires-Dist: keyring
|
|
24
|
+
Requires-Dist: soundfile
|
|
25
|
+
Provides-Extra: dev
|
|
26
|
+
Requires-Dist: build; extra == "dev"
|
|
27
|
+
Requires-Dist: pytest; extra == "dev"
|
|
28
|
+
Dynamic: license-file
|
|
29
|
+
|
|
30
|
+
<p align="center">
|
|
31
|
+
<h1 align="center">PayPerTranscript</h1>
|
|
32
|
+
<p align="center">
|
|
33
|
+
Open-Source Voice-to-Text für Windows — Pay-per-Use statt Abo.
|
|
34
|
+
<br />
|
|
35
|
+
Hotkey drücken, sprechen, loslassen — Text erscheint an der Cursor-Position.
|
|
36
|
+
</p>
|
|
37
|
+
</p>
|
|
38
|
+
|
|
39
|
+
---
|
|
40
|
+
|
|
41
|
+
## Warum PayPerTranscript?
|
|
42
|
+
|
|
43
|
+
Kommerzielle Diktierdienste kosten $12–15 pro Monat — egal ob du sie 5 Minuten oder 5 Stunden nutzt.
|
|
44
|
+
|
|
45
|
+
PayPerTranscript nutzt Cloud-basierte KI-Modelle direkt über deinen eigenen API-Key. Du zahlst nur, was du tatsächlich verbrauchst: **~0.024 Cent pro Transkription**.
|
|
46
|
+
|
|
47
|
+
> 100 Transkriptionen kosten ca. 2.4 Cent. Ein kommerzielles Abo kostet dafür $15/Monat.
|
|
48
|
+
|
|
49
|
+
---
|
|
50
|
+
|
|
51
|
+
## Features
|
|
52
|
+
|
|
53
|
+
| Feature | Beschreibung |
|
|
54
|
+
|---------|-------------|
|
|
55
|
+
| **Hold-to-Record** | Hotkey halten, sprechen, loslassen — Text erscheint |
|
|
56
|
+
| **Toggle-Modus** | Alternativ: einmal drücken = Start, nochmal = Stop |
|
|
57
|
+
| **App-spezifische Formatierung** | Chat-Apps: locker. E-Mail: professionell. Per LLM, frei konfigurierbar. |
|
|
58
|
+
| **Wortliste** | Namen und Fachbegriffe immer korrekt transkribieren |
|
|
59
|
+
| **Kosten-Dashboard** | Jederzeit sehen, was verbraucht wurde |
|
|
60
|
+
| **Privatsphäre** | Dein API-Key, deine Daten. Keine Telemetrie, kein Tracking. |
|
|
61
|
+
| **Open Source** | MIT-Lizenz — vollständig transparent und erweiterbar |
|
|
62
|
+
|
|
63
|
+
---
|
|
64
|
+
|
|
65
|
+
## Installation
|
|
66
|
+
|
|
67
|
+
**Voraussetzungen:** Windows 10/11, Python 3.12+
|
|
68
|
+
|
|
69
|
+
### Option 1: pip install (empfohlen)
|
|
70
|
+
|
|
71
|
+
```bash
|
|
72
|
+
pip install paypertranscript
|
|
73
|
+
```
|
|
74
|
+
|
|
75
|
+
Nach der Installation einfach starten:
|
|
76
|
+
|
|
77
|
+
```bash
|
|
78
|
+
paypertranscript
|
|
79
|
+
```
|
|
80
|
+
|
|
81
|
+
Beim ersten Start öffnet sich ein **Setup-Wizard**, der durch die Konfiguration führt.
|
|
82
|
+
|
|
83
|
+
### Option 2: Aus dem Quellcode
|
|
84
|
+
|
|
85
|
+
```bash
|
|
86
|
+
# Repository klonen
|
|
87
|
+
git clone https://github.com/jxnxts/PayPerTranscript.git
|
|
88
|
+
cd PayPerTranscript
|
|
89
|
+
|
|
90
|
+
# Virtuelle Umgebung erstellen & aktivieren
|
|
91
|
+
python -m venv venv
|
|
92
|
+
venv\Scripts\activate
|
|
93
|
+
|
|
94
|
+
# Im Entwicklungsmodus installieren
|
|
95
|
+
pip install -e .
|
|
96
|
+
|
|
97
|
+
# App starten
|
|
98
|
+
paypertranscript
|
|
99
|
+
|
|
100
|
+
# Oder mit Debug-Logging
|
|
101
|
+
python -m paypertranscript --debug
|
|
102
|
+
```
|
|
103
|
+
|
|
104
|
+
---
|
|
105
|
+
|
|
106
|
+
## Nutzung
|
|
107
|
+
|
|
108
|
+
1. **Hotkey halten** — `Ctrl+Win` gedrückt halten und sprechen
|
|
109
|
+
2. **Loslassen** — die Aufnahme stoppt, Text wird transkribiert
|
|
110
|
+
3. **Text erscheint** — direkt an der Cursor-Position eingefügt
|
|
111
|
+
4. **Tray-Icon** — Rechtsklick für Einstellungen, Statistiken und mehr
|
|
112
|
+
|
|
113
|
+
### Kosten
|
|
114
|
+
|
|
115
|
+
| Dienst | Preis |
|
|
116
|
+
|--------|-------|
|
|
117
|
+
| STT (Whisper) | $0.04 pro Stunde Audio (~0.01 Cent pro 10s) |
|
|
118
|
+
| LLM-Formatierung | ~$0.00002 pro Transkription (optional) |
|
|
119
|
+
| **Gesamt** | **~0.024 Cent pro Transkription** |
|
|
120
|
+
|
|
121
|
+
Alle Preise basieren auf GroqCloud-Tarifen. Du nutzt deinen eigenen API-Key — kein Abo, kein Mittelsmann.
|
|
122
|
+
|
|
123
|
+
---
|
|
124
|
+
|
|
125
|
+
## Konfiguration
|
|
126
|
+
|
|
127
|
+
Die gesamte Konfiguration ist über die grafische Oberfläche möglich:
|
|
128
|
+
|
|
129
|
+
- **Einstellungen** — Sprache, Hotkeys, API-Key, Overlay-Position
|
|
130
|
+
- **Wortliste** — Namen und Fachbegriffe für korrekte Transkription
|
|
131
|
+
- **Fenster-Zuordnung** — Welche App bekommt welchen Schreibstil (casual, professionell, ...)
|
|
132
|
+
- **Statistiken** — Kosten, Nutzung, Ersparnis gegenüber Abo-Diensten
|
|
133
|
+
|
|
134
|
+
Alle Daten werden lokal unter `%APPDATA%\PayPerTranscript\` gespeichert.
|
|
135
|
+
|
|
136
|
+
---
|
|
137
|
+
|
|
138
|
+
## FAQ
|
|
139
|
+
|
|
140
|
+
### Text wird nicht in Admin-Fenster eingefügt
|
|
141
|
+
|
|
142
|
+
Windows blockiert Tastatureingaben von nicht-erhöhten Prozessen in erhöhte Fenster (UAC). Wenn du PayPerTranscript in Admin-Fenstern nutzen möchtest, starte die App als Administrator.
|
|
143
|
+
|
|
144
|
+
### Mikrofon wird nicht erkannt
|
|
145
|
+
|
|
146
|
+
- Prüfe, ob ein Mikrofon angeschlossen und in den Windows-Soundeinstellungen aktiviert ist
|
|
147
|
+
- Prüfe die Datenschutz-Einstellungen: Windows-Einstellungen → Datenschutz → Mikrofon
|
|
148
|
+
|
|
149
|
+
### Wie erhalte ich einen API-Key?
|
|
150
|
+
|
|
151
|
+
1. Erstelle einen Account bei [GroqCloud](https://console.groq.com)
|
|
152
|
+
2. Gehe zu API Keys → "Create API Key"
|
|
153
|
+
3. Kopiere den Key und füge ihn im Setup-Wizard ein
|
|
154
|
+
|
|
155
|
+
---
|
|
156
|
+
|
|
157
|
+
## Lizenz
|
|
158
|
+
|
|
159
|
+
MIT — siehe [LICENSE](LICENSE)
|
|
@@ -0,0 +1,159 @@
|
|
|
1
|
+
Metadata-Version: 2.4
|
|
2
|
+
Name: PayPerTranscript
|
|
3
|
+
Version: 0.2.0
|
|
4
|
+
Summary: Open-Source Voice-to-Text mit Pay-per-Use Pricing
|
|
5
|
+
Author: PayPerTranscript Contributors
|
|
6
|
+
License-Expression: MIT
|
|
7
|
+
Project-URL: Homepage, https://github.com/jxnxts/PayPerTranscript
|
|
8
|
+
Classifier: Operating System :: Microsoft :: Windows
|
|
9
|
+
Classifier: Programming Language :: Python :: 3.12
|
|
10
|
+
Classifier: Topic :: Multimedia :: Sound/Audio :: Speech
|
|
11
|
+
Requires-Python: >=3.12
|
|
12
|
+
Description-Content-Type: text/markdown
|
|
13
|
+
License-File: LICENSE
|
|
14
|
+
Requires-Dist: PySide6
|
|
15
|
+
Requires-Dist: sounddevice
|
|
16
|
+
Requires-Dist: numpy
|
|
17
|
+
Requires-Dist: groq
|
|
18
|
+
Requires-Dist: pynput
|
|
19
|
+
Requires-Dist: pywin32
|
|
20
|
+
Requires-Dist: psutil
|
|
21
|
+
Requires-Dist: pyperclip
|
|
22
|
+
Requires-Dist: pyautogui
|
|
23
|
+
Requires-Dist: keyring
|
|
24
|
+
Requires-Dist: soundfile
|
|
25
|
+
Provides-Extra: dev
|
|
26
|
+
Requires-Dist: build; extra == "dev"
|
|
27
|
+
Requires-Dist: pytest; extra == "dev"
|
|
28
|
+
Dynamic: license-file
|
|
29
|
+
|
|
30
|
+
<p align="center">
|
|
31
|
+
<h1 align="center">PayPerTranscript</h1>
|
|
32
|
+
<p align="center">
|
|
33
|
+
Open-Source Voice-to-Text für Windows — Pay-per-Use statt Abo.
|
|
34
|
+
<br />
|
|
35
|
+
Hotkey drücken, sprechen, loslassen — Text erscheint an der Cursor-Position.
|
|
36
|
+
</p>
|
|
37
|
+
</p>
|
|
38
|
+
|
|
39
|
+
---
|
|
40
|
+
|
|
41
|
+
## Warum PayPerTranscript?
|
|
42
|
+
|
|
43
|
+
Kommerzielle Diktierdienste kosten $12–15 pro Monat — egal ob du sie 5 Minuten oder 5 Stunden nutzt.
|
|
44
|
+
|
|
45
|
+
PayPerTranscript nutzt Cloud-basierte KI-Modelle direkt über deinen eigenen API-Key. Du zahlst nur, was du tatsächlich verbrauchst: **~0.024 Cent pro Transkription**.
|
|
46
|
+
|
|
47
|
+
> 100 Transkriptionen kosten ca. 2.4 Cent. Ein kommerzielles Abo kostet dafür $15/Monat.
|
|
48
|
+
|
|
49
|
+
---
|
|
50
|
+
|
|
51
|
+
## Features
|
|
52
|
+
|
|
53
|
+
| Feature | Beschreibung |
|
|
54
|
+
|---------|-------------|
|
|
55
|
+
| **Hold-to-Record** | Hotkey halten, sprechen, loslassen — Text erscheint |
|
|
56
|
+
| **Toggle-Modus** | Alternativ: einmal drücken = Start, nochmal = Stop |
|
|
57
|
+
| **App-spezifische Formatierung** | Chat-Apps: locker. E-Mail: professionell. Per LLM, frei konfigurierbar. |
|
|
58
|
+
| **Wortliste** | Namen und Fachbegriffe immer korrekt transkribieren |
|
|
59
|
+
| **Kosten-Dashboard** | Jederzeit sehen, was verbraucht wurde |
|
|
60
|
+
| **Privatsphäre** | Dein API-Key, deine Daten. Keine Telemetrie, kein Tracking. |
|
|
61
|
+
| **Open Source** | MIT-Lizenz — vollständig transparent und erweiterbar |
|
|
62
|
+
|
|
63
|
+
---
|
|
64
|
+
|
|
65
|
+
## Installation
|
|
66
|
+
|
|
67
|
+
**Voraussetzungen:** Windows 10/11, Python 3.12+
|
|
68
|
+
|
|
69
|
+
### Option 1: pip install (empfohlen)
|
|
70
|
+
|
|
71
|
+
```bash
|
|
72
|
+
pip install paypertranscript
|
|
73
|
+
```
|
|
74
|
+
|
|
75
|
+
Nach der Installation einfach starten:
|
|
76
|
+
|
|
77
|
+
```bash
|
|
78
|
+
paypertranscript
|
|
79
|
+
```
|
|
80
|
+
|
|
81
|
+
Beim ersten Start öffnet sich ein **Setup-Wizard**, der durch die Konfiguration führt.
|
|
82
|
+
|
|
83
|
+
### Option 2: Aus dem Quellcode
|
|
84
|
+
|
|
85
|
+
```bash
|
|
86
|
+
# Repository klonen
|
|
87
|
+
git clone https://github.com/jxnxts/PayPerTranscript.git
|
|
88
|
+
cd PayPerTranscript
|
|
89
|
+
|
|
90
|
+
# Virtuelle Umgebung erstellen & aktivieren
|
|
91
|
+
python -m venv venv
|
|
92
|
+
venv\Scripts\activate
|
|
93
|
+
|
|
94
|
+
# Im Entwicklungsmodus installieren
|
|
95
|
+
pip install -e .
|
|
96
|
+
|
|
97
|
+
# App starten
|
|
98
|
+
paypertranscript
|
|
99
|
+
|
|
100
|
+
# Oder mit Debug-Logging
|
|
101
|
+
python -m paypertranscript --debug
|
|
102
|
+
```
|
|
103
|
+
|
|
104
|
+
---
|
|
105
|
+
|
|
106
|
+
## Nutzung
|
|
107
|
+
|
|
108
|
+
1. **Hotkey halten** — `Ctrl+Win` gedrückt halten und sprechen
|
|
109
|
+
2. **Loslassen** — die Aufnahme stoppt, Text wird transkribiert
|
|
110
|
+
3. **Text erscheint** — direkt an der Cursor-Position eingefügt
|
|
111
|
+
4. **Tray-Icon** — Rechtsklick für Einstellungen, Statistiken und mehr
|
|
112
|
+
|
|
113
|
+
### Kosten
|
|
114
|
+
|
|
115
|
+
| Dienst | Preis |
|
|
116
|
+
|--------|-------|
|
|
117
|
+
| STT (Whisper) | $0.04 pro Stunde Audio (~0.01 Cent pro 10s) |
|
|
118
|
+
| LLM-Formatierung | ~$0.00002 pro Transkription (optional) |
|
|
119
|
+
| **Gesamt** | **~0.024 Cent pro Transkription** |
|
|
120
|
+
|
|
121
|
+
Alle Preise basieren auf GroqCloud-Tarifen. Du nutzt deinen eigenen API-Key — kein Abo, kein Mittelsmann.
|
|
122
|
+
|
|
123
|
+
---
|
|
124
|
+
|
|
125
|
+
## Konfiguration
|
|
126
|
+
|
|
127
|
+
Die gesamte Konfiguration ist über die grafische Oberfläche möglich:
|
|
128
|
+
|
|
129
|
+
- **Einstellungen** — Sprache, Hotkeys, API-Key, Overlay-Position
|
|
130
|
+
- **Wortliste** — Namen und Fachbegriffe für korrekte Transkription
|
|
131
|
+
- **Fenster-Zuordnung** — Welche App bekommt welchen Schreibstil (casual, professionell, ...)
|
|
132
|
+
- **Statistiken** — Kosten, Nutzung, Ersparnis gegenüber Abo-Diensten
|
|
133
|
+
|
|
134
|
+
Alle Daten werden lokal unter `%APPDATA%\PayPerTranscript\` gespeichert.
|
|
135
|
+
|
|
136
|
+
---
|
|
137
|
+
|
|
138
|
+
## FAQ
|
|
139
|
+
|
|
140
|
+
### Text wird nicht in Admin-Fenster eingefügt
|
|
141
|
+
|
|
142
|
+
Windows blockiert Tastatureingaben von nicht-erhöhten Prozessen in erhöhte Fenster (UAC). Wenn du PayPerTranscript in Admin-Fenstern nutzen möchtest, starte die App als Administrator.
|
|
143
|
+
|
|
144
|
+
### Mikrofon wird nicht erkannt
|
|
145
|
+
|
|
146
|
+
- Prüfe, ob ein Mikrofon angeschlossen und in den Windows-Soundeinstellungen aktiviert ist
|
|
147
|
+
- Prüfe die Datenschutz-Einstellungen: Windows-Einstellungen → Datenschutz → Mikrofon
|
|
148
|
+
|
|
149
|
+
### Wie erhalte ich einen API-Key?
|
|
150
|
+
|
|
151
|
+
1. Erstelle einen Account bei [GroqCloud](https://console.groq.com)
|
|
152
|
+
2. Gehe zu API Keys → "Create API Key"
|
|
153
|
+
3. Kopiere den Key und füge ihn im Setup-Wizard ein
|
|
154
|
+
|
|
155
|
+
---
|
|
156
|
+
|
|
157
|
+
## Lizenz
|
|
158
|
+
|
|
159
|
+
MIT — siehe [LICENSE](LICENSE)
|
|
@@ -0,0 +1,43 @@
|
|
|
1
|
+
LICENSE
|
|
2
|
+
README.md
|
|
3
|
+
pyproject.toml
|
|
4
|
+
PayPerTranscript.egg-info/PKG-INFO
|
|
5
|
+
PayPerTranscript.egg-info/SOURCES.txt
|
|
6
|
+
PayPerTranscript.egg-info/dependency_links.txt
|
|
7
|
+
PayPerTranscript.egg-info/entry_points.txt
|
|
8
|
+
PayPerTranscript.egg-info/requires.txt
|
|
9
|
+
PayPerTranscript.egg-info/top_level.txt
|
|
10
|
+
paypertranscript/__init__.py
|
|
11
|
+
paypertranscript/__main__.py
|
|
12
|
+
paypertranscript/assets/icons/app.ico
|
|
13
|
+
paypertranscript/assets/icons/app.png
|
|
14
|
+
paypertranscript/assets/icons/arrow_down.svg
|
|
15
|
+
paypertranscript/assets/sounds/start.wav
|
|
16
|
+
paypertranscript/assets/sounds/stop.wav
|
|
17
|
+
paypertranscript/assets/styles/dark.qss
|
|
18
|
+
paypertranscript/core/__init__.py
|
|
19
|
+
paypertranscript/core/audio_manager.py
|
|
20
|
+
paypertranscript/core/config.py
|
|
21
|
+
paypertranscript/core/cost_tracker.py
|
|
22
|
+
paypertranscript/core/hotkey.py
|
|
23
|
+
paypertranscript/core/logging.py
|
|
24
|
+
paypertranscript/core/paths.py
|
|
25
|
+
paypertranscript/core/recorder.py
|
|
26
|
+
paypertranscript/core/session_logger.py
|
|
27
|
+
paypertranscript/core/text_inserter.py
|
|
28
|
+
paypertranscript/core/window_detector.py
|
|
29
|
+
paypertranscript/pipeline/__init__.py
|
|
30
|
+
paypertranscript/pipeline/transcription.py
|
|
31
|
+
paypertranscript/providers/__init__.py
|
|
32
|
+
paypertranscript/providers/base.py
|
|
33
|
+
paypertranscript/providers/groq_provider.py
|
|
34
|
+
paypertranscript/ui/__init__.py
|
|
35
|
+
paypertranscript/ui/app.py
|
|
36
|
+
paypertranscript/ui/dashboard.py
|
|
37
|
+
paypertranscript/ui/overlay.py
|
|
38
|
+
paypertranscript/ui/settings.py
|
|
39
|
+
paypertranscript/ui/setup_wizard.py
|
|
40
|
+
paypertranscript/ui/statistics.py
|
|
41
|
+
paypertranscript/ui/tray.py
|
|
42
|
+
paypertranscript/ui/window_mapping.py
|
|
43
|
+
paypertranscript/ui/word_list.py
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
paypertranscript
|
|
@@ -0,0 +1,130 @@
|
|
|
1
|
+
<p align="center">
|
|
2
|
+
<h1 align="center">PayPerTranscript</h1>
|
|
3
|
+
<p align="center">
|
|
4
|
+
Open-Source Voice-to-Text für Windows — Pay-per-Use statt Abo.
|
|
5
|
+
<br />
|
|
6
|
+
Hotkey drücken, sprechen, loslassen — Text erscheint an der Cursor-Position.
|
|
7
|
+
</p>
|
|
8
|
+
</p>
|
|
9
|
+
|
|
10
|
+
---
|
|
11
|
+
|
|
12
|
+
## Warum PayPerTranscript?
|
|
13
|
+
|
|
14
|
+
Kommerzielle Diktierdienste kosten $12–15 pro Monat — egal ob du sie 5 Minuten oder 5 Stunden nutzt.
|
|
15
|
+
|
|
16
|
+
PayPerTranscript nutzt Cloud-basierte KI-Modelle direkt über deinen eigenen API-Key. Du zahlst nur, was du tatsächlich verbrauchst: **~0.024 Cent pro Transkription**.
|
|
17
|
+
|
|
18
|
+
> 100 Transkriptionen kosten ca. 2.4 Cent. Ein kommerzielles Abo kostet dafür $15/Monat.
|
|
19
|
+
|
|
20
|
+
---
|
|
21
|
+
|
|
22
|
+
## Features
|
|
23
|
+
|
|
24
|
+
| Feature | Beschreibung |
|
|
25
|
+
|---------|-------------|
|
|
26
|
+
| **Hold-to-Record** | Hotkey halten, sprechen, loslassen — Text erscheint |
|
|
27
|
+
| **Toggle-Modus** | Alternativ: einmal drücken = Start, nochmal = Stop |
|
|
28
|
+
| **App-spezifische Formatierung** | Chat-Apps: locker. E-Mail: professionell. Per LLM, frei konfigurierbar. |
|
|
29
|
+
| **Wortliste** | Namen und Fachbegriffe immer korrekt transkribieren |
|
|
30
|
+
| **Kosten-Dashboard** | Jederzeit sehen, was verbraucht wurde |
|
|
31
|
+
| **Privatsphäre** | Dein API-Key, deine Daten. Keine Telemetrie, kein Tracking. |
|
|
32
|
+
| **Open Source** | MIT-Lizenz — vollständig transparent und erweiterbar |
|
|
33
|
+
|
|
34
|
+
---
|
|
35
|
+
|
|
36
|
+
## Installation
|
|
37
|
+
|
|
38
|
+
**Voraussetzungen:** Windows 10/11, Python 3.12+
|
|
39
|
+
|
|
40
|
+
### Option 1: pip install (empfohlen)
|
|
41
|
+
|
|
42
|
+
```bash
|
|
43
|
+
pip install paypertranscript
|
|
44
|
+
```
|
|
45
|
+
|
|
46
|
+
Nach der Installation einfach starten:
|
|
47
|
+
|
|
48
|
+
```bash
|
|
49
|
+
paypertranscript
|
|
50
|
+
```
|
|
51
|
+
|
|
52
|
+
Beim ersten Start öffnet sich ein **Setup-Wizard**, der durch die Konfiguration führt.
|
|
53
|
+
|
|
54
|
+
### Option 2: Aus dem Quellcode
|
|
55
|
+
|
|
56
|
+
```bash
|
|
57
|
+
# Repository klonen
|
|
58
|
+
git clone https://github.com/jxnxts/PayPerTranscript.git
|
|
59
|
+
cd PayPerTranscript
|
|
60
|
+
|
|
61
|
+
# Virtuelle Umgebung erstellen & aktivieren
|
|
62
|
+
python -m venv venv
|
|
63
|
+
venv\Scripts\activate
|
|
64
|
+
|
|
65
|
+
# Im Entwicklungsmodus installieren
|
|
66
|
+
pip install -e .
|
|
67
|
+
|
|
68
|
+
# App starten
|
|
69
|
+
paypertranscript
|
|
70
|
+
|
|
71
|
+
# Oder mit Debug-Logging
|
|
72
|
+
python -m paypertranscript --debug
|
|
73
|
+
```
|
|
74
|
+
|
|
75
|
+
---
|
|
76
|
+
|
|
77
|
+
## Nutzung
|
|
78
|
+
|
|
79
|
+
1. **Hotkey halten** — `Ctrl+Win` gedrückt halten und sprechen
|
|
80
|
+
2. **Loslassen** — die Aufnahme stoppt, Text wird transkribiert
|
|
81
|
+
3. **Text erscheint** — direkt an der Cursor-Position eingefügt
|
|
82
|
+
4. **Tray-Icon** — Rechtsklick für Einstellungen, Statistiken und mehr
|
|
83
|
+
|
|
84
|
+
### Kosten
|
|
85
|
+
|
|
86
|
+
| Dienst | Preis |
|
|
87
|
+
|--------|-------|
|
|
88
|
+
| STT (Whisper) | $0.04 pro Stunde Audio (~0.01 Cent pro 10s) |
|
|
89
|
+
| LLM-Formatierung | ~$0.00002 pro Transkription (optional) |
|
|
90
|
+
| **Gesamt** | **~0.024 Cent pro Transkription** |
|
|
91
|
+
|
|
92
|
+
Alle Preise basieren auf GroqCloud-Tarifen. Du nutzt deinen eigenen API-Key — kein Abo, kein Mittelsmann.
|
|
93
|
+
|
|
94
|
+
---
|
|
95
|
+
|
|
96
|
+
## Konfiguration
|
|
97
|
+
|
|
98
|
+
Die gesamte Konfiguration ist über die grafische Oberfläche möglich:
|
|
99
|
+
|
|
100
|
+
- **Einstellungen** — Sprache, Hotkeys, API-Key, Overlay-Position
|
|
101
|
+
- **Wortliste** — Namen und Fachbegriffe für korrekte Transkription
|
|
102
|
+
- **Fenster-Zuordnung** — Welche App bekommt welchen Schreibstil (casual, professionell, ...)
|
|
103
|
+
- **Statistiken** — Kosten, Nutzung, Ersparnis gegenüber Abo-Diensten
|
|
104
|
+
|
|
105
|
+
Alle Daten werden lokal unter `%APPDATA%\PayPerTranscript\` gespeichert.
|
|
106
|
+
|
|
107
|
+
---
|
|
108
|
+
|
|
109
|
+
## FAQ
|
|
110
|
+
|
|
111
|
+
### Text wird nicht in Admin-Fenster eingefügt
|
|
112
|
+
|
|
113
|
+
Windows blockiert Tastatureingaben von nicht-erhöhten Prozessen in erhöhte Fenster (UAC). Wenn du PayPerTranscript in Admin-Fenstern nutzen möchtest, starte die App als Administrator.
|
|
114
|
+
|
|
115
|
+
### Mikrofon wird nicht erkannt
|
|
116
|
+
|
|
117
|
+
- Prüfe, ob ein Mikrofon angeschlossen und in den Windows-Soundeinstellungen aktiviert ist
|
|
118
|
+
- Prüfe die Datenschutz-Einstellungen: Windows-Einstellungen → Datenschutz → Mikrofon
|
|
119
|
+
|
|
120
|
+
### Wie erhalte ich einen API-Key?
|
|
121
|
+
|
|
122
|
+
1. Erstelle einen Account bei [GroqCloud](https://console.groq.com)
|
|
123
|
+
2. Gehe zu API Keys → "Create API Key"
|
|
124
|
+
3. Kopiere den Key und füge ihn im Setup-Wizard ein
|
|
125
|
+
|
|
126
|
+
---
|
|
127
|
+
|
|
128
|
+
## Lizenz
|
|
129
|
+
|
|
130
|
+
MIT — siehe [LICENSE](LICENSE)
|
|
@@ -0,0 +1,51 @@
|
|
|
1
|
+
"""PayPerTranscript — Entry Point.
|
|
2
|
+
|
|
3
|
+
Open-Source Voice-to-Text mit Pay-per-Use Pricing.
|
|
4
|
+
Supports: python -m paypertranscript
|
|
5
|
+
"""
|
|
6
|
+
|
|
7
|
+
import ctypes
|
|
8
|
+
import os
|
|
9
|
+
import sys
|
|
10
|
+
from pathlib import Path
|
|
11
|
+
|
|
12
|
+
# DPI-Awareness setzen BEVOR Qt oder andere Libraries es tun.
|
|
13
|
+
# Verhindert "SetProcessDpiAwarenessContext() failed: Zugriff verweigert".
|
|
14
|
+
try:
|
|
15
|
+
ctypes.windll.user32.SetProcessDpiAwarenessContext(ctypes.c_void_p(-4))
|
|
16
|
+
except Exception:
|
|
17
|
+
pass
|
|
18
|
+
|
|
19
|
+
|
|
20
|
+
def _load_dotenv() -> None:
|
|
21
|
+
"""Laedt .env-Datei aus dem Arbeitsverzeichnis (falls vorhanden)."""
|
|
22
|
+
env_file = Path.cwd() / ".env"
|
|
23
|
+
if not env_file.exists():
|
|
24
|
+
return
|
|
25
|
+
for line in env_file.read_text(encoding="utf-8").splitlines():
|
|
26
|
+
line = line.strip()
|
|
27
|
+
if not line or line.startswith("#") or "=" not in line:
|
|
28
|
+
continue
|
|
29
|
+
key, _, value = line.partition("=")
|
|
30
|
+
key = key.strip()
|
|
31
|
+
value = value.strip().strip("'\"")
|
|
32
|
+
if key and key not in os.environ:
|
|
33
|
+
os.environ[key] = value
|
|
34
|
+
|
|
35
|
+
|
|
36
|
+
def main() -> None:
|
|
37
|
+
"""Hauptfunktion — initialisiert Logging und startet die PySide6-App."""
|
|
38
|
+
_load_dotenv()
|
|
39
|
+
|
|
40
|
+
from paypertranscript.core.logging import setup_logging
|
|
41
|
+
|
|
42
|
+
setup_logging(debug="--debug" in sys.argv)
|
|
43
|
+
|
|
44
|
+
from paypertranscript.ui.app import PayPerTranscriptApp
|
|
45
|
+
|
|
46
|
+
app = PayPerTranscriptApp()
|
|
47
|
+
sys.exit(app.run())
|
|
48
|
+
|
|
49
|
+
|
|
50
|
+
if __name__ == "__main__":
|
|
51
|
+
main()
|
|
Binary file
|
|
Binary file
|
|
Binary file
|
|
Binary file
|