img2ppt 1.3.4__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
img2ppt/__init__.py ADDED
@@ -0,0 +1,3 @@
1
+ """img2ppt — スライド画像/PDF → PowerPoint 自動変換パイプライン"""
2
+
3
+ __version__ = "1.3.4"
img2ppt/__main__.py ADDED
@@ -0,0 +1,3 @@
1
+ from img2ppt.cli import main
2
+
3
+ main()
img2ppt/clarify.py ADDED
@@ -0,0 +1,259 @@
1
+ """
2
+ 画像鮮明化モジュール
3
+
4
+ イラスト・図版・JPG画像向けに以下の処理を順に適用する:
5
+ 1. fastNlMeansDenoisingColored : JPEGブロックノイズ・輝度ムラを除去
6
+ 2. bilateralFilter : 輪郭を保持しつつ色むら・揺らぎを平滑化
7
+ 3. UnsharpMask : エッジ・輪郭線を鮮明化
8
+
9
+ --roi を指定した場合は対象領域のみ処理して元画像に合成する。
10
+ 省略した場合は画像全体を処理する。アルファチャンネルは保持される。
11
+ """
12
+
13
+ import argparse
14
+ import shutil
15
+ import sys
16
+ from pathlib import Path
17
+
18
+ import cv2
19
+ import numpy as np
20
+ from PIL import Image, ImageFilter
21
+
22
+
23
+ def _process_region(
24
+ bgr: np.ndarray,
25
+ denoise_h: int,
26
+ denoise_template: int,
27
+ denoise_search: int,
28
+ bilateral_d: int,
29
+ bilateral_sigma_color: float,
30
+ bilateral_sigma_space: float,
31
+ unsharp_radius: int,
32
+ unsharp_percent: int,
33
+ unsharp_threshold: int,
34
+ ) -> np.ndarray:
35
+ """BGR配列に鮮明化処理を適用してBGR配列で返す。"""
36
+
37
+ # ── Step1: ノイズ除去 ────────────────────────────────────────────────
38
+ # denoise_h : ノイズ除去強度。大きいほど強くノイズを除去するが、細部がぼける。
39
+ # JPEGアーティファクトが目立つ画像では 10〜15、きれいな画像は 5 程度。
40
+ # denoise_template: テンプレートウィンドウサイズ(px、奇数)。大きいほど精度が上がるが遅い。通常 7。
41
+ # denoise_search : 探索ウィンドウサイズ(px、奇数)。大きいほど広範囲を比較して精度UP。通常 21。
42
+ denoised = cv2.fastNlMeansDenoisingColored(
43
+ bgr,
44
+ h=denoise_h,
45
+ hColor=denoise_h,
46
+ templateWindowSize=denoise_template,
47
+ searchWindowSize=denoise_search,
48
+ )
49
+
50
+ # ── Step2: バイラテラルフィルタ ──────────────────────────────────────
51
+ # 輪郭(エッジ)を保持しながら色むら・ノイズを平滑化する。
52
+ # bilateral_d : フィルタの近傍径(px)。大きいほど広範囲を平滑化するが遅い。通常 9。
53
+ # bilateral_sigma_color: 色空間のシグマ値。大きいほど色の違いを無視して平滑化する。
54
+ # 小さいと色の差が少し違うだけで別エッジとみなし、強いシャープ感が残る。
55
+ # 通常 60〜80。大きくすると塗り絵的な質感になる。
56
+ # bilateral_sigma_space: 座標空間のシグマ値。大きいほど遠くのピクセルも参照する。
57
+ # 通常 60〜80。大きくすると広域にぼかしが広がる。
58
+ bilateral = cv2.bilateralFilter(
59
+ denoised,
60
+ d=bilateral_d,
61
+ sigmaColor=bilateral_sigma_color,
62
+ sigmaSpace=bilateral_sigma_space,
63
+ )
64
+
65
+ # ── Step3: アンシャープマスク(輪郭強調) ────────────────────────────
66
+ # ぼかした画像との差分を元画像に加算してエッジを際立たせる。
67
+ # unsharp_radius : ぼかし半径(px)。大きいほど広いエッジを強調する。通常 1〜3。
68
+ # 大きくすると輪郭が太くなり、小さくすると細かいテクスチャが強調される。
69
+ # unsharp_percent : 強調強度(%)。100が等倍加算、200で2倍加算。
70
+ # 上げるほどシャープになるが、ノイズや縞も強調されてしまう。
71
+ # 通常 150〜200。OCR前処理として使う場合は高め(160〜200)が有効。
72
+ # unsharp_threshold: この輝度差(0〜255)以下のエッジは強調しない。
73
+ # 0にするとノイズも強調される。2〜5 程度が無難。
74
+ pil = Image.fromarray(cv2.cvtColor(bilateral, cv2.COLOR_BGR2RGB))
75
+ sharpened = pil.filter(
76
+ ImageFilter.UnsharpMask(
77
+ radius=unsharp_radius,
78
+ percent=unsharp_percent,
79
+ threshold=unsharp_threshold,
80
+ )
81
+ )
82
+ return cv2.cvtColor(np.array(sharpened), cv2.COLOR_RGB2BGR)
83
+
84
+
85
+ def clarify(
86
+ src: Path,
87
+ dst: Path,
88
+ roi: tuple[int, int, int, int] | None = None,
89
+ skip_if_clean: bool = True,
90
+ # ノイズ除去強度: 上げると強くノイズを消すが細部がぼける(JPEGアーティファクトが強い画像は 10〜15)
91
+ denoise_h: int = 10,
92
+ # テンプレートウィンドウ: 通常 7 固定で問題なし
93
+ denoise_template: int = 7,
94
+ # 探索ウィンドウ: 通常 21 固定で問題なし(大きくすると精度UP・速度DOWN)
95
+ denoise_search: int = 21,
96
+ # バイラテラル近傍径: 大きくすると広範囲平滑化(遅くなる)。通常 9
97
+ bilateral_d: int = 9,
98
+ # 色シグマ: 大きくすると色差を無視して平滑化。通常 60〜80
99
+ bilateral_sigma_color: float = 60.0,
100
+ # 座標シグマ: 大きくすると広域にぼかし。通常 60〜80
101
+ bilateral_sigma_space: float = 60.0,
102
+ # アンシャープ半径: 大きくすると太いエッジを強調。通常 2
103
+ unsharp_radius: int = 2,
104
+ # アンシャープ強度(%): 上げるほどシャープ。OCR前処理は 160〜200 が有効
105
+ unsharp_percent: int = 200,
106
+ # アンシャープ閾値: この輝度差以下のエッジは無視(ノイズ抑制)。通常 2
107
+ unsharp_threshold: int = 2,
108
+ ) -> Path:
109
+ """
110
+ 画像を鮮明化して dst に保存し、dst を返す。
111
+
112
+ roi: (x1, y1, x2, y2) を指定した場合はその領域のみ処理。
113
+ None の場合は画像全体を処理。
114
+ skip_if_clean: True の場合、高品質画像はスキップ(元画像をコピー)。
115
+ - PNG ファイル(ロスレス)
116
+ - JPG/JPEG で1280px以上の解像度
117
+ """
118
+ raw = np.frombuffer(src.read_bytes(), dtype=np.uint8)
119
+ img_bgr = cv2.imdecode(raw, cv2.IMREAD_UNCHANGED)
120
+ if img_bgr is None:
121
+ raise FileNotFoundError(f"画像を読み込めません: {src}")
122
+
123
+ has_alpha = img_bgr.ndim == 3 and img_bgr.shape[2] == 4
124
+ if has_alpha:
125
+ bgr, alpha = img_bgr[:, :, :3], img_bgr[:, :, 3]
126
+ else:
127
+ bgr, alpha = img_bgr, None
128
+
129
+ h, w = bgr.shape[:2]
130
+
131
+ # ── スキップ判定:高品質画像の場合は元画像をコピーして返す ────────────
132
+ if skip_if_clean and roi is None:
133
+ suffix = src.suffix.lower()
134
+ is_png = suffix == ".png"
135
+ is_high_res_jpg = suffix in [".jpg", ".jpeg"] and max(h, w) >= 1280
136
+ if is_png or is_high_res_jpg:
137
+ dst.parent.mkdir(parents=True, exist_ok=True)
138
+ shutil.copy2(src, dst)
139
+ print(f"鮮明化スキップ: {src.name} ({w}×{h} px) ← 高品質ファイル")
140
+ return dst
141
+ kwargs = dict(
142
+ denoise_h=denoise_h,
143
+ denoise_template=denoise_template,
144
+ denoise_search=denoise_search,
145
+ bilateral_d=bilateral_d,
146
+ bilateral_sigma_color=bilateral_sigma_color,
147
+ bilateral_sigma_space=bilateral_sigma_space,
148
+ unsharp_radius=unsharp_radius,
149
+ unsharp_percent=unsharp_percent,
150
+ unsharp_threshold=unsharp_threshold,
151
+ )
152
+
153
+ if roi is None:
154
+ result_bgr = _process_region(bgr, **kwargs)
155
+ print(f"処理範囲: 画像全体 ({w}×{h} px)")
156
+ else:
157
+ x1, y1, x2, y2 = (
158
+ max(0, roi[0]), max(0, roi[1]),
159
+ min(w, roi[2]), min(h, roi[3]),
160
+ )
161
+ result_bgr = bgr.copy()
162
+ result_bgr[y1:y2, x1:x2] = _process_region(bgr[y1:y2, x1:x2].copy(), **kwargs)
163
+ print(f"処理 ROI : x={x1}-{x2}, y={y1}-{y2} ({x2-x1}×{y2-y1} px)")
164
+
165
+ result_rgb = cv2.cvtColor(result_bgr, cv2.COLOR_BGR2RGB)
166
+ out = Image.fromarray(result_rgb)
167
+
168
+ if alpha is not None:
169
+ out = out.convert("RGBA")
170
+ out.putalpha(Image.fromarray(alpha))
171
+
172
+ dst.parent.mkdir(parents=True, exist_ok=True)
173
+ out.save(str(dst))
174
+ print(f"保存完了: {dst}")
175
+ return dst
176
+
177
+
178
+ def main() -> None:
179
+ parser = argparse.ArgumentParser(
180
+ description="画像鮮明化ツール(全体 / ROI 指定)",
181
+ formatter_class=argparse.RawDescriptionHelpFormatter,
182
+ epilog="""
183
+ パラメータ調整ガイド:
184
+ --denoise-h ノイズ除去強度。上げるとJPEGノイズが消えるが細部もぼける。
185
+ JPEGが荒い画像: 10〜15 / きれいな画像: 5 程度
186
+ --bilateral-d バイラテラルフィルタ近傍径。上げると広域を平滑化するが遅くなる。通常: 9
187
+ --sigma-color 色シグマ。上げると色差を無視して広く平滑化。通常: 60〜80
188
+ --sigma-space 座標シグマ。上げると遠くのピクセルまでぼかしが広がる。通常: 60〜80
189
+ --unsharp-radius アンシャープ半径。上げると太いエッジを強調。通常: 2
190
+ --unsharp-percent アンシャープ強度(%)。上げるほどシャープ。OCR前処理: 160〜200
191
+ --unsharp-threshold アンシャープ閾値。この輝度差以下のエッジは無視。ノイズ抑制: 2〜5
192
+ """,
193
+ )
194
+ parser.add_argument("input", type=Path, help="入力画像パス")
195
+ parser.add_argument(
196
+ "-o", "--output", type=Path, default=None,
197
+ help="出力画像パス(省略時: 入力ファイル名に _clarified を付加)",
198
+ )
199
+ parser.add_argument(
200
+ "--roi", nargs=4, type=int, metavar=("X1", "Y1", "X2", "Y2"),
201
+ default=None, help="処理対象領域 (ピクセル座標)。省略時は全体を処理",
202
+ )
203
+ parser.add_argument(
204
+ "--denoise-h", type=int, default=10,
205
+ help="ノイズ除去強度 (デフォルト: 10)。上げると強くノイズを消すが細部がぼける",
206
+ )
207
+ parser.add_argument(
208
+ "--bilateral-d", type=int, default=9,
209
+ help="バイラテラルフィルタの近傍径px (デフォルト: 9)。上げると広範囲平滑化・処理が遅くなる",
210
+ )
211
+ parser.add_argument(
212
+ "--sigma-color", type=float, default=60.0,
213
+ help="色空間のシグマ値 (デフォルト: 60)。上げると色差を無視して平滑化、塗り絵的な質感になる",
214
+ )
215
+ parser.add_argument(
216
+ "--sigma-space", type=float, default=60.0,
217
+ help="座標空間のシグマ値 (デフォルト: 60)。上げると広域にぼかしが広がる",
218
+ )
219
+ parser.add_argument(
220
+ "--unsharp-radius", type=int, default=2,
221
+ help="アンシャープマスクの半径px (デフォルト: 2)。上げると太いエッジを強調、下げると細かいテクスチャが強調",
222
+ )
223
+ parser.add_argument(
224
+ "--unsharp-percent", type=int, default=200,
225
+ help="アンシャープマスクの強度%% (デフォルト: 200)。上げるほどシャープ、ノイズも強調されるので注意",
226
+ )
227
+ parser.add_argument(
228
+ "--unsharp-threshold", type=int, default=2,
229
+ help="アンシャープマスクの閾値 (デフォルト: 2)。この輝度差以下のエッジは無視してノイズ抑制",
230
+ )
231
+ args = parser.parse_args()
232
+
233
+ src = args.input.resolve()
234
+ if not src.exists():
235
+ print(f"エラー: ファイルが見つかりません: {src}", file=sys.stderr)
236
+ sys.exit(1)
237
+
238
+ dst = (
239
+ args.output.resolve()
240
+ if args.output
241
+ else src.with_stem(src.stem + "_clarified")
242
+ )
243
+
244
+ clarify(
245
+ src=src,
246
+ dst=dst,
247
+ roi=tuple(args.roi) if args.roi else None,
248
+ denoise_h=args.denoise_h,
249
+ bilateral_d=args.bilateral_d,
250
+ bilateral_sigma_color=args.sigma_color,
251
+ bilateral_sigma_space=args.sigma_space,
252
+ unsharp_radius=args.unsharp_radius,
253
+ unsharp_percent=args.unsharp_percent,
254
+ unsharp_threshold=args.unsharp_threshold,
255
+ )
256
+
257
+
258
+ if __name__ == "__main__":
259
+ main()