ytcollector 1.1.9__py3-none-any.whl → 1.2.0__py3-none-any.whl
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- ytcollector/config.py +2 -8
- {ytcollector-1.1.9.dist-info → ytcollector-1.2.0.dist-info}/METADATA +6 -5
- {ytcollector-1.1.9.dist-info → ytcollector-1.2.0.dist-info}/RECORD +6 -6
- {ytcollector-1.1.9.dist-info → ytcollector-1.2.0.dist-info}/WHEEL +0 -0
- {ytcollector-1.1.9.dist-info → ytcollector-1.2.0.dist-info}/entry_points.txt +0 -0
- {ytcollector-1.1.9.dist-info → ytcollector-1.2.0.dist-info}/top_level.txt +0 -0
ytcollector/config.py
CHANGED
|
@@ -57,14 +57,8 @@ CATEGORY_NAMES = {
|
|
|
57
57
|
# 카테고리별 제외 키워드 (제목에 포함 시 스킵)
|
|
58
58
|
BLACKLIST_KEYWORDS = {
|
|
59
59
|
'tattoo': [
|
|
60
|
-
"
|
|
61
|
-
"
|
|
62
|
-
"입술 문신", "입술문신",
|
|
63
|
-
"립타투", "립 타투",
|
|
64
|
-
"헤어타투", "헤어 타투",
|
|
65
|
-
"구레나룻문신", "구레나룻 문신",
|
|
66
|
-
"틴트 입술",
|
|
67
|
-
"반영구", "SMP"
|
|
60
|
+
"눈썹", "입술", "두피", "영구", # 반영구 시술 제외
|
|
61
|
+
"립타투", "헤어타투", "SMP"
|
|
68
62
|
],
|
|
69
63
|
'face': [],
|
|
70
64
|
'license_plate': [],
|
|
@@ -1,6 +1,6 @@
|
|
|
1
1
|
Metadata-Version: 2.4
|
|
2
2
|
Name: ytcollector
|
|
3
|
-
Version: 1.
|
|
3
|
+
Version: 1.2.0
|
|
4
4
|
Summary: YouTube 콘텐츠 수집기 - 얼굴, 번호판, 타투, 텍스트 감지
|
|
5
5
|
Author: YTCollector Team
|
|
6
6
|
License: MIT
|
|
@@ -44,7 +44,7 @@ Requires-Dist: ytcollector[analysis,dev]; extra == "all"
|
|
|
44
44
|
pip install yt-dlp
|
|
45
45
|
```
|
|
46
46
|
|
|
47
|
-
### 분석 기능용 패키지 (권장 - v1.
|
|
47
|
+
### 분석 기능용 패키지 (권장 - v1.2.0+)
|
|
48
48
|
|
|
49
49
|
분석 기능을 원활하게 사용하려면 아래 패키지들이 필요합니다. GPU(CUDA)가 설치된 경우 자동으로 가속이 활성화됩니다.
|
|
50
50
|
|
|
@@ -192,9 +192,10 @@ https://www.youtube.com/watch?v=aqz-KE-bpKQ, 00:10, sample_task
|
|
|
192
192
|
| 번호판 | YOLOv8 전용 모델 + OCR | v1.1.9: 번호판 전용 학습 모델 + 한국 번호판 패턴 매칭 |
|
|
193
193
|
| 타투 | OpenCV HSV 분석 | 피부 영역 내 잉크 패턴 감지 |
|
|
194
194
|
|
|
195
|
-
### 주요 최적화 (v1.1.5~1.
|
|
196
|
-
-
|
|
197
|
-
-
|
|
195
|
+
### 주요 최적화 (v1.1.5~1.2.0)
|
|
196
|
+
- **자막 영역 필터링** (v1.2.0): 화면 하단 60%~95% 영역만 자막으로 인식, 상단 로고/워터마크 제외
|
|
197
|
+
- **번호판 전용 모델** (v1.1.9): YOLO-World → 번호판 전용 학습 모델로 교체 (감지율 향상, 모델 크기 27MB→6MB)
|
|
198
|
+
- **오탐지 방지**: YOLO 감지 + OCR 패턴 매칭 둘 다 만족해야 번호판 판정, ROI 크기 필터링 추가
|
|
198
199
|
- **ROI 기반 감지**: 전체 화면이 아닌 YOLO가 지정한 영역만 OCR하여 속도와 정확도 향상
|
|
199
200
|
- **GPU 가속 지원**: CUDA 사용 가능 시 YOLO 및 OCR 자동 가속
|
|
200
201
|
- **로그 기반 중복 방지**: `youtube_url_*.txt` 기록을 참조하여 중복 분석 방지
|
|
@@ -1,12 +1,12 @@
|
|
|
1
1
|
ytcollector/__init__.py,sha256=EaxBP_0Fv0LEFdg067uZxBrQHwOKGX8u08Y4b5uF1-Q,1094
|
|
2
2
|
ytcollector/analyzer.py,sha256=7VJt4chc25HsEz8OwBDZhTz_8LnkpgSBM6mJKQpIUls,14391
|
|
3
3
|
ytcollector/cli.py,sha256=aHF4EuQRPLKh65lnkI_dZ0ResztlVjpHlS5iHfzmpig,5577
|
|
4
|
-
ytcollector/config.py,sha256=
|
|
4
|
+
ytcollector/config.py,sha256=wqS9bxoUePBU1f5N_KuR8ykGUNskERNfARw86B0ASiE,3013
|
|
5
5
|
ytcollector/dataset_builder.py,sha256=nfArEwszoCln48n3T0Eff_4OOaYv8FF0YH8cARBGMWQ,2608
|
|
6
6
|
ytcollector/downloader.py,sha256=TeC6agUmSPHZSZ9jdoc42i8i_NobzTEkoRtAIgW80kI,14544
|
|
7
7
|
ytcollector/utils.py,sha256=6XDif-e3GbMHmUvTsBT0YblxNxYnS-2I8HnmjMBZs-M,4254
|
|
8
|
-
ytcollector-1.
|
|
9
|
-
ytcollector-1.
|
|
10
|
-
ytcollector-1.
|
|
11
|
-
ytcollector-1.
|
|
12
|
-
ytcollector-1.
|
|
8
|
+
ytcollector-1.2.0.dist-info/METADATA,sha256=cPBAfrjm7v5tlEOGPGP3Fl3GX1q7mvDZgGKxxTXy5vk,7319
|
|
9
|
+
ytcollector-1.2.0.dist-info/WHEEL,sha256=wUyA8OaulRlbfwMtmQsvNngGrxQHAvkKcvRmdizlJi0,92
|
|
10
|
+
ytcollector-1.2.0.dist-info/entry_points.txt,sha256=waiVuSJJYt-6_DAal-T4JkHgejo7wKYLdKrEI7tZ-ms,127
|
|
11
|
+
ytcollector-1.2.0.dist-info/top_level.txt,sha256=wozNyCUm0eMOm-9U81yTql6oGaM2O5rWVBXDb93zzyQ,12
|
|
12
|
+
ytcollector-1.2.0.dist-info/RECORD,,
|
|
File without changes
|
|
File without changes
|
|
File without changes
|