korcen 0.3.5__tar.gz → 0.3.7__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.1
2
2
  Name: korcen
3
- Version: 0.3.5
3
+ Version: 0.3.7
4
4
  Summary: 한국어 비속어 검열
5
5
  Home-page: https://github.com/KR-korcen/korcen
6
6
  Author: Tanat
@@ -10,3 +10,5 @@ Classifier: License :: OSI Approved :: MIT License
10
10
  Classifier: Operating System :: OS Independent
11
11
  Requires-Python: >=3.6
12
12
  Description-Content-Type: text/markdown
13
+ Requires-Dist: better_profanity
14
+ Requires-Dist: OrderedDict
@@ -165,6 +165,7 @@ def check(text:str, id: int=None):
165
165
  text = re.sub('dㅗ', '', text)
166
166
  text = re.sub('ㅗg', '', text)
167
167
  text = re.sub('gㅗ', '', text)
168
+ text = re.sub('dㅗ', '', text)
168
169
  text = re.sub(' ', '', text)
169
170
  fuckyou = ["ㅗ", "┻", "┴", "┹", "_ㅣ_",
170
171
  "_/_", "⊥", "_ |\_", "_|\_", "_ㅣ\_", "_I_", "丄"]
@@ -326,7 +327,8 @@ def check(text:str, id: int=None):
326
327
  "씨삐라", "씨벌", "슈벌", "시불", "시부렝", "씨부렝", "시부랭", "씨부랭", "시부랭", "발놈시", "뛰발",
327
328
  "뛰봘", "뜨발", "뜨벌", "띄발", "씨바알", "샤빨", "샤발", "스벌", "쓰벌", "신발련", "신발년", "신발놈", "띠발",
328
329
  "띠바랄", "시방", "씨방", "씨부련", "시부련", "씨잇발", "씨잇파알", "씨잇바알", "시잇발", "시잇바알", "쒸이발",
329
- "쉬이빨", "씹팔", "쉬바", "시병발신", "씱빩", "쉬바난", "쉬바놈", "쉬바녀", "쉬바년", "쉬바노마,쉬바새", "쉬불", "쉬이바", "시벨놈", "시뱅놈", "시봉새"]
330
+ "쉬이빨", "씹팔", "쉬바", "시병발신", "씱빩", "쉬바난", "쉬바놈", "쉬바녀", "쉬바년", "쉬바노마", "쉬바새", "쉬불", "쉬이바",
331
+ "시벨놈", "시뱅놈", "시봉새", "씻뻘"]
330
332
  for i in fuck:
331
333
  if i in text:
332
334
  return True
@@ -344,11 +346,12 @@ def check(text:str, id: int=None):
344
346
  text = re.sub(' ', '', newtext)
345
347
  text = re.sub("opgg", "", text)
346
348
  text = re.sub("op.gg", "", text)
347
- bullshit1 = ["wlfkf", "g랄", "g럴", "g롤", "g뢀", "giral"]
349
+ bullshit1 = ["wlfkf", "g랄", "g럴", "g롤", "g뢀", "giral", "zi랄", "ji랄"]
348
350
  for i in bullshit1:
349
351
  if i in text:
350
352
  return True
351
353
  text = re.sub("g랄", "지랄", newtext)
354
+ text = re.sub('ji랄', '지랄', text)
352
355
  text = re.sub('己', 'ㄹ', text)
353
356
  text = re.sub("[^ㄱ-힣]", "", text)
354
357
  text = re.sub("있지", "", text)
@@ -488,6 +491,7 @@ def check(text:str, id: int=None):
488
491
  text = re.sub('삵새끼', '', text)
489
492
  text = re.sub('키보드', '', text)
490
493
  text = re.sub('새끼손', '', text)
494
+ text = re.sub('셰리프', '', text)
491
495
  sonofbitch = ["새끼", "쉐리", "쌔끼", "썌끼", "쎼끼", "쌬끼", "샠끼", "세끼", "샊", "쌖", "섺", "쎆", "십새", "새키", "씹색", "새까", "새꺄",
492
496
  "새뀌", "새끠", "새캬", "색꺄", "색끼", "섹히", "셁기", "셁끼", "셐기", "셰끼", "셰리", "쉐꺄", "십색꺄", "십떼끼", "십데꺄", "십때끼", "십새꺄", "십새캬", "쉑히"]
493
497
  for i in sonofbitch:
@@ -529,6 +533,10 @@ def check(text:str, id: int=None):
529
533
  return True
530
534
  text = re.sub("[^가-힣]", "", text)
531
535
  text = re.sub('해줫더니', '', text)
536
+ text = re.sub('줫다', '', text)
537
+ text = re.sub('내쫒은', '', text)
538
+ text = re.sub('내쫒다', '', text)
539
+ text = re.sub('좇아', '', text)
532
540
  dick = ["좆", "촟", "조까", "좈", "쫒", "졷", "좃", "줮",
533
541
  "좋같", "좃같", "좃물", "좃밥", "줫", "좋밥", "좋물", "좇"]
534
542
  for i in dick:
@@ -664,6 +672,9 @@ def check(text:str, id: int=None):
664
672
  text = re.sub("뒤져봐야", "", text)
665
673
  text = re.sub("뒤질뻔", "", text)
666
674
  text = re.sub("뒤져보다", "", text)
675
+ text = re.sub("뒤져보는", "", text)
676
+ text = re.sub("뒤져본", "", text)
677
+ text = re.sub("뒤져볼", "", text)
667
678
  picking = ["뒤져", "뒈져", "뒈진", "뒈질", "디져라", "디진다", "디질래", "뒤질"]
668
679
  for i in picking:
669
680
 
@@ -702,6 +713,8 @@ def check(text:str, id: int=None):
702
713
  text = re.sub('빨리 보지', '', text)
703
714
  text = re.sub('보지도 마', '', text)
704
715
  text = re.sub('보지는 않', '', text)
716
+ text = re.sub('보지안으', '', text)
717
+ text = re.sub('보지안아', '', text)
705
718
  text = re.sub('게 보지', '', text)
706
719
  text = re.sub("[^ㄱ-힣]", "", text)
707
720
  text = re.sub('보g', '보지', text)
@@ -729,6 +742,7 @@ def check(text:str, id: int=None):
729
742
  text = re.sub('바보지', '', text)
730
743
  text = re.sub('바보짓', '', text)
731
744
  text = re.sub('물어보지', '', text)
745
+ text = re.sub('하시나보지', '', text)
732
746
  text = re.sub('오', '', text)
733
747
  pussy = ["보지", "버지물", "버짓물", "보짓", "ⓑⓞⓩⓘ",
734
748
  "bozi", "개보즤", "개보지", "버지벌렁벌렁", "보짖", "뵤즤", "봊이"]
@@ -904,6 +918,9 @@ def check(text:str, id: int=None):
904
918
  text = re.sub("소유자", "", text)
905
919
  text = re.sub("작업자", "", text)
906
920
  text = re.sub("자기위로", "자위", text)
921
+ text = re.sub("위대하지", "", text)
922
+ text = re.sub("암살자", "", text)
923
+ text = re.sub("학자", "", text)
907
924
  onahole = ["딸딸이", "질싸", "안에사정", "자위남", "자위녀", "폰섹", "포르노", "폰세엑", "폰쉑", "폰쎅", "질내사정", "그룹섹", "남창", "男色", "누워라이년아",
908
925
  "누웠냐씨방새", "다리벌려", "대줄년", "뒤로너어줘", "딸따뤼", "딸쳐", "떡쳐라", "막대쑤셔줘", "막대핥아줘", "먹고보니내딸", "먹고보니누나", "먹고보니딸",
909
926
  "먹고보니똥개", "먹고보니엄마", "먹고보니응아", "먹고보니재수", "먹고보니처제", "먹고보니형수", "몸뚱이줄께", "몸안에사정", "밖에다쌀께", "박고빼고",
@@ -970,6 +987,7 @@ def check(text:str, id: int=None):
970
987
  text = re.sub('라운지', '', text)
971
988
  text = re.sub('운지법', '', text)
972
989
  text = re.sub('싸운지', '', text)
990
+ text = re.sub('운 지린다', '', text)
973
991
  text = re.sub('깔보다', '', text)
974
992
  text = re.sub('깔보시', '', text)
975
993
  text = re.sub('1년', '', text)
@@ -1158,11 +1176,57 @@ def general(text:str, id: int=None):
1158
1176
  text = re.sub('𝖘', 's', text)
1159
1177
  text = re.sub('𝕤', 's', text)
1160
1178
  text = re.sub('s', 's', text)
1179
+ text = re.sub('ş', 's', text)
1161
1180
  text = re.sub('ⓢ', 's', text)
1162
1181
  text = re.sub('⒮', 's', text)
1163
1182
  text = re.sub('🅢', 's', text)
1164
1183
  text = re.sub('🆂', 's', text)
1165
1184
  text = re.sub('🅂', 's', text)
1185
+ text = re.sub('𝖾', 'e', text)
1186
+ text = re.sub('𝘦', 'e', text)
1187
+ text = re.sub('𝙚', 'e', text)
1188
+ text = re.sub('𝚎', 'e', text)
1189
+ text = re.sub('𝐞', 'e', text)
1190
+ text = re.sub('𝑒', 'e', text)
1191
+ text = re.sub('𝒆', 'e', text)
1192
+ text = re.sub('ℯ', 'e', text)
1193
+ text = re.sub('𝓮', 'e', text)
1194
+ text = re.sub('𝔢', 'e', text)
1195
+ text = re.sub('𝖊', 'e', text)
1196
+ text = re.sub('𝕖', 'e', text)
1197
+ text = re.sub('e', 'e', text)
1198
+ text = re.sub('ė', 'e', text)
1199
+ text = re.sub('ⓔ', 'e', text)
1200
+ text = re.sub('⒠', 'e', text)
1201
+ text = re.sub('🅔', 'e', text)
1202
+ text = re.sub('🅴', 'e', text)
1203
+ text = re.sub('🄴', 'e', text)
1204
+ text = re.sub('є', 'e', text)
1205
+ text = re.sub('𝗑', 'x', text)
1206
+ text = re.sub('𝘹', 'x', text)
1207
+ text = re.sub('𝙭', 'x', text)
1208
+ text = re.sub('𝚡', 'x', text)
1209
+ text = re.sub('𝐱', 'x', text)
1210
+ text = re.sub('𝑥', 'x', text)
1211
+ text = re.sub('𝒙', 'x', text)
1212
+ text = re.sub('𝓍', 'x', text)
1213
+ text = re.sub('𝔁', 'x', text)
1214
+ text = re.sub('𝔵', 'x', text)
1215
+ text = re.sub('𝖝', 'x', text)
1216
+ text = re.sub('𝕩', 'x', text)
1217
+ text = re.sub('x', 'x', text)
1218
+ text = re.sub('ⓧ', 'x', text)
1219
+ text = re.sub('⒳', 'x', text)
1220
+ text = re.sub('🅧', 'x', text)
1221
+ text = re.sub('🆇', 'x', text)
1222
+ text = re.sub('🅇', 'x', text)
1223
+ text = re.sub('₨', 'rs', text)
1224
+ text = re.sub('ų', 'u', text)
1225
+ text = re.sub('ç', 'c', text)
1226
+ text = re.sub('F', 'F', text)
1227
+ text = re.sub('K', 'K', text)
1228
+ text = re.sub('C', 'C', text)
1229
+ text = re.sub('U', 'U', text)
1166
1230
  newtext = text.lower()
1167
1231
 
1168
1232
  text = re.sub('ㅗ먹어', 'ㅗ', newtext)
@@ -1228,6 +1292,7 @@ def general(text:str, id: int=None):
1228
1292
  text = re.sub('dㅗ', '', text)
1229
1293
  text = re.sub('ㅗg', '', text)
1230
1294
  text = re.sub('gㅗ', '', text)
1295
+ text = re.sub('dㅗ', '', text)
1231
1296
  text = re.sub(' ', '', text)
1232
1297
  fuckyou = ["ㅗ", "┻", "┴", "┹", "_ㅣ_",
1233
1298
  "_/_", "⊥", "_ |\_", "_|\_", "_ㅣ\_", "_I_", "丄"]
@@ -1286,6 +1351,8 @@ def general(text:str, id: int=None):
1286
1351
  text = re.sub('ㅍㅅㅍ', '', text)
1287
1352
  text = re.sub('발 닦', '', text)
1288
1353
  text = re.sub('동시 8', '', text)
1354
+ text = re.sub('8시발', '시발', text)
1355
+ text = re.sub('8시 ', '', text)
1289
1356
  text = re.sub("[^ㄱ-힣]", "", text)
1290
1357
  fuck = ["시ㅂ", "시ㅏㄹ", "씨ㅂ", "씨ㅏㄹ", "ㅣ발", "ㅆ발", "ㅅ발", "ㅅㅂ", "ㅆㅂ", "ㅆ바", "ㅅ바",
1291
1358
  "시ㅂㅏ", "ㅅㅂㅏ", "시ㅏㄹ", "씨ㅏㄹ", "ㅅ불", "ㅆ불", "ㅅ쁠", "ㅆ뿔", "ㅆㅣ발", "ㅅㅟ발", "ㅅㅣㅂㅏ",
@@ -1364,6 +1431,7 @@ def general(text:str, id: int=None):
1364
1431
  text = re.sub('역시', '', text)
1365
1432
  text = re.sub('바보', '', text)
1366
1433
  text = re.sub('쿨리발리', '', text)
1434
+ text = re.sub('슈발리에', '', text)
1367
1435
  text = re.sub('방탄', '', text)
1368
1436
  text = re.sub('방어', '', text)
1369
1437
  text = re.sub('발표', '', text)
@@ -1386,7 +1454,8 @@ def general(text:str, id: int=None):
1386
1454
  "씨삐라", "씨벌", "슈벌", "시불", "시부렝", "씨부렝", "시부랭", "씨부랭", "시부랭", "발놈시", "뛰발",
1387
1455
  "뛰봘", "뜨발", "뜨벌", "띄발", "씨바알", "샤빨", "샤발", "스벌", "쓰벌", "신발련", "신발년", "신발놈", "띠발",
1388
1456
  "띠바랄", "시방", "씨방", "씨부련", "시부련", "씨잇발", "씨잇파알", "씨잇바알", "시잇발", "시잇바알", "쒸이발",
1389
- "쉬이빨", "씹팔", "쉬바", "시병발신", "씱빩", "쉬바난", "쉬바놈", "쉬바녀", "쉬바년", "쉬바노마,쉬바새", "쉬불", "쉬이바", "시벨놈", "시뱅놈", "시봉새"]
1457
+ "쉬이빨", "씹팔", "쉬바", "시병발신", "씱빩", "쉬바난", "쉬바놈", "쉬바녀", "쉬바년", "쉬바노마", "쉬바새", "쉬불", "쉬이바",
1458
+ "시벨놈", "시뱅놈", "시봉새", "씻뻘"]
1390
1459
  for i in fuck:
1391
1460
  if i in text:
1392
1461
  return True
@@ -1404,11 +1473,12 @@ def general(text:str, id: int=None):
1404
1473
  text = re.sub(' ', '', newtext)
1405
1474
  text = re.sub("opgg", "", text)
1406
1475
  text = re.sub("op.gg", "", text)
1407
- bullshit1 = ["wlfkf", "g랄", "g럴", "g롤", "g뢀", "giral"]
1476
+ bullshit1 = ["wlfkf", "g랄", "g럴", "g롤", "g뢀", "giral", "zi랄", "ji랄"]
1408
1477
  for i in bullshit1:
1409
1478
  if i in text:
1410
1479
  return True
1411
1480
  text = re.sub("g랄", "지랄", newtext)
1481
+ text = re.sub('ji랄', '지랄', text)
1412
1482
  text = re.sub('己', 'ㄹ', text)
1413
1483
  text = re.sub("[^ㄱ-힣]", "", text)
1414
1484
  text = re.sub("있지", "", text)
@@ -1455,6 +1525,7 @@ def general(text:str, id: int=None):
1455
1525
  text = re.sub('7등신', '', text)
1456
1526
  text = re.sub('8등신', '', text)
1457
1527
  text = re.sub('9등신', '', text)
1528
+ text = re.sub('붕우유신', '', text)
1458
1529
  text = re.sub("[^ㄱ-힣]", "", text)
1459
1530
  text = re.sub('빙', '병', text)
1460
1531
  text = re.sub('븅', '병', text)
@@ -1466,6 +1537,8 @@ def general(text:str, id: int=None):
1466
1537
  text = re.sub('씬', '신', text)
1467
1538
  text = re.sub('우', '', text)
1468
1539
  text = re.sub('웅', '', text)
1540
+ text = re.sub('융', '', text)
1541
+ text = re.sub('유', '', text)
1469
1542
  asshole = ["ㅄ", "ㅂㅅ", "병ㅅ", "ㅂ신", "ㅕㅇ신", "ㅂㅇ신", "뷰신"]
1470
1543
  for i in asshole:
1471
1544
  if i in text:
@@ -1545,6 +1618,7 @@ def general(text:str, id: int=None):
1545
1618
  text = re.sub('삵새끼', '', text)
1546
1619
  text = re.sub('키보드', '', text)
1547
1620
  text = re.sub('새끼손', '', text)
1621
+ text = re.sub('셰리프', '', text)
1548
1622
  sonofbitch = ["새끼", "쉐리", "쌔끼", "썌끼", "쎼끼", "쌬끼", "샠끼", "세끼", "샊", "쌖", "섺", "쎆", "십새", "새키", "씹색", "새까", "새꺄",
1549
1623
  "새뀌", "새끠", "새캬", "색꺄", "색끼", "섹히", "셁기", "셁끼", "셐기", "셰끼", "셰리", "쉐꺄", "십색꺄", "십떼끼", "십데꺄", "십때끼", "십새꺄", "십새캬", "쉑히"]
1550
1624
  for i in sonofbitch:
@@ -1586,6 +1660,10 @@ def general(text:str, id: int=None):
1586
1660
  return True
1587
1661
  text = re.sub("[^가-힣]", "", text)
1588
1662
  text = re.sub('해줫더니', '', text)
1663
+ text = re.sub('줫다', '', text)
1664
+ text = re.sub('내쫒은', '', text)
1665
+ text = re.sub('내쫒다', '', text)
1666
+ text = re.sub('좇아', '', text)
1589
1667
  dick = ["좆", "촟", "조까", "좈", "쫒", "졷", "좃", "줮",
1590
1668
  "좋같", "좃같", "좃물", "좃밥", "줫", "좋밥", "좋물", "좇"]
1591
1669
  for i in dick:
@@ -1732,6 +1810,9 @@ def minor(text:str, id: int=None):
1732
1810
  text = re.sub("뒤져봐야", "", text)
1733
1811
  text = re.sub("뒤질뻔", "", text)
1734
1812
  text = re.sub("뒤져보다", "", text)
1813
+ text = re.sub("뒤져보는", "", text)
1814
+ text = re.sub("뒤져본", "", text)
1815
+ text = re.sub("뒤져볼", "", text)
1735
1816
  picking = ["뒤져", "뒈져", "뒈진", "뒈질", "디져라", "디진다", "디질래", "뒤질"]
1736
1817
  for i in picking:
1737
1818
 
@@ -1845,6 +1926,8 @@ def sexual(text:str, id: int=None):
1845
1926
  text = re.sub('빨리 보지', '', text)
1846
1927
  text = re.sub('보지도 마', '', text)
1847
1928
  text = re.sub('보지는 않', '', text)
1929
+ text = re.sub('보지안으', '', text)
1930
+ text = re.sub('보지안아', '', text)
1848
1931
  text = re.sub('게 보지', '', text)
1849
1932
  text = re.sub("[^ㄱ-힣]", "", text)
1850
1933
  text = re.sub('보g', '보지', text)
@@ -1872,6 +1955,7 @@ def sexual(text:str, id: int=None):
1872
1955
  text = re.sub('바보지', '', text)
1873
1956
  text = re.sub('바보짓', '', text)
1874
1957
  text = re.sub('물어보지', '', text)
1958
+ text = re.sub('하시나보지', '', text)
1875
1959
  text = re.sub('오', '', text)
1876
1960
  pussy = ["보지", "버지물", "버짓물", "보짓", "ⓑⓞⓩⓘ",
1877
1961
  "bozi", "개보즤", "개보지", "버지벌렁벌렁", "보짖", "뵤즤", "봊이"]
@@ -2047,6 +2131,9 @@ def sexual(text:str, id: int=None):
2047
2131
  text = re.sub("소유자", "", text)
2048
2132
  text = re.sub("작업자", "", text)
2049
2133
  text = re.sub("자기위로", "자위", text)
2134
+ text = re.sub("위대하지", "", text)
2135
+ text = re.sub("암살자", "", text)
2136
+ text = re.sub("학자", "", text)
2050
2137
  onahole = ["딸딸이", "질싸", "안에사정", "자위남", "자위녀", "폰섹", "포르노", "폰세엑", "폰쉑", "폰쎅", "질내사정", "그룹섹", "남창", "男色", "누워라이년아",
2051
2138
  "누웠냐씨방새", "다리벌려", "대줄년", "뒤로너어줘", "딸따뤼", "딸쳐", "떡쳐라", "막대쑤셔줘", "막대핥아줘", "먹고보니내딸", "먹고보니누나", "먹고보니딸",
2052
2139
  "먹고보니똥개", "먹고보니엄마", "먹고보니응아", "먹고보니재수", "먹고보니처제", "먹고보니형수", "몸뚱이줄께", "몸안에사정", "밖에다쌀께", "박고빼고",
@@ -2125,6 +2212,7 @@ def belittle(text:str, id: int=None):
2125
2212
  text = re.sub('라운지', '', text)
2126
2213
  text = re.sub('운지법', '', text)
2127
2214
  text = re.sub('싸운지', '', text)
2215
+ text = re.sub('운 지린다', '', text)
2128
2216
  text = re.sub('깔보다', '', text)
2129
2217
  text = re.sub('깔보시', '', text)
2130
2218
  text = re.sub('1년', '', text)
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.1
2
2
  Name: korcen
3
- Version: 0.3.5
3
+ Version: 0.3.7
4
4
  Summary: 한국어 비속어 검열
5
5
  Home-page: https://github.com/KR-korcen/korcen
6
6
  Author: Tanat
@@ -10,3 +10,5 @@ Classifier: License :: OSI Approved :: MIT License
10
10
  Classifier: Operating System :: OS Independent
11
11
  Requires-Python: >=3.6
12
12
  Description-Content-Type: text/markdown
13
+ Requires-Dist: better_profanity
14
+ Requires-Dist: OrderedDict
@@ -5,7 +5,7 @@ with open("README", "r") as fh:
5
5
 
6
6
  setuptools.setup(
7
7
  name="korcen", # Replace with your own PyPI username(id)
8
- version="0.3.5",
8
+ version="0.3.7",
9
9
  author="Tanat",
10
10
  author_email="shrbwjd05@naver.com",
11
11
  description="한국어 비속어 검열",
File without changes
File without changes
File without changes