korcen 0.3.15__tar.gz → 0.3.17__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.1
2
2
  Name: korcen
3
- Version: 0.3.15
3
+ Version: 0.3.17
4
4
  Summary: 한국어 비속어 검열
5
5
  Home-page: https://github.com/KR-korcen/korcen
6
6
  Author: Tanat
@@ -227,6 +227,15 @@ def general(text:str, id: int=None):
227
227
  text = re.sub('8시 ', '', text)
228
228
  text = re.sub('!wt ㅂㅇ', '', text)
229
229
  text = re.sub('!ㅈㅅ ㅂㅇ', '', text)
230
+ text = re.sub('다시 방', '', text)
231
+ text = re.sub('시 불이익', '', text)
232
+ text = re.sub('다시 바꿀', '', text)
233
+ text = re.sub('다시 바꿔', '', text)
234
+ text = re.sub('다시 불러', '', text)
235
+ text = re.sub('다시 불안', '', text)
236
+ text = re.sub('하시바라 이노스케', '', text)
237
+ text = re.sub('할 시', '', text)
238
+ text = re.sub('다시 불러', '', text)
230
239
  text = re.sub("[^ㄱ-힣]", "", text)
231
240
  fuck = ["시ㅂ", "시ㅏㄹ", "씨ㅂ", "씨ㅏㄹ", "ㅣ발", "ㅆ발", "ㅅ발", "ㅅㅂ", "ㅆㅂ", "ㅆ바", "ㅅ바",
232
241
  "시ㅂㅏ", "ㅅㅂㅏ", "시ㅏㄹ", "씨ㅏㄹ", "ㅅ불", "ㅆ불", "ㅅ쁠", "ㅆ뿔", "ㅆㅣ발", "ㅅㅟ발", "ㅅㅣㅂㅏ",
@@ -235,8 +244,6 @@ def general(text:str, id: int=None):
235
244
  if i in text:
236
245
  return True
237
246
 
238
- text = re.sub('다시 방', '', text)
239
- text = re.sub('다시 불러', '', text)
240
247
  text = re.sub('불러드', '', text)
241
248
  text = re.sub('시발음', '', text)
242
249
  text = re.sub('시발택시', '', text)
@@ -293,6 +300,8 @@ def general(text:str, id: int=None):
293
300
  text = re.sub('구로역 시발', '', text)
294
301
  text = re.sub('로벅스', '', text)
295
302
  text = re.sub('쉬바나', '', text)
303
+ text = re.sub('애쉬바루스', '', text)
304
+ text = re.sub('애쉬바이올렛', '', text)
296
305
  text = re.sub('벌었는데', '', text)
297
306
  text = re.sub('엠씨방', '', text)
298
307
  text = re.sub('빨리', '', text)
@@ -300,7 +309,6 @@ def general(text:str, id: int=None):
300
309
  text = re.sub('벌금', '', text)
301
310
  text = re.sub('시방향', '', text)
302
311
  text = re.sub('불법', '', text)
303
- text = re.sub('할시', '', text)
304
312
  text = re.sub('발릴', '', text)
305
313
  text = re.sub('발표', '', text)
306
314
  text = re.sub('방송', '', text)
@@ -317,7 +325,6 @@ def general(text:str, id: int=None):
317
325
  text = re.sub('이', '', text)
318
326
  text = re.sub('일', '', text)
319
327
  text = re.sub('의', '', text)
320
- text = re.sub('하시바라 이노스케', '', text)
321
328
  text = re.sub("[^가-힣]", "", text)
322
329
  text = re.sub('즉시발급', '', text)
323
330
  text = re.sub('련', '놈', text)
@@ -332,7 +339,7 @@ def general(text:str, id: int=None):
332
339
  "뛰봘", "뜨발", "뜨벌", "띄발", "씨바알", "샤빨", "샤발", "스벌", "쓰벌", "신발련", "신발년", "신발놈", "띠발",
333
340
  "띠바랄", "시방", "씨방", "씨부련", "시부련", "씨잇발", "씨잇파알", "씨잇바알", "시잇발", "시잇바알", "쒸이발",
334
341
  "쉬이빨", "씹팔", "쉬바", "시병발신", "씱빩", "쉬바난", "쉬바놈", "쉬바녀", "쉬바년", "쉬바노마", "쉬바새", "쉬불", "쉬이바",
335
- "시벨놈", "시뱅놈", "시봉새", "씻뻘"]
342
+ "시벨놈", "시뱅놈", "시봉새", "씻뻘", "씌벌"]
336
343
  for i in fuck:
337
344
  if i in text:
338
345
  return True
@@ -423,13 +430,14 @@ def general(text:str, id: int=None):
423
430
  text = re.sub("[^가-힣]", "", text)
424
431
  text = re.sub('영', '', text)
425
432
  text = re.sub('엉', '', text)
426
- asshole = ["병신", "병딱", "벼신", "붱신", "뼝신", "뿽신", "삥신", "병시니", "병형신", "뵹신", "병긴"]
433
+ asshole = ["병신", "병딱", "벼신", "붱신", "뼝신", "뿽신", "삥신", "병시니", "병형신", "뵹신", "병긴", "비응신"]
427
434
  for i in asshole:
428
435
  if i in text:
429
436
  return True
430
437
 
431
438
  text = re.sub('전염병', '', newtext)
432
439
  text = re.sub('감염병', '', text)
440
+ text = re.sub('화염병', '', text)
433
441
  text = re.sub("[^가-힣]", "", text)
434
442
  motherfucker = ["염병", "엠병", "옘병", "염병", "얨병", "옘뼝"]
435
443
  for i in motherfucker:
@@ -490,6 +498,7 @@ def general(text:str, id: int=None):
490
498
  text = re.sub('세끼먹', '', text)
491
499
  text = re.sub('고양이새끼', '', text)
492
500
  text = re.sub('호랑이새끼', '', text)
501
+ text = re.sub('용새끼', '', text)
493
502
  text = re.sub('말새끼', '', text)
494
503
  text = re.sub('사자새끼', '', text)
495
504
  text = re.sub('범새끼', '', text)
@@ -498,22 +507,25 @@ def general(text:str, id: int=None):
498
507
  text = re.sub('새끼손', '', text)
499
508
  text = re.sub('셰리프', '', text)
500
509
  text = re.sub('로쉐리', '', text)
501
- sonofbitch = ["새끼", "쉐리", "쌔끼", "썌끼", "쎼끼", "쌬끼", "샠끼", "세끼", "샊", "쌖", "섺", "쎆", "십새", "새키", "씹색", "새까", "새꺄",
502
- "새뀌", "새끠", "새캬", "색꺄", "색끼", "섹히", "셁기", "셁끼", "셐기", "셰끼", "셰리", "쉐꺄", "십색꺄", "십떼끼", "십데꺄", "십때끼", "십새꺄", "십새캬", "쉑히", "씹새기", "고아새기"]
510
+ sonofbitch = ["새끼", "쉐리", "쌔끼", "썌끼", "쎼끼", "쌬끼", "샠끼", "세끼", "샊", "쌖", "섺", "쎆", "십새", "새키", "씹색", "새까", "새꺄", "샛끼",
511
+ "새뀌", "새끠", "새캬", "색꺄", "색끼", "섹히", "셁기", "셁끼", "셐기", "셰끼", "셰리", "쉐꺄", "십색꺄", "십떼끼", "십데꺄", "십때끼",
512
+ "십새꺄", "십새캬", "쉑히", "씹새기", "고아새기", "샠기", "애새기", "이새기", "느그새기", "장애새기"]
503
513
  for i in sonofbitch:
504
514
  if i in text:
505
515
  return True
506
516
 
507
- dick = ["w같은"]
517
+ dick = ["w같은", "w도 없"]
508
518
  for i in dick:
509
519
  if i in newtext:
510
520
  return True
511
521
  text = re.sub('丕', '조', newtext)
512
522
  text = re.sub('刀卜', '까', text)
523
+ text = re.sub(r'조 \d+까지', '', text)
513
524
  text = re.sub("[^ㄱ-힣]", "", text)
514
525
  text = re.sub('줫습니다', '', text)
515
526
  text = re.sub('줫음', '', text)
516
527
  text = re.sub('줫잖아', '', text)
528
+ text = re.sub('줫겠지', '', text)
517
529
  text = re.sub('쫒아', '', text)
518
530
  text = re.sub('쫒는', '', text)
519
531
  text = re.sub('쫒기다', '', text)
@@ -548,7 +560,7 @@ def general(text:str, id: int=None):
548
560
  text = re.sub('내쫒다', '', text)
549
561
  text = re.sub('좇아', '', text)
550
562
  dick = ["좆", "촟", "조까", "좈", "쫒", "졷", "좃", "줮",
551
- "좋같", "좃같", "좃물", "좃밥", "줫", "좋밥", "좋물", "좇"]
563
+ "좋같", "좃같", "좃물", "좃밥", "줫", "좋밥", "좋물", "좇", "조옷까"]
552
564
  for i in dick:
553
565
  if i in text:
554
566
  return True
@@ -615,6 +627,7 @@ def general(text:str, id: int=None):
615
627
  text = re.sub('넘는', '', text)
616
628
  text = re.sub('소개', '', text)
617
629
  text = re.sub('생긴게', '', text)
630
+ text = re.sub('날개같다', '', text)
618
631
  sonofagun = ["개같", "개가튼", "개쉑", "개스키", "개세끼", "개색히", "개가뇬", "개새기", "개쌔기", "개쌔끼", "쌖", "쎆", "새긔", "개소리", "개년", "개소리",
619
632
  "개드립", "개돼지", "개씹창", "개간나", "개스끼", "개섹기", "개자식", "개때꺄", "개때끼", "개발남아", "개샛끼", "개가든", "개가뜬", "개가턴", "개가툰", "개가튼",
620
633
  "개갇은", "개갈보", "개걸레", "개너마", "개너므", "개넌", "개넘", "개녀나", "개년", "개노마", "개노무새끼", "개논", "개놈", "개뇨나", "개뇬", "개뇸", "개뇽", "개눔",
@@ -628,7 +641,7 @@ def general(text:str, id: int=None):
628
641
  "개졎", "개조또", "개조옷", "개족", "개좃", "개좆", "개좇", "개지랄", "개지럴", "개창년", "개허러", "개허벌년", "개호러", "개호로", "개후랄", "개후레", "개후로",
629
642
  "개후장", "걔섀끼", "걔잡넘", "걔잡년", "걔잡뇬", "게가튼", "게같은", "게너마", "게년", "게노마", "게놈", "게뇨나", "게뇬", "게뇸", "게뇽", "게눔", "게늠",
630
643
  "게띠발넘", "게부랄", "게부알", "게새끼", "게새리", "게새키", "게색", "게색기", "게색끼", "게샛키", "게세꺄", "게자지", "게잡넘", "게잡년", "게잡뇬", "게젓",
631
- "게좆", "계같은뇬", "계뇬", "계뇽", "쉬댕", "쉬뎅"]
644
+ "게좆", "계같은뇬", "계뇬", "계뇽", "쉬댕", "쉬뎅", "개생끼"]
632
645
  for i in sonofagun:
633
646
  if i in text:
634
647
  return True
@@ -664,7 +677,7 @@ def minor(text:str, id: int=None):
664
677
  text = re.sub('미틴', '미친', text)
665
678
  text = re.sub('년', '놈', text)
666
679
  text = re.sub('련', '놈', text)
667
- damnit = ["미친놈", "무친놈"]
680
+ damnit = ["미친놈", "미친새끼"]
668
681
  for i in damnit:
669
682
  if i in text:
670
683
  return True
@@ -803,6 +816,7 @@ def sexual(text:str, id: int=None):
803
816
  text = re.sub('보지안으', '', text)
804
817
  text = re.sub('보지안아', '', text)
805
818
  text = re.sub('게 보지', '', text)
819
+ text = re.sub('어케 보지', '', text)
806
820
  text = re.sub("[^ㄱ-힣]", "", text)
807
821
  text = re.sub('보g', '보지', text)
808
822
  text = re.sub('하나보지', '', text)
@@ -822,8 +836,11 @@ def sexual(text:str, id: int=None):
822
836
  text = re.sub('보지않', '', text)
823
837
  text = re.sub('해보지', '', text)
824
838
  text = re.sub('보지마', '', text)
825
- text = re.sub('어케 보지', '', text)
826
839
  text = re.sub('보지말', '', text)
840
+ text = re.sub('맛보지를', '', text)
841
+ text = re.sub('후보지를', '', text)
842
+ text = re.sub('힘내보지', '', text)
843
+ text = re.sub('안보지만', '', text)
827
844
  text = re.sub('정보', '', text)
828
845
  text = re.sub('지팡이', '', text)
829
846
  text = re.sub('행보', '', text)
@@ -877,6 +894,7 @@ def sexual(text:str, id: int=None):
877
894
  text = re.sub('지원', '', text)
878
895
  text = re.sub('자지금', '', text)
879
896
  text = re.sub("[^ㄱ-힣]", "", text)
897
+ text = re.sub('늦게자지만', '', text)
880
898
  text = re.sub('자지않', '', text)
881
899
  text = re.sub('어케자지', '', text)
882
900
  text = re.sub('자지도마', '', text)
@@ -885,6 +903,18 @@ def sexual(text:str, id: int=None):
885
903
  text = re.sub('안자지', '', text)
886
904
  text = re.sub('못자지', '', text)
887
905
  text = re.sub('자지금', '', text)
906
+ text = re.sub('남자지만', '', text)
907
+ text = re.sub('여자지만', '', text)
908
+ text = re.sub('지지자지만', '', text)
909
+ text = re.sub('흡연자지만', '', text)
910
+ text = re.sub('유권자지만', '', text)
911
+ text = re.sub('기자지만', '', text)
912
+ text = re.sub('감염자지만', '', text)
913
+ text = re.sub('최강자지만', '', text)
914
+ text = re.sub('수배자지만', '', text)
915
+ text = re.sub('놀랠노자지만', '', text)
916
+ text = re.sub('제자지만', '', text)
917
+ text = re.sub('설립자지만', '', text)
888
918
  text = re.sub('지건', '', text)
889
919
  text = re.sub('감자', '', text)
890
920
  text = re.sub('아', '', text)
@@ -1088,6 +1118,7 @@ def belittle(text:str, id: int=None):
1088
1118
  text = re.sub('뇬', '년', text)
1089
1119
  text = re.sub('놈', '년', text)
1090
1120
  text = re.sub('넘', '년', text)
1121
+ text = re.sub('나같은년', '', text)
1091
1122
  text = re.sub('러운지', '', text)
1092
1123
  text = re.sub('지킬 앤 하이드', '', text)
1093
1124
  text = re.sub('지킬앤하이드', '', text)
@@ -1112,14 +1143,16 @@ def belittle(text:str, id: int=None):
1112
1143
  text = re.sub('8년', '', text)
1113
1144
  text = re.sub('9년', '', text)
1114
1145
  text = re.sub('0년', '', text)
1146
+ text = re.sub('싸가지고', '', text)
1115
1147
  text = re.sub("[^가-힣]", "", text)
1116
1148
  text = re.sub('더운지역', '', text)
1117
1149
  text = re.sub('나따까리', '', text)
1118
- belittling = ["따까리", "장애년", "찐따년", "싸가지", "창년", "썅년", "버러지", "고아년", "고아년", "개간년", "종간나", "도구년", "걸래년", "썅년", "씹년",
1119
- "창녀", "머저리", "씹쓰래기", "씹쓰레기", "씹장생", "씹자식", "운지", "급식충", "틀딱충", "조센징", "매국노", "똥꼬충", "진지충", "듣보잡",
1150
+ belittling = ["따까리", "장애년", "찐따년", "싸가지", "창년", "썅년", "버러지", "고아년", "고아년", "개간년", "종간나", "도구년", "걸래년", "썅년", "씹년", "개걸레",
1151
+ "창녀", "머저리", "씹쓰래기", "씹쓰레기", "씹장생", "씹자식", "운지", "급식충", "틀딱충", "조센징", "매국노", "똥꼬충", "진지충", "듣보잡", "개찐따",
1120
1152
  "한남충", "정신병자", "중생아", "돌팔이", "김치녀", "폰팔이", "틀딱년", "같은년", "개돼중", "쓰글년", "썩을년", "썩글년", "씹할", "거지새끼", "거지쉐뀌",
1121
1153
  "거지쉑이", "거지쎄끼", "거지쒜리", "걸래가튼", "걸래넘", "걸래년", "걸래놈", "걸레가튼", "걸레년", "그지새끼", "그지새키", "그지색", "기집년", "까진년",
1122
- "깔보", "난잡년", "빡대가리", "더러운년", "돌아이", "또라이", "장애려", "샹놈", "김치남", "김치녀", "혜지련", "한유남충", "페미나치", "페미년", "꼴페미"]
1154
+ "깔보", "난잡년", "빡대가리", "더러운년", "돌아이", "또라이", "장애려", "샹놈", "김치남", "김치녀", "혜지련", "한유남충", "페미나치", "페미년", "꼴페미",
1155
+ "개장애"]
1123
1156
  for i in belittling:
1124
1157
  if i in text:
1125
1158
  return True
@@ -1160,7 +1193,7 @@ def parent(text:str, id: int=None):
1160
1193
  text = text.lower()
1161
1194
  newtext = re.sub(' ', '', text)
1162
1195
 
1163
- your = ["ㄴ1ㄱ", "ㄴ1ㅁ", "느금ㅁ", "ㄴㄱ마", "ㄴㄱ빠", "ㄴ금빠", "ㅇH미", "ㄴ1에미", "늬애미"]
1196
+ your = ["ㄴ1ㄱ", "ㄴ1ㅁ", "느금ㅁ", "ㄴㄱ마", "ㄴㄱ빠", "ㄴ금빠", "ㅇH미", "ㄴ1에미", "늬애미", "@ㅐ미", "@ㅐ비"]
1164
1197
  for i in your:
1165
1198
  if i in newtext:
1166
1199
  return True
@@ -1187,7 +1220,10 @@ def parent(text:str, id: int=None):
1187
1220
  text = re.sub("[^가-힣]", "", newtext)
1188
1221
  text = re.sub("도", "", text)
1189
1222
  motherfuck = ["니애미", "노애미", "노앰", "앰뒤련", "애믿쥐",
1190
- "아버지도없는게", "애미도없는게", "애비도없는게", "어머니도없는게", "엄마없네", "니애비", "노애비", "애미없", "애비없", "애미뒤", "애비뒤", "니아빠", "너에미", "눼기미", "뉘귀미", "뉘기미", "뉘김이", "뉘뮈", "뉘미랄", "뉘미럴", "뉘미롤", "뉘밀얼", "뉘밀할", "뉘어미", "뉘에미", "느검마", "늬긔미", "늬기미", "니기미", "니믜창", "니미랄", "니미럴", "니미쒸블", "니미씨펄넘", "니미좃", "니밀할", "니부랑", "니뽕좃", "애미죽"]
1223
+ "아버지없는게", "애미없는게", "애비없는게", "어머니없는게", "엄마없네", "니애비", "노애비", "애미없", "애비없", "애미뒤", "애비뒤",
1224
+ "니아빠", "너에미", "눼기미", "뉘귀미", "뉘기미", "뉘김이", "뉘뮈", "뉘미랄", "뉘미럴", "뉘미롤", "뉘밀얼", "뉘밀할", "뉘어미", "뉘에미",
1225
+ "느검마", "늬긔미", "늬기미", "니기미", "니믜창", "니미랄", "니미럴", "니미쒸블", "니미씨펄넘", "니미좃", "니밀할", "니부랑", "니뽕좃",
1226
+ "애미죽", "애미디진"]
1191
1227
  for i in motherfuck:
1192
1228
  if i in text:
1193
1229
  return True
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.1
2
2
  Name: korcen
3
- Version: 0.3.15
3
+ Version: 0.3.17
4
4
  Summary: 한국어 비속어 검열
5
5
  Home-page: https://github.com/KR-korcen/korcen
6
6
  Author: Tanat
@@ -5,7 +5,7 @@ with open("README", "r") as fh:
5
5
 
6
6
  setuptools.setup(
7
7
  name="korcen", # Replace with your own PyPI username(id)
8
- version="0.3.15",
8
+ version="0.3.17",
9
9
  author="Tanat",
10
10
  author_email="shrbwjd05@naver.com",
11
11
  description="한국어 비속어 검열",
File without changes
File without changes
File without changes