nlpir 0.1.0-x86-linux → 1.0.0-x86-linux

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (75) hide show
  1. checksums.yaml +4 -4
  2. data/README.md +160 -23
  3. data/bin/lib.txt +1738 -0
  4. data/bin/libNLPIR.so +0 -0
  5. data/lib/Data/Configure.xml +4 -3
  6. data/{test/Data/NLPIR.user → lib/Data/DocExtractor.user} +0 -0
  7. data/lib/Data/English/English.pdat +0 -0
  8. data/lib/Data/English/English.pos +0 -0
  9. data/lib/Data/English/English.ung +0 -0
  10. data/lib/Data/English/English.wordlist +0 -0
  11. data/lib/Data/English/Irrel2regular.map +0 -0
  12. data/lib/Data/English/ne.pdat +0 -0
  13. data/lib/Data/English/ne.pos +0 -0
  14. data/lib/Data/English/ne.wordlist +0 -0
  15. data/lib/Data/FTU8.pdat +0 -0
  16. data/lib/Data/FTU8.wordlist +0 -0
  17. data/lib/Data/FTU82GBK.map +0 -0
  18. data/lib/Data/FieldDict.pdat +0 -0
  19. data/lib/Data/FieldDict.pos +0 -0
  20. data/lib/Data/GBK2FTU8.map +0 -0
  21. data/lib/Data/ICTPOS.map +4 -0
  22. data/lib/Data/NLPIR.user +0 -0
  23. data/lib/Data/NewWord.lst +26 -0
  24. data/lib/Data/PKU.map +4 -0
  25. data/lib/Data/PKU_First.map +4 -0
  26. data/lib/Data/UserDict.pdat +0 -0
  27. data/lib/Data/location.map +0 -0
  28. data/{test/Data/FieldDict.pdat → lib/Data/location.pdat} +0 -0
  29. data/lib/Data/location.wordlist +0 -0
  30. data/lib/Data/sentiment.pdat +0 -0
  31. data/lib/Data/sentiment.ung +0 -0
  32. data/lib/nlpir.rb +129 -104
  33. data/lib/nlpir/version.rb +1 -1
  34. data/nlpir.gemspec +1 -1
  35. data/test/findnewword.txt +103 -0
  36. data/test/test_nlpir.rb +137 -133
  37. data/test/test_result.txt +52 -35
  38. metadata +32 -90
  39. data/test/Data/BIG2GBK.map +0 -0
  40. data/test/Data/BIG5.pdat +0 -0
  41. data/test/Data/BIG5.wordlist +0 -0
  42. data/test/Data/BiWord.big +0 -0
  43. data/test/Data/Configure.xml +0 -15
  44. data/test/Data/CoreDict.pdat +0 -0
  45. data/test/Data/CoreDict.pos +0 -0
  46. data/test/Data/CoreDict.unig +0 -0
  47. data/test/Data/FieldDict.pos +0 -0
  48. data/test/Data/GBK.pdat +0 -0
  49. data/test/Data/GBK.wordlist +0 -0
  50. data/test/Data/GBK2BIG.map +0 -0
  51. data/test/Data/GBK2GBKC.map +0 -0
  52. data/test/Data/GBK2UTF.map +0 -0
  53. data/test/Data/GBKA.pdat +0 -0
  54. data/test/Data/GBKA.wordlist +0 -0
  55. data/test/Data/GBKA2UTF.map +0 -0
  56. data/test/Data/GBKC.pdat +0 -0
  57. data/test/Data/GBKC.wordlist +0 -0
  58. data/test/Data/GBKC2GBK.map +0 -0
  59. data/test/Data/GranDict.pdat +6 -3371
  60. data/test/Data/GranDict.pos +0 -0
  61. data/test/Data/ICTPOS.map +0 -96
  62. data/test/Data/NLPIR.ctx +0 -0
  63. data/test/Data/NLPIR_First.map +0 -96
  64. data/test/Data/NewWord.lst +0 -3
  65. data/test/Data/PKU.map +0 -96
  66. data/test/Data/PKU_First.map +0 -96
  67. data/test/Data/UTF2GBK.map +0 -0
  68. data/test/Data/UTF2GBKA.map +0 -0
  69. data/test/Data/UTF8.pdat +0 -0
  70. data/test/Data/UTF8.wordlist +0 -0
  71. data/test/Data/UserDict.pdat +0 -0
  72. data/test/Data/charset.type +0 -0
  73. data/test/Data/nr.ctx +0 -0
  74. data/test/Data/nr.fsa +0 -0
  75. data/test/Data/nr.role +0 -0
@@ -1,3 +1,3 @@
1
1
  module Nlpir
2
- VERSION = "0.1.0"
2
+ VERSION = "1.0.0"
3
3
  end
@@ -8,7 +8,7 @@ Gem::Specification.new do |spec|
8
8
  spec.version = Nlpir::VERSION
9
9
  spec.authors = ["JoeWoo"]
10
10
  spec.email = ["0wujian0@gmail.com"]
11
- spec.description = %q{"A rubygem wrapper of chinese segment tools ICTCLAS2013"}
11
+ spec.description = %q{"A rubygem wrapper of chinese segment tools ICTCLAS2014"}
12
12
  spec.summary = %q{"ICTCLAS是由中国科学院计算技术研究所研发。中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。"}
13
13
  spec.homepage = "https://github.com/JoeWoo/nlpir"
14
14
  spec.license = "MIT"
@@ -0,0 +1,103 @@
1
+ 分享日志热门日志 淋语教学大纲【不学就会被吸惹】
2
+ 分享
3
+ 淋语教学大纲【不学就会被吸惹】
4
+ 来源: 电阴农妇泰勒十万伏特的日志
5
+ 前言:
6
+
7
+ 淋语(Linglish),是冥王星的官方语言,是宇宙天后淋淋(蔡依林)的专用语言,在地球上约有130亿人使用。学好淋语很重要,欢迎购买《淋语教学大纲》!让我们一起学习淋语吧!
8
+
9
+
10
+
11
+ 必会淋词篇:
12
+
13
+ 1.淋淋/00/蔡10/地才/蓝吊带:指蔡依林(Jolin Tsai)。
14
+
15
+ 2.宇宙天后:指淋淋。
16
+
17
+ 3.公主:指淋淋。
18
+
19
+ 4.三木木:指淋淋
20
+
21
+ 5.骑士:指淋淋的粉丝
22
+
23
+ 6.淋B/淋逼/013/淋13:指淋淋的阴部,一个光明温暖的地方。
24
+
25
+ 7.吸/被吸/开吸/吸入/进b:淋B会吸入宇宙万物,小心哦。
26
+
27
+
28
+
29
+ 语气助词篇:
30
+
31
+ 1.噜
32
+
33
+ a.语气助词,一般意为“了”,常用于肯定句句末,用于陈述事实。
34
+
35
+ 例:①天亮噜。②淋淋要发新专辑噜。
36
+
37
+ b.固定短语“天了噜”,表示惊讶。
38
+
39
+ 例:天了噜,嘎老逼被吸噜。
40
+
41
+
42
+
43
+ 2.惹
44
+
45
+ a.语气助词,带有傲娇语气,多数情况下可与“噜”换用,陈述某种事实。
46
+
47
+ 例:①我可是直男惹。②我可是万年骄傲受惹。③淋淋会吸人的惹。
48
+
49
+ b.叹词,用于陈述句或疑问句句首,也可以单独使用,表示惊讶。
50
+
51
+ 例:①惹!酵母新单居然上榜!②惹?酵母代言的冰红茶这么好卖?③惹!
52
+
53
+
54
+
55
+ 3.奴
56
+
57
+ a.语气助词,多用于肯定句句末,带有较强的感情色彩,一般情况下可与“噜”互换。在表达强烈的兴奋、悲伤的语气时,“奴”为专用助词。
58
+
59
+ 例:①真是气cry我奴!②嘎老逼还有130年就发新专辑,珍是开熏死了奴!
60
+
61
+
62
+
63
+ 4.厚
64
+
65
+ a.叹词,多用于句首,带有较强的感情色彩。和“奴”相比,“厚”多用于抒发兴奋、激动等较为正面的情绪。
66
+
67
+ 例:①厚!霉霉又有写歌灵感噜!②厚!擦妈瘦噜!
68
+
69
+ b.固定短语“厚厚厚”,表达激动、兴奋,用于句首。
70
+
71
+ 例:厚厚厚,我要被吸噜!
72
+
73
+
74
+
75
+ 5.轰
76
+
77
+ a.语气助词,多用于疑问句、反问句句末。
78
+
79
+ 例:①新专辑MUSE好听轰?②难道你不想被吸轰?
80
+
81
+ b.相当于东北话的“嚎”,表达赞叹、同意。
82
+
83
+ 例:①没错轰。②也是轰。③太好了轰。
84
+
85
+ c.通假字,通“疯”。
86
+
87
+ 例:①你这个轰子。②你轰了吗?
88
+
89
+
90
+
91
+ 6.嘻嘻/吸吸
92
+
93
+ a.语气词,多用于恐吓、威胁时的冷笑。
94
+
95
+ 例:①嘻嘻,你要被吸噜!②吸吸,开!
96
+
97
+
98
+
99
+ 7.揪咪
100
+
101
+ a.语气词,装可爱专用。
102
+
103
+ 例:揪咪!小灰灰珍可爱惹!
@@ -9,143 +9,147 @@ include Nlpir
9
9
  $s = "坚定不移沿着中国特色社会主义道路前进,为全面建成小康社会而奋斗"
10
10
  $text = "去年开始,打开百度李毅吧,满屏的帖子大多含有“屌丝”二字,一般网友不仅不懂这词什么意思,更难理解这个词为什么会这么火。然而从下半年开始,“屌丝”已经覆盖网络各个角落,人人争说屌丝,人人争当屌丝。
11
11
  从遭遇恶搞到群体自嘲,“屌丝”名号横空出世“屌丝”一词最早的来源是百度“三巨头吧”对“李毅吧”球迷的恶搞称谓,有嘲讽之意,但却被李毅吧的球迷就此领受下来。“屌丝”二字蕴含着无奈和自嘲的意味,但是李毅吧球迷“不以为耻、反以为荣”,从此以“屌丝”自称,并开始一路爆红网络。"
12
+ $text2 = "淋语(linguage),简称淋语、淋文,是一种主要为淋王星所使用的语言,是淋王星的官方语言。淋语属于黏着语、通过在词语上粘贴语法成分来构成句子,称为活用,其间的结合并不紧密、不改变原来词汇的含义只表语法功能。淋语博大精深自宇宙大爆炸以来已有数亿人民使用自成一个体系。"
12
13
 
13
14
  class NlpirTest < Test::Unit::TestCase
14
- def test_init
15
- assert_equal NLPIR_TRUE,
16
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
17
- end
18
-
19
- def test_exit
20
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
21
-
22
- assert_equal NLPIR_TRUE,
23
- NLPIR_Exit()
24
- end
25
15
 
26
- def test_process_paragraph
27
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
28
-
29
- assert_equal "坚定不移/vl 沿着/p 中国/ns 特色/n 社会主义/n 道路/n 前进/vi ,/wd 为/v 全面/ad 建成/v 小康/n 社会/n 而/cc 奋斗/vi ",
30
- NLPIR_ParagraphProcess($s).force_encoding('utf-8')
31
- assert_equal "坚定不移 沿着 中国 特色 社会主义 道路 前进 , 为 全面 建成 小康 社会 而 奋斗 ",
32
- NLPIR_ParagraphProcess($s,NLPIR_FALSE).force_encoding('utf-8')
33
-
34
- NLPIR_Exit()
35
-
36
- end
37
-
38
- def test_process_paragraph_with_PKU_POS_MAP_SECOND
39
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
40
-
41
- NLPIR_SetPOSmap(PKU_POS_MAP_FIRST)
42
- assert_equal "坚定不移/v 沿着/p 中国/n 特色/n 社会主义/n 道路/n 前进/v ,/w 为/v 全面/a 建成/v 小康/n 社会/n 而/c 奋斗/v ",
43
- NLPIR_ParagraphProcess($s).force_encoding('utf-8')
44
-
45
- NLPIR_Exit()
46
-
47
- end
48
-
49
- def test_process_paragraphA
50
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
51
-
52
- assert_equal 15,
53
- NLPIR_ParagraphProcessA($s).size
54
-
55
- NLPIR_Exit()
56
- end
57
-
58
- def test_process_paragraphAW
59
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
60
-
61
- assert_equal 15,
62
- NLPIR_ParagraphProcessAW($s).size
63
-
64
- NLPIR_Exit()
65
- end
66
-
67
- def test_userDict
68
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
69
-
70
- #puts NLPIR_AddUserWord("1989年春夏之交的政治风波 n")
71
- NLPIR_ParagraphProcess("1989年春夏之交的政治风波1989年政治风波24小时降雪量24小时降雨量863计划ABC防护训练APEC会议BB机BP机C2系统C3I系统C3系统C4ISR系统C4I系统CCITT建议")
72
-
73
- #puts NLPIR_DelUsrWord("1989年春夏之交的政治风波")
74
-
75
- NLPIR_Exit()
76
- end
77
- def test_ImportUserDict
78
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
79
-
80
- assert_equal 5,
81
- NLPIR_ImportUserDict("./userdict.txt")
82
- NLPIR_SaveTheUsrDic()
83
- puts NLPIR_ParagraphProcess("1989年春夏之交的政治风波1989年政治风波24小时降雪量24小时降雨量863计划ABC防护训练APEC会议BB机BP机C2系统C3I系统C3系统C4ISR系统C4I系统CCITT建议")
84
-
85
- NLPIR_Exit()
86
- end
87
- def test_process_file
88
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
89
-
90
- NLPIR_FileProcess("./test.txt", "./test_result.txt", NLPIR_TRUE)
91
- assert_equal 18395,
92
- File.open("./test_result.txt").size
93
-
94
- NLPIR_Exit()
95
- end
96
-
97
- def test_words_count
98
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
99
-
100
- assert_equal 15,
101
- NLPIR_GetParagraphProcessAWordCount($s)
102
-
103
- NLPIR_Exit()
104
- end
16
+ def test_process_alias
17
+ nlpir_init(File.expand_path("../", __FILE__), UTF8_CODE)
18
+
19
+ assert_equal "坚定不移/vl 沿着/p 中国/ns 特色/n 社会主义/n 道路/n 前进/vi ,/wd 为/v 全面/ad 建成/v 小康/n 社会/n 而/cc 奋斗/vi ",
20
+ text_proc($s)
21
+ assert_equal "坚定不移 沿着 中国 特色 社会主义 道路 前进 , 为 全面 建成 小康 社会 而 奋斗 ",
22
+ text_proc($s,NLPIR_FALSE)
23
+
24
+ setPOSmap(PKU_POS_MAP_FIRST)
25
+ assert_equal "坚定不移/v 沿着/p 中国/n 特色/n 社会主义/n 道路/n 前进/v ,/w 为/v 全面/a 建成/v 小康/n 社会/n 而/c 奋斗/v ",
26
+ text_proc($s)
27
+
28
+ assert_equal 15,
29
+ text_procA($s).size
30
+ assert_equal 15,
31
+ text_procAW($s).size
32
+
33
+ result=""
34
+ words_list = text_procA($s)
35
+ i=1
36
+ words_list.each do |a|
37
+ sWhichDic=""
38
+ case a.word_type
39
+ when 0
40
+ sWhichDic = "核心词典"
41
+ when 1
42
+ sWhichDic = "用户词典"
43
+ when 2
44
+ sWhichDic = "专业词典"
45
+ end
46
+ result << "No.#{i}:start:#{a.start}, length:#{a.length}, POS_ID:#{a.sPOS},word_ID:#{a.word_ID},word_type:#{a.word_type} , UserDefine:#{sWhichDic}, Word:#{$s.byteslice(a.start,a.length)}, Weight:#{a.weight}\n"
47
+ i += 1
48
+ end
49
+ assert_equal "No.1:start:0, length:12, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:17262,word_type:0 , UserDefine:核心词典, Word:坚定不移, Weight:10520\nNo.2:start:12, length:6, POS_ID:[112, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:28059,word_type:0 , UserDefine:核心词典, Word:沿着, Weight:10798\nNo.3:start:18, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:32696,word_type:0 , UserDefine:核心词典, Word:中国, Weight:6097\nNo.4:start:24, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:12288,word_type:0 , UserDefine:核心词典, Word:特色, Weight:8469\nNo.5:start:30, length:12, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:48646,word_type:0 , UserDefine:核心词典, Word:社会主义, Weight:7442\nNo.6:start:42, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:75518,word_type:0 , UserDefine:核心词典, Word:道路, Weight:8859\nNo.7:start:48, length:6, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:35004,word_type:0 , UserDefine:核心词典, Word:前进, Weight:9350\nNo.8:start:54, length:1, POS_ID:[119, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:49,word_type:0 , UserDefine:核心词典, Word:,, Weight:2703\nNo.9:start:55, length:3, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:66615,word_type:0 , UserDefine:核心词典, Word:为, Weight:5539\nNo.10:start:58, length:6, POS_ID:[97, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:40698,word_type:0 , UserDefine:核心词典, Word:全面, Weight:7844\nNo.11:start:64, length:6, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:84698,word_type:0 , UserDefine:核心词典, Word:建成, Weight:9027\nNo.12:start:70, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:81502,word_type:0 , UserDefine:核心词典, Word:小康, Weight:10000\nNo.13:start:76, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:48622,word_type:0 , UserDefine:核心词典, Word:社会, Weight:6646\nNo.14:start:82, length:3, POS_ID:[99, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:32081,word_type:0 , UserDefine:核心词典, Word:而, Weight:6610\nNo.15:start:85, length:6, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:27256,word_type:0 , UserDefine:核心词典, Word:奋斗, Weight:9364\n",
50
+ result
51
+
52
+ add_userword("1989年春夏之交的政治风波 n")
53
+ assert_equal "1989年春夏之交的政治风波/n 1989年政治风波/n 24小时降雪量/n 24/m 小时/q 降雨量/n 863/m 计划/n ABC/n 防护/v 训练/v APEC/n 会议/n BB/n 机/n BP机/n C2系统/n C3I/n 系统/n C3/n 系统/n C4ISR/n 系统/n C4I/n 系统/n CCITT/n 建议/n ",
54
+ text_proc("1989年春夏之交的政治风波1989年政治风波24小时降雪量24小时降雨量863计划ABC防护训练APEC会议BB机BP机C2系统C3I系统C3系统C4ISR系统C4I系统CCITT建议")
55
+ del_userword("1989年春夏之交的政治风波")
56
+
57
+ assert_equal 5,
58
+ import_userdict("./userdict.txt")
59
+ save_userdict()
60
+ assert_equal "1989年春夏之交的政治风波/n 1989年政治风波/n 24小时降雪量/n 24/m 小时/q 降雨量/n 863/m 计划/n ABC/n 防护/v 训练/v APEC/n 会议/n BB/n 机/n BP机/n C2系统/n C3I/n 系统/n C3/n 系统/n C4ISR/n 系统/n C4I/n 系统/n CCITT/n 建议/n ",
61
+ text_proc("1989年春夏之交的政治风波1989年政治风波24小时降雪量24小时降雨量863计划ABC防护训练APEC会议BB机BP机C2系统C3I系统C3系统C4ISR系统C4I系统CCITT建议")
62
+
63
+ file_proc("./test.txt", "./test_result.txt", NLPIR_TRUE)
64
+ assert_equal 16932,
65
+ File.open("./test_result.txt").size
66
+
67
+ assert_equal 15,
68
+ text_wordcount($s)
69
+
70
+ assert_equal "李毅/n/4.57#球迷/n/2.20#屌丝/n_newword/1.77#开始/v/1.74#百度/n/1.39#",
71
+ text_keywords($text, 50,NLPIR_TRUE)
72
+ assert_equal "李毅/n/8.90#社会/n/4.06#",
73
+ file_keywords("./test.txt",2, NLPIR_TRUE)
74
+
75
+ assert_equal "淋语/n_new/4.99#",
76
+ text_newwords($text2, 50, NLPIR_TRUE)
77
+ assert_equal "淋语/n_new/5.96#指淋淋/n_new/5.60#",
78
+ file_newwords("./findnewword.txt", 50, NLPIR_TRUE)
79
+
80
+ assert_equal 1644572591,
81
+ text_fingerprint($text)
82
+ nlpir_exit()
105
83
 
106
- def test_GetKeyWords
107
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
108
-
109
- assert_equal "屌丝/n_new/10.19 球迷/n/2.43 开始/v/1.74 百度/nz/1.73 网络/n/1.39 自嘲/vi/1.39 ",
110
- NLPIR_GetKeyWords($text, 50,NLPIR_TRUE).force_encoding('utf-8')
111
-
112
- NLPIR_Exit()
113
- end
114
-
115
- def test_GetKeyWords_form_file
116
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
117
-
118
- assert_equal "屌丝/n_new/15.12 网民/n_new/6.66 解构/n_new/5.27 ",
119
- NLPIR_GetFileKeyWords("./test.txt",2, NLPIR_TRUE).force_encoding('utf-8')
120
-
121
- NLPIR_Exit()
122
- end
123
-
124
- def test_find_NewWords
125
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
126
-
127
- assert_equal "屌丝/n_new/10.19 ",
128
- NLPIR_GetNewWords($text, 50, NLPIR_TRUE).force_encoding('utf-8')
129
-
130
- NLPIR_Exit()
131
- end
132
-
133
- def test_fin_NewWords_from_file
134
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
135
-
136
- assert_equal "屌丝/n_new/15.12 网民/n_new/6.66 解构/n_new/5.27 阿Q/n_new/4.99 网络亚文化/n_new/4.16 贴吧/n_new/3.33 群体自嘲/n_new/3.33 身份卑微/n_new/3.33 ",
137
- NLPIR_GetFileNewWords("./test.txt", 50, NLPIR_TRUE).force_encoding('utf-8')
138
-
139
- NLPIR_Exit()
140
- end
141
-
142
- def test_get_finger_print
143
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
144
-
145
- assert_equal 499666667,
146
- NLPIR_FingerPrint($text)
147
-
148
- NLPIR_Exit()
149
84
  end
150
85
 
86
+ # def test_process_origin
87
+ # NLPIR_Init(File.expand_path("../", __FILE__), UTF8_CODE)
88
+ # setPOSmap(ICT_POS_MAP_SECOND)
89
+ # assert_equal "坚定不移/vl 沿着/p 中国/ns 特色/n 社会主义/n 道路/n 前进/vi ,/wd 为/v 全面/ad 建成/v 小康/n 社会/n 而/cc 奋斗/vi ",
90
+ # NLPIR_ParagraphProcess($s)
91
+ # assert_equal "坚定不移 沿着 中国 特色 社会主义 道路 前进 , 为 全面 建成 小康 社会 而 奋斗 ",
92
+ # NLPIR_ParagraphProcess($s,NLPIR_FALSE)
93
+
94
+ # NLPIR_SetPOSmap(PKU_POS_MAP_FIRST)
95
+ # assert_equal "坚定不移/v 沿着/p 中国/n 特色/n 社会主义/n 道路/n 前进/v ,/w 为/v 全面/a 建成/v 小康/n 社会/n 而/c 奋斗/v ",
96
+ # NLPIR_ParagraphProcess($s)
97
+
98
+ # assert_equal 15,
99
+ # NLPIR_ParagraphProcessA($s).size
100
+ # assert_equal 15,
101
+ # NLPIR_ParagraphProcessAW($s).size
102
+
103
+ # result=""
104
+ # words_list = NLPIR_ParagraphProcessA($s)
105
+ # i=1
106
+ # words_list.each do |a|
107
+ # sWhichDic=""
108
+ # case a.word_type
109
+ # when 0
110
+ # sWhichDic = "核心词典"
111
+ # when 1
112
+ # sWhichDic = "用户词典"
113
+ # when 2
114
+ # sWhichDic = "专业词典"
115
+ # end
116
+ # result << "No.#{i}:start:#{a.start}, length:#{a.length}, POS_ID:#{a.sPOS},word_ID:#{a.word_ID},word_type:#{a.word_type} , UserDefine:#{sWhichDic}, Word:#{$s.byteslice(a.start,a.length)}, Weight:#{a.weight}\n"
117
+ # i += 1
118
+ # end
119
+ # assert_equal "No.1:start:0, length:12, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:17262,word_type:0 , UserDefine:核心词典, Word:坚定不移, Weight:10520\nNo.2:start:12, length:6, POS_ID:[112, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:28059,word_type:0 , UserDefine:核心词典, Word:沿着, Weight:10798\nNo.3:start:18, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:32696,word_type:0 , UserDefine:核心词典, Word:中国, Weight:6097\nNo.4:start:24, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:12288,word_type:0 , UserDefine:核心词典, Word:特色, Weight:8469\nNo.5:start:30, length:12, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:48646,word_type:0 , UserDefine:核心词典, Word:社会主义, Weight:7442\nNo.6:start:42, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:75518,word_type:0 , UserDefine:核心词典, Word:道路, Weight:8859\nNo.7:start:48, length:6, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:35004,word_type:0 , UserDefine:核心词典, Word:前进, Weight:9350\nNo.8:start:54, length:1, POS_ID:[119, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:49,word_type:0 , UserDefine:核心词典, Word:,, Weight:2703\nNo.9:start:55, length:3, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:66615,word_type:0 , UserDefine:核心词典, Word:为, Weight:5539\nNo.10:start:58, length:6, POS_ID:[97, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:40698,word_type:0 , UserDefine:核心词典, Word:全面, Weight:7844\nNo.11:start:64, length:6, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:84698,word_type:0 , UserDefine:核心词典, Word:建成, Weight:9027\nNo.12:start:70, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:81502,word_type:0 , UserDefine:核心词典, Word:小康, Weight:10000\nNo.13:start:76, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:48622,word_type:0 , UserDefine:核心词典, Word:社会, Weight:6646\nNo.14:start:82, length:3, POS_ID:[99, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:32081,word_type:0 , UserDefine:核心词典, Word:而, Weight:6610\nNo.15:start:85, length:6, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:27256,word_type:0 , UserDefine:核心词典, Word:奋斗, Weight:9364\n",
120
+ # result
121
+
122
+ # NLPIR_AddUserWord("1989年春夏之交的政治风波 n")
123
+ # assert_equal "1989年春夏之交的政治风波/n 1989年政治风波/n 24小时降雪量/n 24/m 小时/q 降雨量/n 863/m 计划/n ABC/n 防护/v 训练/v APEC/n 会议/n BB/n 机/n BP机/n C2系统/n C3I/n 系统/n C3/n 系统/n C4ISR/n 系统/n C4I/n 系统/n CCITT/n 建议/n ",
124
+ # NLPIR_ParagraphProcess("1989年春夏之交的政治风波1989年政治风波24小时降雪量24小时降雨量863计划ABC防护训练APEC会议BB机BP机C2系统C3I系统C3系统C4ISR系统C4I系统CCITT建议")
125
+ # NLPIR_DelUsrWord("1989年春夏之交的政治风波")
126
+
127
+ # assert_equal 5,
128
+ # NLPIR_ImportUserDict("./userdict.txt")
129
+ # NLPIR_SaveTheUsrDic()
130
+ # assert_equal "1989年春夏之交的政治风波/n 1989年政治风波/n 24小时降雪量/n 24/m 小时/q 降雨量/n 863/m 计划/n ABC/n 防护/v 训练/v APEC/n 会议/n BB/n 机/n BP机/n C2系统/n C3I/n 系统/n C3/n 系统/n C4ISR/n 系统/n C4I/n 系统/n CCITT/n 建议/n ",
131
+ # NLPIR_ParagraphProcess("1989年春夏之交的政治风波1989年政治风波24小时降雪量24小时降雨量863计划ABC防护训练APEC会议BB机BP机C2系统C3I系统C3系统C4ISR系统C4I系统CCITT建议")
132
+
133
+ # NLPIR_FileProcess("./test.txt", "./test_result.txt", NLPIR_TRUE)
134
+ # assert_equal 16932,
135
+ # File.open("./test_result.txt").size
136
+
137
+ # assert_equal 15,
138
+ # NLPIR_GetParagraphProcessAWordCount($s)
139
+
140
+ # assert_equal "李毅/n/4.57#球迷/n/2.20#屌丝/n_newword/1.77#开始/v/1.74#百度/n/1.39#",
141
+ # NLPIR_GetKeyWords($text, 50,NLPIR_TRUE)
142
+ # assert_equal "李毅/n/8.90#社会/n/4.06#",
143
+ # NLPIR_GetFileKeyWords("./test.txt",2, NLPIR_TRUE)
144
+
145
+ # assert_equal "淋语/n_new/4.99#",
146
+ # NLPIR_GetNewWords($text2, 50, NLPIR_TRUE)
147
+ # assert_equal "淋语/n_new/5.96#指淋淋/n_new/5.60#",
148
+ # NLPIR_GetFileNewWords("./findnewword.txt", 50, NLPIR_TRUE)
149
+
150
+ # assert_equal 1644572591,
151
+ # NLPIR_FingerPrint($text)
152
+ # NLPIR_Exit()
153
+
154
+ # end
151
155
  end
@@ -1,87 +1,104 @@
1
- 屌/n 丝/q ,/wd 一个/mq 字/n 头/n 的/ude1 诞生/vn
1
+ 屌丝/n_newword ,/w 一个/m 字/n 头/n 的/u 诞生/v
2
2
 
3
3
 
4
- 去年/t 开始/v ,/wd 打开/v 百度/nz 李毅/nr 吧/y ,/wd 满/v 屏/ng 的/ude1 帖/ng 子/ng 大多/d 含有/v “/wyz 屌/n 丝/n ”/wyy 二/m 字/n ,/wd 一般/a 网友/n 不仅/c 不/d 懂/v 这/rzv 词/n 什么/ry 意思/n ,/wd 更/d 难/ad 理解/v 这个/rz 词/n 为什么/ryv 会/v 这么/rz 火/n 。/wj 然而/c 从/p 下半年/t 开始/v ,/wd “/wyz 屌/n 丝/n ”/wyy 已经/d 覆盖/v 网络/n 各个/rz 角落/n ,/wd 人人/n 争/v 说/v 屌/n 丝/q ,/wd 人人/n 争/v 当/p 屌/n 丝/q 。/wj
5
4
 
6
- 从/p 遭遇/n 恶/ad 搞/v 到/v 群体/n 自嘲/vi ,/wd “/wyz 屌/n 丝/n ”/wyy 名号/n 横空出世/vl
5
+ 去年/t 开始/v ,/w 打开/v 百度/n 李毅/n 吧/y ,/w 满/v 屏/g 的/u 帖/g 子/g 大多/d 含有/v “/w 屌丝/n_newword ”/w 二/m 字/n ,/w 一般/a 网友/n 不仅/c 不/d 懂/v 这/r 词/n 什么/r 意思/n ,/w 更/d 难/a 理解/v 这个/r 词/n 为什么/r 会/v 这么/r 火/n 。/w 然而/c 从/p 下半年/t 开始/v ,/w “/w 屌丝/n_newword ”/w 已经/d 覆盖/v 网络/n 各个/r 角落/n ,/w 人人/n 争/v 说/v 屌丝/n_newword ,/w 人人/n 争/v 当/p 屌丝/n_newword 。/w
7
6
 
8
- “/wyz 屌/n 丝/n ”/wyy 一/m 词/n 最/d 早/a 的/ude1 来源/n 是/vshi 百度/nz “/wyz 三/m 巨头/n 吧/y ”/wyy 对/p “/wyz 李毅/nr 吧/y ”/wyy 球迷/n 的/ude1 恶/ad 搞/v 称谓/n ,/wd 有/vyou 嘲讽/vn 之/uzhi 意/ng ,/wd 但/c 却/d 被/pbei 李毅/nr 吧/y 的/ude1 球迷/n 就此/d 领受/v 下来/vf 。/wj “/wyz 屌/n 丝/n ”/wyy 二/m 字/n 蕴含/v 着/uzhe 无奈/an 和/cc 自嘲/vi 的/ude1 意味/n ,/wd 但是/c 李毅/nr 吧/y 球迷/n “/wyz 不/d 以/p 为/v 耻/ag 、/wn 反/vi 以/p 为/v 荣/ag ”/wyy ,/wd 从此/d 以/p “/wyz 屌/n 丝/n ”/wyy 自称/v ,/wd 并/cc 开始/v 一路/mq 爆/v 红/a 网络/n 。/wj
7
+ 从/p 遭遇/n 恶/a 搞/v 到/v 群体自嘲/n_new ,/w “/w 屌丝/n_newword ”/w 名号/n 横空出世/v
9
8
 
9
+ “/w 屌丝/n_newword ”/w 一/m 词/n 最/d 早/a 的/u 来源/n 是/v 百度/n “/w 三/m 巨头/n 吧/y ”/w 对/p “/w 李毅/n 吧/y ”/w 球迷/n 的/u 恶/a 搞/v 称谓/n ,/w 有/v 嘲讽/v 之/u 意/g ,/w 但/c 却/d 被/p 李毅/n 吧/y 的/u 球迷/n 就此/d 领受/v 下来/v 。/w “/w 屌丝/n_newword ”/w 二/m 字/n 蕴含/v 着/u 无奈/a 和/c 自嘲/v 的/u 意味/n ,/w 但是/c 李毅/n 吧/y 球迷/n “/w 不/d 以/p 为/v 耻/g 、/w 反/v 以/p 为/v 荣/g ”/w ,/w 从此/d 以/p “/w 屌丝/n_newword ”/w 自称/v ,/w 并/c 开始/v 一路/m 爆红网络/n_new 。/w
10
10
 
11
- 提到/v “/wyz 屌/n 丝/n ”/wyy 就/d 不/d 能/v 不/d 提/v 百度/nz “/wyz 李毅/nr 吧/y ”/wyy ,/wd 也/d 称/v “/wyz D8/x ”/wyy 。/wj 其/rz 会员/n 自/rr 称为/v “/wyz 毅丝/nr2 不/d 挂/v ”/wyy ,/wd 取/v 自/p “/wyz 李毅/nr 的/ude1 粉丝/n ”/wyy 。/wj 因/p 著名/a 足球/n 运动员/n 李毅/nr 当年/t 的/ude1 一/m 句/q 无心/vi 之/uzhi 言/ng :/wp 我/rr 的/ude1 护/v 球/n 像/v 亨利/nrf 。/wj 而/cc 亨利/nrf 在/p 国外/s 被/pbei 称作/v 亨利/nrf 大帝/n 。/wj 因而/c 李毅/nr 从此/d 也/d 被/pbei 冠/vi 上/f “/wyz 李毅/nr 大帝/n ”/wyy 的/ude1 名号/n 。/wj 至于/p 最初/d 是/vshi 谁/ry 开始/v 这么/rz 叫/vi 的/ude1 ,/wd 众说纷纭/vl 。/wj
12
11
 
13
12
 
14
- 而/cc “/wyz 李毅/nr 吧/y ”/wyy 亦/d 有/vyou “/wyz 百度/nz 贴/v 吧/y 卢浮宫/n ”/wyy 之/uzhi 称/ng ,/wd 因为/p 很多/m 在/p 网络/n 流传/v 甚/dg 广/a 的/ude1 内涵/n 文/ng 都/d 出自/v “/wyz 李毅/nr 吧/y ”/wyy ,/wd 包括/v 那/rzv 篇/q 红极一时/vl 的/ude1 《/wkz 李毅/nr 大帝/n 本纪/n 》/wky 。/wj 而/cc 这/rzv 一/m 次/qv ,/wd “/wyz 屌/n 丝/n ”/wyy 爆/v 红/a 网络/n ,/wd 则/c 是/vshi 又/d 一/m 次/qv 体现/v 出/vf “/wyz 李毅/nr 吧/y ”/wyy 对/p 网络/n 文化/n 的/ude1 影响/vn 。/wj
13
+ 提到/v “/w 屌丝/n_newword ”/w 就/d 不/d 能/v 不/d 提/v 百度/n “/w 李毅/n 吧/y ”/w ,/w 也/d 称/v “/w D8/n ”/w 。/w 其/r 会员/n 自/r 称为/v “/w 毅丝/n 不/d 挂/v ”/w ,/w 取/v 自/p “/w 李毅/n 的/u 粉丝/n ”/w 。/w 因/p 著名/a 足球/n 运动员/n 李毅/n 当年/t 的/u 一/m 句/q 无心/v 之/u 言/g :/w 我/r 的/u 护/v 球/n 像/v 亨利/n 。/w 而/c 亨利/n 在/p 国外/s 被/p 称作/v 亨利/n 大帝/n 。/w 因而/c 李毅/n 从此/d 也/d 被/p 冠/v 上/f “/w 李毅/n 大帝/n ”/w 的/u 名号/n 。/w 至于/p 最初/d 是/v 谁/r 开始/v 这么/r 叫/v 的/u ,/w 众说纷纭/v 。/w
15
14
 
16
- 丑/a 穷/a 无能/a 但/c 善良/a :/wp “/wyz 屌/n 丝/n ”/wyy 代表/n 了/ule 最/d 广大/b 年轻人/n 的/ude1 面貌/n
17
15
 
18
- “/wyz 屌/n 丝/n ”/wyy 多/ad 指/v 年轻/a 男性/n ,/wd 他们/rr 出身/v 卑微/an ,/wd 他们/rr 称/v 自己/rr 的/ude1 工作/vn 为/v “/wyz 搬/v 砖/n ”/wyy ,/wd 他们/rr 爱/v 网/n 游/ng 、/wn 爱/v 贴/v 吧/y 、/wn 爱/v “/wyz 女/b 神/n ”/wyy 也/d 爱/v 幻想/n ,/wd 却/d 缺乏/v 行/ng 动力/n ,/wd 想/v 做/v 而/cc 不/d 敢/v 做/v ;/wf 他们/rr 内心/n 虚荣/an ,/wd 却/d 又/d 不屑/v “/wyz 高/a 富/vg 帅/ng ”/wyy 而/cc 故/dg 作/v 清高/a ;/wf 他们/rr 自卑/a 、/wn 自/p 贱/a 却/d 也/d 自以为是/vl ;/wf 他们/rr 是/vshi 善良/a 的/ude1 ,/wd 他们/rr 也/d 是/vshi 懦弱/ad 的/ude1 。/wj
19
16
 
17
+ 而/c “/w 李毅/n 吧/y ”/w 亦/d 有/v “/w 百度/n 贴吧/n_new 卢浮宫/n ”/w 之/u 称/g ,/w 因为/p 很多/m 在/p 网络/n 流传/v 甚/g 广/a 的/u 内涵/n 文/g 都/d 出自/v “/w 李毅/n 吧/y ”/w ,/w 包括/v 那/r 篇/q 红极一时/v 的/u 《/w 李毅/n 大帝/n 本纪/n 》/w 。/w 而/c 这/r 一/m 次/q ,/w “/w 屌丝/n_newword ”/w 爆红网络/n_new ,/w 则/c 是/v 又/d 一/m 次/q 体现/v 出/v “/w 李毅/n 吧/y ”/w 对/p 网络/n 文化/n 的/u 影响/v 。/w
20
18
 
21
- 总之/c ,/wd “/wyz 屌/n 丝/n ”/wyy 就/d 是/vshi 这么/rz 一/m 类/q 人/n ,/wd 他们/rr 身份/n 卑微/an 、/wn 生活/vn 平庸/a 、/wn 未来/t 渺茫/a 、/wn 感情/n 空虚/a ,/wd 不/d 被/pbei 社会/n 认同/vn 。/wj 他们/rr 也/d 渴望/v 获得/v 社会/n 的/ude1 高度/n 认可/vi ,/wd 但/c 又/d 不/d 知道/v 该/v 怎么/ryv 去/vf 做/v ,/wd 生活/vn 没有/v 目标/n ,/wd 缺乏/v 热情/an ,/wd 不/d 满/v 于/p 无聊/a 的/ude1 生活/vn 但/c 又/d 不/d 知道/v 该/rz 做/v 点/qt 什么/ry 。/wj 而/cc 这样/rzv 的/ude1 心态/n 又/d 普遍/ad 存在/v 于/p 我们/rr 周围/f ,/wd 存在/v 于/p 每/rz 一个/mq 人/n 心中/s ,/wd 也/d 就/d 造成/v 了/ule 网络/n 上/f “/wyz 屌/n 丝/n ”/wyy 的/ude1 爆/v 红/a 。/wj
19
+ 丑/a 穷/a 无能/a 但/c 善良/a :/w “/w 屌丝/n_newword ”/w 代表/n 了/u 最/d 广大/b 年轻人/n 的/u 面貌/n
22
20
 
23
- 在/p 对/p “/wyz 女/b 神/n ”/wyy 的/ude1 终极/n 竞争/vn 面前/f ,/wd “/wyz 屌/n 丝/n ”/wyy 的/ude1 悲苦/a “/wyz 高/a 富/vg 帅/ng ”/wyy 永远/d 不/d 懂/v
21
+ “/w 屌丝/n_newword ”/w 多/a 指/v 年轻/a 男性/n ,/w 他们/r 出身/v 卑微/a ,/w 他们/r 称/v 自己/r 的/u 工作/v 为/v “/w 搬/v 砖/n ”/w ,/w 他们/r 爱/v 网/n 游/g 、/w 爱/v 贴吧/n_new 、/w 爱/v “/w 女/b 神/n ”/w 也/d 爱/v 幻想/n ,/w 却/d 缺乏/v 行/g 动力/n ,/w 想/v 做/v 而/c 不/d 敢/v 做/v ;/w 他们/r 内心/n 虚荣/a ,/w 却/d 又/d 不屑/v “/w 高/a 富帅/n_new ”/w 而/c 故/g 作/v 清高/a ;/w 他们/r 自卑/a 、/w 自/p 贱/a 却/d 也/d 自以为是/v ;/w 他们/r 是/v 善良/a 的/u ,/w 他们/r 也/d 是/v 懦弱/a 的/u 。/w
24
22
 
25
- “/wyz 呵呵/o ”/wyy 一/m 词/n 是/vshi “/wyz 屌/n 丝/n ”/wyy 心中/s 永远/d 的/ude1 痛/a ,/wd 当/p 他们/rr 在/p 网上/s 鼓足/v 勇气/n 和/cc “/wyz 女/b 神/n ”/wyy (/wkz 女神/n 是/vshi “/wyz 屌/n 丝/n ”/wyy 对/p 自己/rr 心仪/v 女生/n 的/ude1 专/d 称/v )/wky 搭讪/v 时/ng ,/wd 却/d 往往/d 只/d 得到/v “/wyz 呵呵/o ”/wyy ,/wd “/wyz 睡/v 了/y ”/wyy ,/wd “/wyz 洗澡/vi 去/vf 了/y ”/wyy 这样/rzv 的/ude1 回复/vn ,/wd 这/rzv 一/m 句/q “/wyz 呵呵/o ”/wyy 甚至/d 成/v 了/ule 屌/n 丝/q 身份/n 的/ude1 判别式/n 。/wj
26
23
 
27
24
 
28
- “/wyz 屌/n 丝/n ”/wyy 大多/d 出身/v 贫寒/a 之/uzhi 家/n ,/wd 没有/d 更/d 多/a 的/ude1 背景/n ,/wd 他们/rr 有的/rz 很/d 早/ad 辍学/vi 打工/vi ,/wd 有的/rz 寒窗/n 十二/m 载/qt 考上/v 大学/n ,/wd 毕业/v 后/f 才/d 发现/v 与/p 理想/n 相去甚远/vl …/ws …/ws 他们/rr 从事/vi 着/uzhe 苦/an 与/cc 累/a 的/ude1 工作/vn ,/wd 拿/v 着/uzhe 并/d 不/d 丰厚/a 甚至/d 是/vshi 微薄/a 的/ude1 报酬/n ,/wd 在/p 繁华/a 的/ude1 城市/n 里/f 勉强/ad 分得/v 一/m 杯/q 羹/ng 。/wj
25
+ 总之/c ,/w “/w 屌丝/n_newword ”/w 就/d 是/v 这么/r 一/m 类/q 人/n ,/w 他们/r 身份卑微/n_new 、/w 生活/v 平庸/a 、/w 未来/t 渺茫/a 、/w 感情/n 空虚/a ,/w 不/d 被/p 社会/n 认同/v 。/w 他们/r 也/d 渴望/v 获得/v 社会/n 的/u 高度/n 认可/v ,/w 但/c 又/d 不/d 知道/v 该/v 怎么/r 去/v 做/v ,/w 生活/v 没有/v 目标/n ,/w 缺乏/v 热情/a ,/w 不/d 满/v 于/p 无聊/a 的/u 生活/v 但/c 又/d 不/d 知道/v 该/r 做/v 点/q 什么/r 。/w 而/c 这样/r 的/u 心态/n 又/d 普遍/a 存在/v 于/p 我们/r 周围/f ,/w 存在/v 于/p 每/r 一个/m 人/n 心中/s ,/w 也/d 就/d 造成/v 了/u 网络/n 上/f “/w 屌丝/n_newword ”/w 的/u 爆/v 红/a 。/w
29
26
 
27
+ 在/p 对/p “/w 女/b 神/n ”/w 的/u 终极/n 竞争/v 面前/f ,/w “/w 屌丝/n_newword ”/w 的/u 悲苦/a “/w 高/a 富帅/n_new ”/w 永远/d 不/d 懂/v
30
28
 
31
- 而/cc 与/p “/wyz 屌/n 丝/n ”/wyy 相对/vi 的/ude1 专有/b 词汇/n 则/d 是/vshi “/wyz 高/a 富/vg 帅/ng ”/wyy ,/wd 它/rr 形容/v 男人/n 在/p 身高/n 、/wn 财富/n 、/wn 相貌/n 上/f 的/ude1 完美无缺/al 。/wj 这样/rzv 的/ude1 男人/n 往往/d 会/v 博得/v 众多/m 女性/n 的/ude1 青睐/vn ,/wd 在/p 恋爱/vi ,/wd 婚姻/n 中/f 获得/v 成功/an 。/wj 但是/c 对于/p “/wyz 屌/n 丝/n ”/wyy 来说/uls ,/wd “/wyz 高/a 富/vg 帅/ng ”/wyy 则/d 是/vshi 个/q 心酸/a 的/ude1 词/n ,/wd 因为/c 无论/c 外形/n 、/wn 财富/n 还是/c 学历/n ,/wd “/wyz 屌/n 丝/n ”/wyy 都/d 难/ad 望/v “/wyz 高/a 富/vg 帅/ng ”/wyy 项背/n 。/wj 屌/n 丝/q 只能/v 收获/v “/wyz 呵呵/o ”/wyy ,/wd “/wyz 高/a 富/vg 帅/ng ”/wyy 收获/n “/wyz 女/b 神/n ”/wyy 却/d 从来/d 不/d 费工夫/vl 。/wj
29
+ “/w 呵呵/o ”/w 一/m 词/n 是/v “/w 屌丝/n_newword ”/w 心中/s 永远/d 的/u 痛/a ,/w 当/p 他们/r 在/p 网上/s 鼓足/v 勇气/n 和/c “/w 女/b 神/n ”/w (/w 女神/n 是/v “/w 屌丝/n_newword ”/w 对/p 自己/r 心仪/v 女生/n 的/u 专/d 称/v )/w 搭讪/v 时/g ,/w 却/d 往往/d 只/d 得到/v “/w 呵呵/o ”/w ,/w “/w 睡/v 了/y ”/w ,/w “/w 洗澡/v 去/v 了/y ”/w 这样/r 的/u 回复/v ,/w 这/r 一/m 句/q “/w 呵呵/o ”/w 甚至/d 成/v 了/u 屌丝/n_newword 身份/n 的/u 判别式/n 。/w
32
30
 
33
- “/wyz 屌/n 丝/n ”/wyy 称/v 自己/rr 的/ude1 工作/vn 为/v 搬/v 砖/n ,/wd 他们/rr 从事/vi 着/uzhe 苦/a 累/a 收入/n 微薄/a 的/ude1 工作/vn ,/wd 在/p 繁华/a 的/ude1 城市/n 里/f 分/v 取/v 一/m 杯/q 羹/ng 。/wj
34
31
 
35
- 屌/n 丝/q 能/v 得到/v 女神/n 的/ude1 青睐/vn ,/wd 最后/f 还/d 得/ude3 依赖/v 电影/n 这/rzv 门/q 造/v 梦/n 的/ude1 艺术/n 。/wj
36
32
 
37
- “/wyz 屌/n 丝/n ”/wyy 这个/rz 嘲讽/vn 意味/n 的/ude1 代词/n 迅速/ad 爆/v 红/a ,/wd 迎合/v 了/ule 大众/n 的/ude1 心理/n 和/cc 趣味/n 。/wj 因为/p 你/rr 会/v 发现/v 从/p 表面/n 符合/v 屌/n 丝/q 定义/n 的/ude1 人/n ,/wd 到/v 和/cc 屌/n 丝/q 属性/n 八/m 竿子/n 打/v 不/d 着/uzhe 的/ude1 人/n ,/wd 都/d 在/p 争相/d 认领/v 这/rzv 一/m 名/q 号/n 。/wj 当/p 人人/n 都/d 在/p 忙/v 着/uzhe 确认/v 自己/rr 的/ude1 屌/n 丝/q 身份/n ,/wd 并/cc 乐此不疲/vl 时/ng ,/wd 屌/n 丝/q 一/m 词/n 一定/d 与/p 时代/n 的/ude1 什么/ry 特征/n 实现/v 了/ule 合拍/a 。/wj
33
+ “/w 屌丝/n_newword ”/w 大多/d 出身/v 贫寒/a 之/u 家/n ,/w 没有/d 更/d 多/a 的/u 背景/n ,/w 他们/r 有的/r 很/d 早/a 辍学/v 打工/v ,/w 有的/r 寒窗/n 十二/m 载/q 考上/v 大学/n ,/w 毕业/v 后/f 才/d 发现/v 与/p 理想/n 相去甚远/v …/w …/w 他们/r 从事/v 着/u 苦/a 与/c 累/a 的/u 工作/v ,/w 拿/v 着/u 并/d 不/d 丰厚/a 甚至/d 是/v 微薄/a 的/u 报酬/n ,/w 在/p 繁华/a 的/u 城市/n 里/f 勉强/a 分得/v 一/m 杯/q 羹/g 。/w
38
34
 
39
- “/wyz 屌/n 丝/n ”/wyy 不/d 是/vshi 阿/b Q/x ,/wd 他们/rr 公然/d 比/p 惨/a 并/cc 乐/a 在/p 其中/rz
40
35
 
41
- 有/vyou 评论/n 认为/v ,/wd “/wyz 屌/n 丝/n ”/wyy 是/vshi 新/a 时代/n 的/ude1 阿/b Q/x ,/wd 两者/rzv 并/d 不/d 完全/ad 相同/a 。/wj 首先/c ,/wd 阿/b Q/x 是/vshi 文学/n 巨匠/n 鲁迅/nr 一/m 己/rr 之/uzhi 力/n 创造/v 的/ude1 ,/wd 而/cc “/wyz 屌/n 丝/n ”/wyy 则/d 是/vshi 网络/n 群体/n 狂欢/vi 的/ude1 结果/n ,/wd 它/rr 是/vshi 真正/d 由/p 网/n 民/ng 集体/n 创作/vn 的/ude1 形象/n ;/wf 另外/c ,/wd 阿/b Q/x 最/d 重要/a 的/ude1 特征/n 是/vshi “/wyz 精神/n 胜利/vn 法/n ”/wyy ,/wd 梦想/n 的/ude1 是/vshi “/wyz 银/b 盔/n 银/n 甲/Mg ”/wyy ,/wd 意/ng 淫/ag 的/ude1 是/vshi “/wyz 我/rr 手持/v 钢鞭/n 将/p 你/rr 打/v ”/wyy 。/wj
42
36
 
37
+ 而/c 与/p “/w 屌丝/n_newword ”/w 相对/v 的/u 专有/b 词汇/n 则/d 是/v “/w 高/a 富帅/n_new ”/w ,/w 它/r 形容/v 男人/n 在/p 身高/n 、/w 财富/n 、/w 相貌/n 上/f 的/u 完美无缺/l 。/w 这样/r 的/u 男人/n 往往/d 会/v 博得/v 众多/m 女性/n 的/u 青睐/v ,/w 在/p 恋爱/v ,/w 婚姻/n 中/f 获得/v 成功/a 。/w 但是/c 对于/p “/w 屌丝/n_newword ”/w 来说/u ,/w “/w 高/a 富帅/n_new ”/w 则/d 是/v 个/q 心酸/a 的/u 词/n ,/w 因为/c 无论/c 外形/n 、/w 财富/n 还是/c 学历/n ,/w “/w 屌丝/n_newword ”/w 都/d 难/a 望/v “/w 高/a 富帅/n_new ”/w 项背/n 。/w 屌丝/n_newword 只能/v 收获/v “/w 呵呵/o ”/w ,/w “/w 高/a 富帅/n_new ”/w 收获/n “/w 女/b 神/n ”/w 却/d 从来/d 不/d 费工夫/v 。/w
43
38
 
44
- 而/cc “/wyz 屌/n 丝/n ”/wyy 不仅/c 看起来/v 认命/v 了/y ,/wd 甚至/c 在/p 大多数/m 时候/n 是/vshi 在/p 堂而皇之/dl “/wyz 比/p 惨/a ”/wyy ,/wd 在/p 高/a 富/vg 帅/ng 面前/f ,/wd 他们/rr 直说/vi “/wyz 跪/v 了/y ”/wyy ,/wd 在/p 别人/rr 夸耀/v 成就/n 时/ng ,/wd 他们/rr 嬉皮笑脸/al “/wyz 求/v 别/d 说/v ”/wyy 。/wj 哪怕/c 是/vshi 屌/n 丝/q 用于/v 励/vg 志/n 的/ude1 话/n ,/wd 也/d 是/vshi 让/v 人/n 哭笑不得/al 的/ude1 “/wyz 屌/n 丝/n 不/d 哭/v ,/wd 站/vi 起来/vf 撸/ng ”/wyy 。/wj
39
+ “/w 屌丝/n_newword ”/w 称/v 自己/r 的/u 工作/v 为/v 搬/v 砖/n ,/w 他们/r 从事/v 着/u 苦/a 累/a 收入/n 微薄/a 的/u 工作/v ,/w 在/p 繁华/a 的/u 城市/n 里/f 分/v 取/v 一/m 杯/q 羹/g 。/w
45
40
 
41
+ 屌丝/n_newword 能/v 得到/v 女神/n 的/u 青睐/v ,/w 最后/f 还/d 得/u 依赖/v 电影/n 这/r 门/q 造/v 梦/n 的/u 艺术/n 。/w
46
42
 
47
- 比/p 惨/a ,/wd 是/vshi 一/m 大/a 中国/ns 特色/n 。/wj 中国/ns 人/n 好像/v 历来/d 就/d 都/d 是/vshi 在/p 苦水/n 中/f 泡/v 大/a 似的/uyy ,/wd 大凡/d 见面/vi 就/d 要/v 比/p 惨/a 。/wj 几/m 个/q 学生/n 见面/vi ,/wd 一个/mq 说/v 功课/n 累/a ,/wd 另/rz 一个/mq 绝对/d 不/d 会/v 说/v 学习/v 轻松/a 。/wj 成人/n 见面/vi ,/wd 这个/rz 说/v 他/rr 家/n 的/ude1 房子/n 天天/d 漏水/vi ,/wd 那个/rz 马上/d 接/v 道/v 他/rr 那/rzv 点儿/q 工资/n 真是/d 不/d 够/v 养家/vi 呀/y 。/wj
43
+ “/w 屌丝/n_newword ”/w 这个/r 嘲讽/v 意味/n 的/u 代词/n 迅速/a 爆/v 红/a ,/w 迎合/v 了/u 大众/n 的/u 心理/n 和/c 趣味/n 。/w 因为/p 你/r 会/v 发现/v 从/p 表面/n 符合/v 屌丝/n_newword 定义/n 的/u 人/n ,/w 到/v 和/c 屌丝/n_newword 属性/n 八/m 竿子/n 打/v 不/d 着/u 的/u 人/n ,/w 都/d 在/p 争相/d 认领/v 这/r 一/m 名/q 号/n 。/w 当/p 人人/n 都/d 在/p 忙/v 着/u 确认/v 自己/r 的/u 屌丝/n_newword 身份/n ,/w 并/c 乐此不疲/v 时/g ,/w 屌丝/n_newword 一/m 词/n 一定/d 与/p 时代/n 的/u 什么/r 特征/n 实现/v 了/u 合拍/a 。/w
48
44
 
45
+ “/w 屌丝/n_newword ”/w 不/d 是/v 阿Q/n_new ,/w 他们/r 公然/d 比/p 惨/a 并/c 乐/a 在/p 其中/r
49
46
 
50
- 比/p 惨/a 是/vshi 一/m 种/q 自我/rr 保护/v 的/ude1 方式/n 。/wj 它/rr 的/ude1 心理/n 基础/n 是/vshi 不/d 患/v 寡/ag 而/cc 患/v 不/d 均/d 的/ude1 传统/n 社会/n 认识/n 。/wj 人们/n 不仅/c 物质/n 上/f 要/v 追求/v 平均/a ,/wd 心理/n 上/f 也/d 是/vshi 如此/rzv ,/wd 如果/c 不/d 能/v 和/cc 人/n 一起/s 富/a ,/wd 就/d 希望/v 大家/rr 一起/d 穷/a 。/wj 凡人/n 遇到/v 伤心/a 之/uzhi 事/n ,/wd 这时候/rzt 有/vyou 一个/mq 人/n 对/p 他/rr 或/c 她/rr 说/v ,/wd 我/rr 比/p 你/rr 更/d 惨/a ,/wd 这样/rzv 心理/n 也/d 就/d 平衡/a 了/y ,/wd 也/d 不/d 那么/rz 伤心/a 了/y 。/wj 而/cc “/wyz 屌/n 丝/n ”/wyy 在/p 网络/n 上/f 的/ude1 自嘲/vi ,/wd 则/c 亦/d 有/vyou 比/p 惨/a 之/uzhi 意/ng ,/wd 而/cc 本质/n 则/d 是/vshi 一/m 种/q 发泄/v 和/cc 寻求/v 心理/n 的/ude1 慰藉/vn 。/wj “/wyz 屌/n 丝/n ”/wyy 更/d 似乎/d 是/vshi 在/p 宣称/v ,/wd 反正/d 我/rr 就/d 是/vshi 这么/rz 副/b 屌/n 样/u ,/wd 再/d 怎么/ryv 差/v 都/d 无所谓/vl 了/y 。/wj
47
+ 有/v 评论/n 认为/v ,/w “/w 屌丝/n_newword ”/w 是/v 新/a 时代/n 的/u 阿Q/n_new ,/w 两者/r 并/d 不/d 完全/a 相同/a 。/w 首先/c ,/w 阿Q/n_new 是/v 文学/n 巨匠/n 鲁迅/n 一/m 己/r 之/u 力/n 创造/v 的/u ,/w 而/c “/w 屌丝/n_newword ”/w 则/d 是/v 网络/n 群体/n 狂欢/v 的/u 结果/n ,/w 它/r 是/v 真正/d 由/p 网民/n_new 集体/n 创作/v 的/u 形象/n ;/w 另外/c ,/w 阿Q/n_new 最/d 重要/a 的/u 特征/n 是/v “/w 精神/n 胜利/v 法/n ”/w ,/w 梦想/n 的/u 是/v “/w 银/b 盔/n 银/n 甲/m ”/w ,/w 意/g 淫/g 的/u 是/v “/w 我/r 手持/v 钢鞭/n 将/p 你/r 打/v ”/w 。/w
51
48
 
52
- 现实/n 沉默/a 网上/s 自嘲/vi ,/wd “/wyz 屌/n 丝/n ”/wyy 是/vshi 小/a 人物/n 的/ude1 集体/n 自我/rr 认同/v
53
49
 
54
- “/wyz 屌/n 丝/n ”/wyy 的/ude1 比/p 惨/a ,/wd 就/d 像/v 小/a 人物/n 之间/f 的/ude1 日常/b 寒暄/v ,/wd “/wyz 屌/n 丝/n ”/wyy 已/d 是/vshi 这个/rz 时代/n 小人物/n 的/ude1 形象/n 代表/n 。/wj
55
50
 
51
+ 而/c “/w 屌丝/n_newword ”/w 不仅/c 看起来/v 认命/v 了/y ,/w 甚至/c 在/p 大多数/m 时候/n 是/v 在/p 堂而皇之/l “/w 比/p 惨/a ”/w ,/w 在/p 高/a 富帅/n_new 面前/f ,/w 他们/r 直说/v “/w 跪/v 了/y ”/w ,/w 在/p 别人/r 夸耀/v 成就/n 时/g ,/w 他们/r 嬉皮笑脸/l “/w 求/v 别/d 说/v ”/w 。/w 哪怕/c 是/v 屌丝/n_newword 用于/v 励/g 志/n 的/u 话/n ,/w 也/d 是/v 让/v 人/n 哭笑不得/l 的/u “/w 屌丝/n_newword 不/d 哭/v ,/w 站/v 起来/v 撸/g ”/w 。/w
56
52
 
57
- 冯小刚/nr 的/ude1 电影/n 里/f 曾经/d 对/p 中国/ns 社会/n 的/ude1 小人物/n 有着/v 经典/n 的/ude1 诠释/vn :/wp 中国/ns 的/ude1 很多/m 小人物/n 的/ude1 梦想/n 和/cc 趣味/n 与/p 他/rr 本身/rz 的/ude1 身份/n 有着/v 天壤之别/nl ,/wd 他们/rr 往往/d 身份/n 卑微/an 却/d 又/d 梦想/v 统治/vn 世界/n 。/wj 因为/c 在/p 这个/rz 国家/n ,/wd 在/p 长/ad 达/v 几十/m 年/qt 的/ude1 时间/n 里/f ,/wd 一个/mq 普通人/n 想/v 要/v 一举/d 成为/v 一个/mq 威/ng 震/vi 寰宇/n 、/wn 万/m 人/n 拥戴/v 的/ude1 英雄/n ,/wd 从来/d 都/d 不/d 会/v 被/pbei 视为/v 是/vshi 荒唐/a 变态/n ,/wd 而/cc 恰恰/d 会/v 被/pbei 视为/v 一个/mq 值得/v 鼓励/v 和/cc 学习/v 的/ude1 有/vyou 志/n 青年/n 。/wj
58
53
 
59
54
 
60
- 然而/c 崇高/a 的/ude1 理想/n 和/cc 残酷/a 的/ude1 现实/n 之间/f 存在/v 深深/z 的/ude1 断层/n ,/wd 小/a 人物/n 的/ude1 身份/n 和/cc 不切实际/vl 的/ude1 梦想/n 在/p 一个/mq 人/n 身上/s 纠结/vi ,/wd 在/p 个人/n 自由/an 大大/d 获得/v 解放/v 的/ude1 今天/t ,/wd 却/d 又/d 凸显/v 了/ule 小/a 人物/n 的/ude1 迷茫/an 和/cc 无助/an 。/wj 而/cc 正是/v 这种/r 迷茫/an 和/cc 无助/an 加速/vi 了/ule “/wyz 屌/n 丝/n ”/wyy 文化/n 的/ude1 产生/vn 和/cc 蔓延/vi 。/wj 相/d 比较/d 于/p 冯小刚/nr 电影/n 里/f 的/ude1 小/a 人物/n ,/wd “/wyz 屌/n 丝/n ”/wyy 拥有/v 相同/a 甚至/c 更加/d 卑微/a 的/ude1 身份/n ,/wd 却/d 未必/d 拥有/v 多么/d 宏大/a 、/wn 崇高/a 的/ude1 理想/n ,/wd 他们/rr 安于现状/vl 却/d 又/d 不/d 满/v 于/p 现实/n ,/wd 他们/rr 渴望/v 成功/an ,/wd 却/d 又/d 无法/v 克服/v 成功/a 路上/s 的/ude1 种种/q 困难/an 。/wj 于是/cc ,/wd 他们/rr 选择/v 了/ule 现实/n 中/f 的/ude1 沉默/an ,/wd 网络/n 中/f 的/ude1 自嘲/vn 。/wj
55
+ 比/p 惨/a ,/w 是/v 一/m 大/a 中国/n 特色/n 。/w 中国/n 人/n 好像/v 历来/d 就/d 都/d 是/v 在/p 苦水/n 中/f 泡/v 大/a 似的/u ,/w 大凡/d 见面/v 就/d 要/v 比/p 惨/a 。/w 几/m 个/q 学生/n 见面/v ,/w 一个/m 说/v 功课/n 累/a ,/w 另/r 一个/m 绝对/d 不/d 会/v 说/v 学习/v 轻松/a 。/w 成人/n 见面/v ,/w 这个/r 说/v 他/r 家/n 的/u 房子/n 天天/d 漏水/v ,/w 那个/r 马上/d 接/v 道/v 他/r 那/r 点儿/q 工资/n 真是/d 不/d 够/v 养家/v 呀/y 。/w
61
56
 
62
- 群体/n 自嘲/vi 是/vshi 解/v 构/vg 现实/n 的/ude1 武器/n 也/d 是/vshi 争取/v 诠释/v 自己/rr 生活/vi 的/ude1 权利/n
63
57
 
64
- 自嘲/vi 是/vshi 一/m 种/q 调节/vn 心理/n 的/ude1 天平/n ,/wd 心理学/n 家/q 认为/v :/wp “/wyz 一个/mq 人/n 的/ude1 身体/n 状态/n 是/vshi 受/v 其/rz 心理/n 和/cc 精神/n 状态/n 所/usuo 影响/v 的/ude1 ,/wd 大约/d 有/vyou 一半/m 以上/f 的/ude1 疾病/n 都/d 是/vshi 由/p 心理/n 和/cc 精神/n 方面/n 引起/v 的/ude1 。/wj ”/wyy 所以/c ,/wd 任何/rz 一个/mq 在/p 现实/n 生活/vn 中/f 并/d 不/d 那么/rz 如意/a 的/ude1 人/n ,/wd 对/p 自己/rr 进行/vx 自嘲/vi 都/d 是/vshi 很/d 正常/a 的/ude1 ,/wd “/wyz 屌/n 丝/n ”/wyy 这个/rz 词语/n 无疑/d 更/d 是/vshi 自嘲/vi 文化/n 发展/v 到/v 一定/b 程度/n 的/ude1 产物/n 。/wj
65
58
 
59
+ 比/p 惨/a 是/v 一/m 种/q 自我/r 保护/v 的/u 方式/n 。/w 它/r 的/u 心理/n 基础/n 是/v 不/d 患/v 寡/g 而/c 患/v 不/d 均/d 的/u 传统/n 社会/n 认识/n 。/w 人们/n 不仅/c 物质/n 上/f 要/v 追求/v 平均/a ,/w 心理/n 上/f 也/d 是/v 如此/r ,/w 如果/c 不/d 能/v 和/c 人/n 一起/s 富/a ,/w 就/d 希望/v 大家/r 一起/d 穷/a 。/w 凡人/n 遇到/v 伤心/a 之/u 事/n ,/w 这时候/r 有/v 一个/m 人/n 对/p 他/r 或/c 她/r 说/v ,/w 我/r 比/p 你/r 更/d 惨/a ,/w 这样/r 心理/n 也/d 就/d 平衡/a 了/y ,/w 也/d 不/d 那么/r 伤心/a 了/y 。/w 而/c “/w 屌丝/n_newword ”/w 在/p 网络/n 上/f 的/u 自嘲/v ,/w 则/c 亦/d 有/v 比/p 惨/a 之/u 意/g ,/w 而/c 本质/n 则/d 是/v 一/m 种/q 发泄/v 和/c 寻求/v 心理/n 的/u 慰藉/v 。/w “/w 屌丝/n_newword ”/w 更/d 似乎/d 是/v 在/p 宣称/v ,/w 反正/d 我/r 就/d 是/v 这么/r 副/b 屌/n 样/u ,/w 再/d 怎么/r 差/v 都/d 无所谓/v 了/y 。/w
66
60
 
67
- 然后/c ,/wd 与/p 普通/a 的/ude1 自嘲/vi 不同/a ,/wd “/wyz 屌/n 丝/n ”/wyy 的/ude1 自嘲/vn 是/vshi 一/m 次/qv 自发/b 的/ude1 、/wn 群体/n 性/k 的/ude1 自嘲/vi ,/wd 如此/rzv 大/a 规模/n 的/ude1 自嘲/vn 定然/d 是/vshi 拜/v 网络/n 所/usuo 赐/v ,/wd 而/cc 在/p 别人/rr 嘲讽/v 自己/rr 之前/f 抢先/vi 把/pba 自己/rr 嘲讽/v 完毕/vi ,/wd 基本上/d 是/vshi 一/m 种/q 自我/rr 保护/v 。/wj 究/vg 其/rz 根本/a ,/wd 其实/d 与/p 当年/t 王/nr1 朔/ng 的/ude1 “/wyz 我/rr 是/vshi 流氓/n 我/rr 怕/v 谁/ry ”/wyy 类似/a 。/wj 对方/n 尚未/d 发作/vi ,/wd 且/c 先/d 笑脸相迎/vl ——/wp “/wyz 我/rr 有/vyou 病/n ,/wd 您/rr 别/d 跟/p 我/rr 一般/a 见识/n …/ws …/ws ”/wyy
61
+ 现实/n 沉默/a 网上/s 自嘲/v ,/w “/w 屌丝/n_newword ”/w 是/v 小/a 人物/n 的/u 集体/n 自我/r 认同/v
68
62
 
63
+ “/w 屌丝/n_newword ”/w 的/u 比/p 惨/a ,/w 就/d 像/v 小/a 人物/n 之间/f 的/u 日常/b 寒暄/v ,/w “/w 屌丝/n_newword ”/w 已/d 是/v 这个/r 时代/n 小人物/n 的/u 形象/n 代表/n 。/w
69
64
 
70
- 其实/d ,/wd 归根结底/dl ,/wd “/wyz 屌/n 丝/n ”/wyy 文化/n 不过/c 是/vshi 又/d 一/m 种/q 网络/n 亚文化/n 的/ude1 崛起/vn ,/wd 它/rr 意味着/v 中国/ns 人/n 更/d 多/a 的/ude1 获得/v 了/ule 自己/rr 诠释/v 生活/vn 的/ude1 角度/n 与/cc 权利/n 。/wj 一切/rz 政治/n 、/wn 经济/n 与/cc 社会/n 的/ude1 话题/n ,/wd 在/p 法律/n 允许/v 的/ude1 范围/n 内/f 都/d 可以/v 纳入/v 自己/rr 的/ude1 价值/n 体系/n ,/wd 通过/p 自己/rr 的/ude1 经验/n 与/cc 学识/n ,/wd 作出/v 自己/rr 的/ude1 判断/vn 。/wj 他们/rr 用/p 一/m 种/q 新/a 的/ude1 语言/n 方式/n ,/wd 结构/n 着/uzhe 完全/ad 灌输/v 式/k 的/ude1 教育/vn 与/cc 宣传/vn 。/wj
71
65
 
72
66
 
73
- 解/v 构/vg 的/ude1 这种/r 积极/a 意义/n 还/d 在于/v ,/wd 每个/r 公民/n 都/d 有/vyou 自己/rr 观察/v 生活/vn 、/wn 认识/v 真理/n 的/ude1 眼睛/n 与/cc 心灵/n ,/wd 没有/v 谁/ry 再/d 可以/v 强加/vi 给/p 他们/rr 任何/rz 他们/rr 不再/d 相信/v 的/ude1 东西/n 。/wj 而/cc 那些/rz 貌似/v 强大/a 的/ude1 说教/vn ,/wd 同样/d 失去/v 了/ule 动员/v 的/ude1 能力/n ,/wd 反而/d 被/pbei 人们/n 置/v 之/uzhi 一/m 笑/v 。/wj 就/d 如同/v “/wyz 屌/n 丝/n ”/wyy 对待/v “/wyz 高/a 富/vg 帅/ng ”/wyy 的/ude1 态度/n ,/wd 有/vyou 嘲讽/vn 、/wn 有/vyou 跪拜/v ,/wd 但/c 本质/n 上/f 都/d 是/vshi 一/m 种/q 解/v 构/ng ,/wd 并且/c 也/d 是/vshi 网/n 民/ng 的/ude1 一/m 种/q 自娱/vn 自乐/vn 。/wj
67
+ 冯小刚/n 的/u 电影/n 里/f 曾经/d 对/p 中国/n 社会/n 的/u 小人物/n 有着/v 经典/n 的/u 诠释/v :/w 中国/n 的/u 很多/m 小人物/n 的/u 梦想/n 和/c 趣味/n 与/p 他/r 本身/r 的/u 身份/n 有着/v 天壤之别/l ,/w 他们/r 往往/d 身份卑微/n_new 却/d 又/d 梦想/v 统治/v 世界/n 。/w 因为/c 在/p 这个/r 国家/n ,/w 在/p 长/a 达/v 几十/m 年/q 的/u 时间/n 里/f ,/w 一个/m 普通人/n 想/v 要/v 一举/d 成为/v 一个/m 威/g 震/v 寰宇/n 、/w 万/m 人/n 拥戴/v 的/u 英雄/n ,/w 从来/d 都/d 不/d 会/v 被/p 视为/v 是/v 荒唐/a 变态/n ,/w 而/c 恰恰/d 会/v 被/p 视为/v 一个/m 值得/v 鼓励/v 和/c 学习/v 的/u 有/v 志/n 青年/n 。/w
74
68
 
75
- 网络/n 亚文化/n 需要/v 包容/v 屌/n 丝/n 们/k 需要/v 的/ude1 是/vshi 爱/v
76
69
 
77
- “/wyz 屌/n 丝/n ”/wyy 爆/v 红/a ,/wd 也/d 引来/v 了/ule 反弹/vi 。/wj 有/vyou 文化/n 学者/n 在/p 微/ag 博/ag 上/f 批判/v 说/v ,/wd “/wyz 屌/n 丝/q 文化/n ”/wyy 是/vshi 一/m 种/q 对/p 社会/n 拜/v 金/b 风潮/n 的/ude1 无奈/d 掺杂/v 的/ude1 产物/n ,/wd 亦/d 充满/v 了/ule 格调/n 不/d 高/a 的/ude1 低俗/a 气/n 。/wj
78
70
 
71
+ 然而/c 崇高/a 的/u 理想/n 和/c 残酷/a 的/u 现实/n 之间/f 存在/v 深深/z 的/u 断层/n ,/w 小/a 人物/n 的/u 身份/n 和/c 不切实际/v 的/u 梦想/n 在/p 一个/m 人/n 身上/s 纠结/v ,/w 在/p 个人/n 自由/a 大大/d 获得/v 解放/v 的/u 今天/t ,/w 却/d 又/d 凸显/v 了/u 小/a 人物/n 的/u 迷茫/a 和/c 无助/a 。/w 而/c 正是/v 这种/r 迷茫/a 和/c 无助/a 加速/v 了/u “/w 屌丝/n_newword ”/w 文化/n 的/u 产生/v 和/c 蔓延/v 。/w 相/d 比较/d 于/p 冯小刚/n 电影/n 里/f 的/u 小/a 人物/n ,/w “/w 屌丝/n_newword ”/w 拥有/v 相同/a 甚至/c 更加/d 卑微/a 的/u 身份/n ,/w 却/d 未必/d 拥有/v 多么/d 宏大/a 、/w 崇高/a 的/u 理想/n ,/w 他们/r 安于现状/v 却/d 又/d 不/d 满/v 于/p 现实/n ,/w 他们/r 渴望/v 成功/a ,/w 却/d 又/d 无法/v 克服/v 成功/a 路上/s 的/u 种种/q 困难/a 。/w 于是/c ,/w 他们/r 选择/v 了/u 现实/n 中/f 的/u 沉默/a ,/w 网络/n 中/f 的/u 自嘲/v 。/w
79
72
 
80
- 当然/d ,/wd 对于/p 这/rzv 点/qt ,/wd 网/n 民/ng 是/vshi 不买账/vl 的/ude1 。/wj 其实/d 网/v 民/ng 只/d 是/vshi 用于/v 自嘲/vi ,/wd 不过/c 跟/p “/wyz 咆哮/vi 体/ng ”/wyy 和/cc “/wyz 伤/n 不/d 起/vf ”/wyy 是/vshi 一个/mq 性质/n 。/wj 动不动/d 上升/vi 至/p 道德/n 层面/n ,/wd 是/vshi 小题大做/vl 得/ude3 有/vyou 点/qt 凶猛/a ——/wp 作为/v 一/m 种/q 网络/n 亚文化/n ,/wd 跟/p 同性恋/vn 和/cc 朋/ng 克/vg 摇滚/n 一样/uyy 不/d 属于/v 主流/n 社会/n 罢了/y ,/wd 更/d 远远/d 称/v 不/d 上/vf 有害/a 。/wj
73
+ 群体自嘲/n_new 是/v 解构/n_new 现实/n 的/u 武器/n 也/d 是/v 争取/v 诠释/v 自己/r 生活/v 的/u 权利/n
81
74
 
75
+ 自嘲/v 是/v 一/m 种/q 调节/v 心理/n 的/u 天平/n ,/w 心理学/n 家/q 认为/v :/w “/w 一个/m 人/n 的/u 身体/n 状态/n 是/v 受/v 其/r 心理/n 和/c 精神/n 状态/n 所/u 影响/v 的/u ,/w 大约/d 有/v 一半/m 以上/f 的/u 疾病/n 都/d 是/v 由/p 心理/n 和/c 精神/n 方面/n 引起/v 的/u 。/w ”/w 所以/c ,/w 任何/r 一个/m 在/p 现实/n 生活/v 中/f 并/d 不/d 那么/r 如意/a 的/u 人/n ,/w 对/p 自己/r 进行/v 自嘲/v 都/d 是/v 很/d 正常/a 的/u ,/w “/w 屌丝/n_newword ”/w 这个/r 词语/n 无疑/d 更/d 是/v 自嘲/v 文化/n 发展/v 到/v 一定/b 程度/n 的/u 产物/n 。/w
82
76
 
83
- 一个/mq 社会/n 的/ude1 道德/n 水准/n 和/cc 价值观/n 会/v 因为/p 某个/rz 网络/n 词语/n 发生/v 了/ule 大/a 倒退/vn ?/ww 那/rzv 是/vshi 不/d 是/vshi 对/p 整个/b 社会/n 太/d 没/v 信心/n 了/y 。/wj 当然/d ,/wd “/wyz 屌/n 丝/n ”/wyy 文化/n 中/f 不/d 是/vshi 毫无/v 问题/n ,/wd 其中/rz 对于/p 女性/n 的/ude1 态度/n 以及/cc 对/p 女性/n 有/vyou 侮辱/vn 的/ude1 词汇/n 在/p 网络/n 上/f 流行/v 就/d 不/d 妥当/a 。/wj
84
77
 
85
78
 
86
- 屌/n 丝/q 亚文化/n 下/f ,/wd 看/v 起来/vf 嬉皮笑脸/al 满不在乎/vl 面孔/n 的/ude1 背后/f ,/wd 其实/d 和/cc 这个/rz 社会/n 中/f 其他/rzv 所有/b 人/n 一样/uyy ,/wd 他们/rr 所/usuo 需要/v 的/ude1 ,/wd 是/vshi 爱/v 。/wj
79
+ 然后/c ,/w 与/p 普通/a 的/u 自嘲/v 不同/a ,/w “/w 屌丝/n_newword ”/w 的/u 自嘲/v 是/v 一/m 次/q 自发/b 的/u 、/w 群体/n 性/k 的/u 自嘲/v ,/w 如此/r 大/a 规模/n 的/u 自嘲/v 定然/d 是/v 拜/v 网络/n 所/u 赐/v ,/w 而/c 在/p 别人/r 嘲讽/v 自己/r 之前/f 抢先/v 把/p 自己/r 嘲讽/v 完毕/v ,/w 基本上/d 是/v 一/m 种/q 自我/r 保护/v 。/w 究/g 其/r 根本/a ,/w 其实/d 与/p 当年/t 王/n 朔/g 的/u “/w 我/r 是/v 流氓/n 我/r 怕/v 谁/r ”/w 类似/a 。/w 对方/n 尚未/d 发作/v ,/w 且/c 先/d 笑脸相迎/v ——/w “/w 我/r 有/v 病/n ,/w 您/r 别/d 跟/p 我/r 一般/a 见识/n …/w …/w ”/w
80
+
81
+
82
+
83
+ 其实/d ,/w 归根结底/l ,/w “/w 屌丝/n_newword ”/w 文化/n 不过/c 是/v 又/d 一/m 种/q 网络亚文化/n_new 的/u 崛起/v ,/w 它/r 意味着/v 中国/n 人/n 更/d 多/a 的/u 获得/v 了/u 自己/r 诠释/v 生活/v 的/u 角度/n 与/c 权利/n 。/w 一切/r 政治/n 、/w 经济/n 与/c 社会/n 的/u 话题/n ,/w 在/p 法律/n 允许/v 的/u 范围/n 内/f 都/d 可以/v 纳入/v 自己/r 的/u 价值/n 体系/n ,/w 通过/p 自己/r 的/u 经验/n 与/c 学识/n ,/w 作出/v 自己/r 的/u 判断/v 。/w 他们/r 用/p 一/m 种/q 新/a 的/u 语言/n 方式/n ,/w 结构/n 着/u 完全/a 灌输/v 式/k 的/u 教育/v 与/c 宣传/v 。/w
84
+
85
+
86
+
87
+ 解构/n_new 的/u 这种/r 积极/a 意义/n 还/d 在于/v ,/w 每个/r 公民/n 都/d 有/v 自己/r 观察/v 生活/v 、/w 认识/v 真理/n 的/u 眼睛/n 与/c 心灵/n ,/w 没有/v 谁/r 再/d 可以/v 强加/v 给/p 他们/r 任何/r 他们/r 不再/d 相信/v 的/u 东西/n 。/w 而/c 那些/r 貌似/v 强大/a 的/u 说教/v ,/w 同样/d 失去/v 了/u 动员/v 的/u 能力/n ,/w 反而/d 被/p 人们/n 置/v 之/u 一/m 笑/v 。/w 就/d 如同/v “/w 屌丝/n_newword ”/w 对待/v “/w 高/a 富帅/n_new ”/w 的/u 态度/n ,/w 有/v 嘲讽/v 、/w 有/v 跪拜/v ,/w 但/c 本质/n 上/f 都/d 是/v 一/m 种/q 解构/n_new ,/w 并且/c 也/d 是/v 网民/n_new 的/u 一/m 种/q 自娱/v 自乐/v 。/w
88
+
89
+ 网络亚文化/n_new 需要/v 包容/v 屌丝/n_newword 们/k 需要/v 的/u 是/v 爱/v
90
+
91
+ “/w 屌丝/n_newword ”/w 爆/v 红/a ,/w 也/d 引来/v 了/u 反弹/v 。/w 有/v 文化/n 学者/n 在/p 微/g 博/g 上/f 批判/v 说/v ,/w “/w 屌丝文化/n_new ”/w 是/v 一/m 种/q 对/p 社会/n 拜/v 金/b 风潮/n 的/u 无奈/d 掺杂/v 的/u 产物/n ,/w 亦/d 充满/v 了/u 格调/n 不/d 高/a 的/u 低俗/a 气/n 。/w
92
+
93
+
94
+
95
+ 当然/d ,/w 对于/p 这/r 点/q ,/w 网民/n_new 是/v 不买账/v 的/u 。/w 其实/d 网民/n_new 只/d 是/v 用于/v 自嘲/v ,/w 不过/c 跟/p “/w 咆哮/v 体/g ”/w 和/c “/w 伤/n 不/d 起/v ”/w 是/v 一个/m 性质/n 。/w 动不动/d 上升/v 至/p 道德/n 层面/n ,/w 是/v 小题大做/v 得/u 有/v 点/q 凶猛/a ——/w 作为/v 一/m 种/q 网络亚文化/n_new ,/w 跟/p 同性恋/v 和/c 朋/g 克/g 摇滚/n 一样/u 不/d 属于/v 主流/n 社会/n 罢了/y ,/w 更/d 远远/d 称/v 不/d 上/v 有害/a 。/w
96
+
97
+
98
+
99
+ 一个/m 社会/n 的/u 道德/n 水准/n 和/c 价值观/n 会/v 因为/p 某个/r 网络/n 词语/n 发生/v 了/u 大/a 倒退/v ?/w 那/r 是/v 不/d 是/v 对/p 整个/b 社会/n 太/d 没/v 信心/n 了/y 。/w 当然/d ,/w “/w 屌丝/n_newword ”/w 文化/n 中/f 不/d 是/v 毫无/v 问题/n ,/w 其中/r 对于/p 女性/n 的/u 态度/n 以及/c 对/p 女性/n 有/v 侮辱/v 的/u 词汇/n 在/p 网络/n 上/f 流行/v 就/d 不/d 妥当/a 。/w
100
+
101
+
102
+
103
+ 屌丝/n_newword 亚文化/n 下/f ,/w 看/v 起来/v 嬉皮笑脸/l 满不在乎/v 面孔/n 的/u 背后/f ,/w 其实/d 和/c 这个/r 社会/n 中/f 其他/r 所有/b 人/n 一样/u ,/w 他们/r 所/u 需要/v 的/u ,/w 是/v 爱/v 。/w
87
104