nlpir 0.0.4-x86-mingw32
Sign up to get free protection for your applications and to get access to all the features.
- checksums.yaml +7 -0
- data/.gitignore +17 -0
- data/LICENSE.txt +22 -0
- data/README.md +195 -0
- data/Rakefile +11 -0
- data/bin/NLPIR.dll +0 -0
- data/lib/Data/BIG2GBK.map +0 -0
- data/lib/Data/BIG5.pdat +0 -0
- data/lib/Data/BIG5.wordlist +0 -0
- data/lib/Data/BiWord.big +0 -0
- data/lib/Data/Configure.xml +15 -0
- data/lib/Data/CoreDict.pdat +0 -0
- data/lib/Data/CoreDict.pos +0 -0
- data/lib/Data/CoreDict.unig +0 -0
- data/lib/Data/FieldDict.pdat +0 -0
- data/lib/Data/FieldDict.pos +0 -0
- data/lib/Data/GBK.pdat +0 -0
- data/lib/Data/GBK.wordlist +0 -0
- data/lib/Data/GBK2BIG.map +0 -0
- data/lib/Data/GBK2GBKC.map +0 -0
- data/lib/Data/GBK2UTF.map +0 -0
- data/lib/Data/GBKA.pdat +0 -0
- data/lib/Data/GBKA.wordlist +0 -0
- data/lib/Data/GBKA2UTF.map +0 -0
- data/lib/Data/GBKC.pdat +0 -0
- data/lib/Data/GBKC.wordlist +0 -0
- data/lib/Data/GBKC2GBK.map +0 -0
- data/lib/Data/GranDict.pdat +3369 -8
- data/lib/Data/GranDict.pos +0 -0
- data/lib/Data/ICTPOS.map +96 -0
- data/lib/Data/NLPIR.ctx +0 -0
- data/lib/Data/NLPIR.user +0 -0
- data/lib/Data/NLPIR_First.map +96 -0
- data/lib/Data/NewWord.lst +25 -0
- data/lib/Data/PKU.map +96 -0
- data/lib/Data/PKU_First.map +96 -0
- data/lib/Data/UTF2GBK.map +0 -0
- data/lib/Data/UTF2GBKA.map +0 -0
- data/lib/Data/UTF8.pdat +0 -0
- data/lib/Data/UTF8.wordlist +0 -0
- data/lib/Data/UserDict.pdat +0 -0
- data/lib/Data/charset.type +0 -0
- data/lib/Data/nr.ctx +0 -0
- data/lib/Data/nr.fsa +0 -0
- data/lib/Data/nr.role +0 -0
- data/lib/nlpir/version.rb +3 -0
- data/lib/nlpir.rb +275 -0
- data/nlpir.gemspec +25 -0
- data/test/Data/BIG2GBK.map +0 -0
- data/test/Data/BIG5.pdat +0 -0
- data/test/Data/BIG5.wordlist +0 -0
- data/test/Data/BiWord.big +0 -0
- data/test/Data/Configure.xml +15 -0
- data/test/Data/CoreDict.pdat +0 -0
- data/test/Data/CoreDict.pos +0 -0
- data/test/Data/CoreDict.unig +0 -0
- data/test/Data/FieldDict.pdat +0 -0
- data/test/Data/FieldDict.pos +0 -0
- data/test/Data/GBK.pdat +0 -0
- data/test/Data/GBK.wordlist +0 -0
- data/test/Data/GBK2BIG.map +0 -0
- data/test/Data/GBK2GBKC.map +0 -0
- data/test/Data/GBK2UTF.map +0 -0
- data/test/Data/GBKA.pdat +0 -0
- data/test/Data/GBKA.wordlist +0 -0
- data/test/Data/GBKA2UTF.map +0 -0
- data/test/Data/GBKC.pdat +0 -0
- data/test/Data/GBKC.wordlist +0 -0
- data/test/Data/GBKC2GBK.map +0 -0
- data/test/Data/GranDict.pdat +3369 -8
- data/test/Data/GranDict.pos +0 -0
- data/test/Data/ICTPOS.map +96 -0
- data/test/Data/NLPIR.ctx +0 -0
- data/test/Data/NLPIR.user +0 -0
- data/test/Data/NLPIR_First.map +96 -0
- data/test/Data/NewWord.lst +73 -0
- data/test/Data/PKU.map +96 -0
- data/test/Data/PKU_First.map +96 -0
- data/test/Data/UTF2GBK.map +0 -0
- data/test/Data/UTF2GBKA.map +0 -0
- data/test/Data/UTF8.pdat +0 -0
- data/test/Data/UTF8.wordlist +0 -0
- data/test/Data/UserDict.pdat +0 -0
- data/test/Data/charset.type +0 -0
- data/test/Data/nr.ctx +0 -0
- data/test/Data/nr.fsa +0 -0
- data/test/Data/nr.role +0 -0
- data/test/test.txt +52 -0
- data/test/test_nlpir.rb +158 -0
- data/test/test_result.txt +87 -0
- data/test/userdict.txt +5 -0
- metadata +206 -0
@@ -0,0 +1,87 @@
|
|
1
|
+
屌/n 丝/q ,/wd 一个/mq 字/n 头/n 的/ude1 诞生/vn
|
2
|
+
|
3
|
+
|
4
|
+
去年/t 开始/v ,/wd 打开/v 百度/nz 李毅/nr 吧/y ,/wd 满/v 屏/ng 的/ude1 帖/ng 子/ng 大多/d 含有/v “/wyz 屌/n 丝/n ”/wyy 二/m 字/n ,/wd 一般/a 网友/n 不仅/c 不/d 懂/v 这/rzv 词/n 什么/ry 意思/n ,/wd 更/d 难/ad 理解/v 这个/rz 词/n 为什么/ryv 会/v 这么/rz 火/n 。/wj 然而/c 从/p 下半年/t 开始/v ,/wd “/wyz 屌/n 丝/n ”/wyy 已经/d 覆盖/v 网络/n 各个/rz 角落/n ,/wd 人人/n 争/v 说/v 屌/n 丝/q ,/wd 人人/n 争/v 当/p 屌/n 丝/q 。/wj
|
5
|
+
|
6
|
+
从/p 遭遇/n 恶/ad 搞/v 到/v 群体/n 自嘲/vi ,/wd “/wyz 屌/n 丝/n ”/wyy 名号/n 横空出世/vl
|
7
|
+
|
8
|
+
“/wyz 屌/n 丝/n ”/wyy 一/m 词/n 最/d 早/a 的/ude1 来源/n 是/vshi 百度/nz “/wyz 三/m 巨头/n 吧/y ”/wyy 对/p “/wyz 李毅/nr 吧/y ”/wyy 球迷/n 的/ude1 恶/ad 搞/v 称谓/n ,/wd 有/vyou 嘲讽/vn 之/uzhi 意/ng ,/wd 但/c 却/d 被/pbei 李毅/nr 吧/y 的/ude1 球迷/n 就此/d 领受/v 下来/vf 。/wj “/wyz 屌/n 丝/n ”/wyy 二/m 字/n 蕴含/v 着/uzhe 无奈/an 和/cc 自嘲/vi 的/ude1 意味/n ,/wd 但是/c 李毅/nr 吧/y 球迷/n “/wyz 不/d 以/p 为/v 耻/ag 、/wn 反/vi 以/p 为/v 荣/ag ”/wyy ,/wd 从此/d 以/p “/wyz 屌/n 丝/n ”/wyy 自称/v ,/wd 并/cc 开始/v 一路/mq 爆/v 红/a 网络/n 。/wj
|
9
|
+
|
10
|
+
|
11
|
+
提到/v “/wyz 屌/n 丝/n ”/wyy 就/d 不/d 能/v 不/d 提/v 百度/nz “/wyz 李毅/nr 吧/y ”/wyy ,/wd 也/d 称/v “/wyz D8/x ”/wyy 。/wj 其/rz 会员/n 自/rr 称为/v “/wyz 毅丝/nr2 不/d 挂/v ”/wyy ,/wd 取/v 自/p “/wyz 李毅/nr 的/ude1 粉丝/n ”/wyy 。/wj 因/p 著名/a 足球/n 运动员/n 李毅/nr 当年/t 的/ude1 一/m 句/q 无心/vi 之/uzhi 言/ng :/wp 我/rr 的/ude1 护/v 球/n 像/v 亨利/nrf 。/wj 而/cc 亨利/nrf 在/p 国外/s 被/pbei 称作/v 亨利/nrf 大帝/n 。/wj 因而/c 李毅/nr 从此/d 也/d 被/pbei 冠/vi 上/f “/wyz 李毅/nr 大帝/n ”/wyy 的/ude1 名号/n 。/wj 至于/p 最初/d 是/vshi 谁/ry 开始/v 这么/rz 叫/vi 的/ude1 ,/wd 众说纷纭/vl 。/wj
|
12
|
+
|
13
|
+
|
14
|
+
而/cc “/wyz 李毅/nr 吧/y ”/wyy 亦/d 有/vyou “/wyz 百度/nz 贴/v 吧/y 卢浮宫/n ”/wyy 之/uzhi 称/ng ,/wd 因为/p 很多/m 在/p 网络/n 流传/v 甚/dg 广/a 的/ude1 内涵/n 文/ng 都/d 出自/v “/wyz 李毅/nr 吧/y ”/wyy ,/wd 包括/v 那/rzv 篇/q 红极一时/vl 的/ude1 《/wkz 李毅/nr 大帝/n 本纪/n 》/wky 。/wj 而/cc 这/rzv 一/m 次/qv ,/wd “/wyz 屌/n 丝/n ”/wyy 爆/v 红/a 网络/n ,/wd 则/c 是/vshi 又/d 一/m 次/qv 体现/v 出/vf “/wyz 李毅/nr 吧/y ”/wyy 对/p 网络/n 文化/n 的/ude1 影响/vn 。/wj
|
15
|
+
|
16
|
+
丑/a 穷/a 无能/a 但/c 善良/a :/wp “/wyz 屌/n 丝/n ”/wyy 代表/n 了/ule 最/d 广大/b 年轻人/n 的/ude1 面貌/n
|
17
|
+
|
18
|
+
“/wyz 屌/n 丝/n ”/wyy 多/ad 指/v 年轻/a 男性/n ,/wd 他们/rr 出身/v 卑微/an ,/wd 他们/rr 称/v 自己/rr 的/ude1 工作/vn 为/v “/wyz 搬/v 砖/n ”/wyy ,/wd 他们/rr 爱/v 网/n 游/ng 、/wn 爱/v 贴/v 吧/y 、/wn 爱/v “/wyz 女/b 神/n ”/wyy 也/d 爱/v 幻想/n ,/wd 却/d 缺乏/v 行/ng 动力/n ,/wd 想/v 做/v 而/cc 不/d 敢/v 做/v ;/wf 他们/rr 内心/n 虚荣/an ,/wd 却/d 又/d 不屑/v “/wyz 高/a 富/vg 帅/ng ”/wyy 而/cc 故/dg 作/v 清高/a ;/wf 他们/rr 自卑/a 、/wn 自/p 贱/a 却/d 也/d 自以为是/vl ;/wf 他们/rr 是/vshi 善良/a 的/ude1 ,/wd 他们/rr 也/d 是/vshi 懦弱/ad 的/ude1 。/wj
|
19
|
+
|
20
|
+
|
21
|
+
总之/c ,/wd “/wyz 屌/n 丝/n ”/wyy 就/d 是/vshi 这么/rz 一/m 类/q 人/n ,/wd 他们/rr 身份/n 卑微/an 、/wn 生活/vn 平庸/a 、/wn 未来/t 渺茫/a 、/wn 感情/n 空虚/a ,/wd 不/d 被/pbei 社会/n 认同/vn 。/wj 他们/rr 也/d 渴望/v 获得/v 社会/n 的/ude1 高度/n 认可/vi ,/wd 但/c 又/d 不/d 知道/v 该/v 怎么/ryv 去/vf 做/v ,/wd 生活/vn 没有/v 目标/n ,/wd 缺乏/v 热情/an ,/wd 不/d 满/v 于/p 无聊/a 的/ude1 生活/vn 但/c 又/d 不/d 知道/v 该/rz 做/v 点/qt 什么/ry 。/wj 而/cc 这样/rzv 的/ude1 心态/n 又/d 普遍/ad 存在/v 于/p 我们/rr 周围/f ,/wd 存在/v 于/p 每/rz 一个/mq 人/n 心中/s ,/wd 也/d 就/d 造成/v 了/ule 网络/n 上/f “/wyz 屌/n 丝/n ”/wyy 的/ude1 爆/v 红/a 。/wj
|
22
|
+
|
23
|
+
在/p 对/p “/wyz 女/b 神/n ”/wyy 的/ude1 终极/n 竞争/vn 面前/f ,/wd “/wyz 屌/n 丝/n ”/wyy 的/ude1 悲苦/a “/wyz 高/a 富/vg 帅/ng ”/wyy 永远/d 不/d 懂/v
|
24
|
+
|
25
|
+
“/wyz 呵呵/o ”/wyy 一/m 词/n 是/vshi “/wyz 屌/n 丝/n ”/wyy 心中/s 永远/d 的/ude1 痛/a ,/wd 当/p 他们/rr 在/p 网上/s 鼓足/v 勇气/n 和/cc “/wyz 女/b 神/n ”/wyy (/wkz 女神/n 是/vshi “/wyz 屌/n 丝/n ”/wyy 对/p 自己/rr 心仪/v 女生/n 的/ude1 专/d 称/v )/wky 搭讪/v 时/ng ,/wd 却/d 往往/d 只/d 得到/v “/wyz 呵呵/o ”/wyy ,/wd “/wyz 睡/v 了/y ”/wyy ,/wd “/wyz 洗澡/vi 去/vf 了/y ”/wyy 这样/rzv 的/ude1 回复/vn ,/wd 这/rzv 一/m 句/q “/wyz 呵呵/o ”/wyy 甚至/d 成/v 了/ule 屌/n 丝/q 身份/n 的/ude1 判别式/n 。/wj
|
26
|
+
|
27
|
+
|
28
|
+
“/wyz 屌/n 丝/n ”/wyy 大多/d 出身/v 贫寒/a 之/uzhi 家/n ,/wd 没有/d 更/d 多/a 的/ude1 背景/n ,/wd 他们/rr 有的/rz 很/d 早/ad 辍学/vi 打工/vi ,/wd 有的/rz 寒窗/n 十二/m 载/qt 考上/v 大学/n ,/wd 毕业/v 后/f 才/d 发现/v 与/p 理想/n 相去甚远/vl …/ws …/ws 他们/rr 从事/vi 着/uzhe 苦/an 与/cc 累/a 的/ude1 工作/vn ,/wd 拿/v 着/uzhe 并/d 不/d 丰厚/a 甚至/d 是/vshi 微薄/a 的/ude1 报酬/n ,/wd 在/p 繁华/a 的/ude1 城市/n 里/f 勉强/ad 分得/v 一/m 杯/q 羹/ng 。/wj
|
29
|
+
|
30
|
+
|
31
|
+
而/cc 与/p “/wyz 屌/n 丝/n ”/wyy 相对/vi 的/ude1 专有/b 词汇/n 则/d 是/vshi “/wyz 高/a 富/vg 帅/ng ”/wyy ,/wd 它/rr 形容/v 男人/n 在/p 身高/n 、/wn 财富/n 、/wn 相貌/n 上/f 的/ude1 完美无缺/al 。/wj 这样/rzv 的/ude1 男人/n 往往/d 会/v 博得/v 众多/m 女性/n 的/ude1 青睐/vn ,/wd 在/p 恋爱/vi ,/wd 婚姻/n 中/f 获得/v 成功/an 。/wj 但是/c 对于/p “/wyz 屌/n 丝/n ”/wyy 来说/uls ,/wd “/wyz 高/a 富/vg 帅/ng ”/wyy 则/d 是/vshi 个/q 心酸/a 的/ude1 词/n ,/wd 因为/c 无论/c 外形/n 、/wn 财富/n 还是/c 学历/n ,/wd “/wyz 屌/n 丝/n ”/wyy 都/d 难/ad 望/v “/wyz 高/a 富/vg 帅/ng ”/wyy 项背/n 。/wj 屌/n 丝/q 只能/v 收获/v “/wyz 呵呵/o ”/wyy ,/wd “/wyz 高/a 富/vg 帅/ng ”/wyy 收获/n “/wyz 女/b 神/n ”/wyy 却/d 从来/d 不/d 费工夫/vl 。/wj
|
32
|
+
|
33
|
+
“/wyz 屌/n 丝/n ”/wyy 称/v 自己/rr 的/ude1 工作/vn 为/v 搬/v 砖/n ,/wd 他们/rr 从事/vi 着/uzhe 苦/a 累/a 收入/n 微薄/a 的/ude1 工作/vn ,/wd 在/p 繁华/a 的/ude1 城市/n 里/f 分/v 取/v 一/m 杯/q 羹/ng 。/wj
|
34
|
+
|
35
|
+
屌/n 丝/q 能/v 得到/v 女神/n 的/ude1 青睐/vn ,/wd 最后/f 还/d 得/ude3 依赖/v 电影/n 这/rzv 门/q 造/v 梦/n 的/ude1 艺术/n 。/wj
|
36
|
+
|
37
|
+
“/wyz 屌/n 丝/n ”/wyy 这个/rz 嘲讽/vn 意味/n 的/ude1 代词/n 迅速/ad 爆/v 红/a ,/wd 迎合/v 了/ule 大众/n 的/ude1 心理/n 和/cc 趣味/n 。/wj 因为/p 你/rr 会/v 发现/v 从/p 表面/n 符合/v 屌/n 丝/q 定义/n 的/ude1 人/n ,/wd 到/v 和/cc 屌/n 丝/q 属性/n 八/m 竿子/n 打/v 不/d 着/uzhe 的/ude1 人/n ,/wd 都/d 在/p 争相/d 认领/v 这/rzv 一/m 名/q 号/n 。/wj 当/p 人人/n 都/d 在/p 忙/v 着/uzhe 确认/v 自己/rr 的/ude1 屌/n 丝/q 身份/n ,/wd 并/cc 乐此不疲/vl 时/ng ,/wd 屌/n 丝/q 一/m 词/n 一定/d 与/p 时代/n 的/ude1 什么/ry 特征/n 实现/v 了/ule 合拍/a 。/wj
|
38
|
+
|
39
|
+
“/wyz 屌/n 丝/n ”/wyy 不/d 是/vshi 阿/b Q/x ,/wd 他们/rr 公然/d 比/p 惨/a 并/cc 乐/a 在/p 其中/rz
|
40
|
+
|
41
|
+
有/vyou 评论/n 认为/v ,/wd “/wyz 屌/n 丝/n ”/wyy 是/vshi 新/a 时代/n 的/ude1 阿/b Q/x ,/wd 两者/rzv 并/d 不/d 完全/ad 相同/a 。/wj 首先/c ,/wd 阿/b Q/x 是/vshi 文学/n 巨匠/n 鲁迅/nr 一/m 己/rr 之/uzhi 力/n 创造/v 的/ude1 ,/wd 而/cc “/wyz 屌/n 丝/n ”/wyy 则/d 是/vshi 网络/n 群体/n 狂欢/vi 的/ude1 结果/n ,/wd 它/rr 是/vshi 真正/d 由/p 网/n 民/ng 集体/n 创作/vn 的/ude1 形象/n ;/wf 另外/c ,/wd 阿/b Q/x 最/d 重要/a 的/ude1 特征/n 是/vshi “/wyz 精神/n 胜利/vn 法/n ”/wyy ,/wd 梦想/n 的/ude1 是/vshi “/wyz 银/b 盔/n 银/n 甲/Mg ”/wyy ,/wd 意/ng 淫/ag 的/ude1 是/vshi “/wyz 我/rr 手持/v 钢鞭/n 将/p 你/rr 打/v ”/wyy 。/wj
|
42
|
+
|
43
|
+
|
44
|
+
而/cc “/wyz 屌/n 丝/n ”/wyy 不仅/c 看起来/v 认命/v 了/y ,/wd 甚至/c 在/p 大多数/m 时候/n 是/vshi 在/p 堂而皇之/dl “/wyz 比/p 惨/a ”/wyy ,/wd 在/p 高/a 富/vg 帅/ng 面前/f ,/wd 他们/rr 直说/vi “/wyz 跪/v 了/y ”/wyy ,/wd 在/p 别人/rr 夸耀/v 成就/n 时/ng ,/wd 他们/rr 嬉皮笑脸/al “/wyz 求/v 别/d 说/v ”/wyy 。/wj 哪怕/c 是/vshi 屌/n 丝/q 用于/v 励/vg 志/n 的/ude1 话/n ,/wd 也/d 是/vshi 让/v 人/n 哭笑不得/al 的/ude1 “/wyz 屌/n 丝/n 不/d 哭/v ,/wd 站/vi 起来/vf 撸/ng ”/wyy 。/wj
|
45
|
+
|
46
|
+
|
47
|
+
比/p 惨/a ,/wd 是/vshi 一/m 大/a 中国/ns 特色/n 。/wj 中国/ns 人/n 好像/v 历来/d 就/d 都/d 是/vshi 在/p 苦水/n 中/f 泡/v 大/a 似的/uyy ,/wd 大凡/d 见面/vi 就/d 要/v 比/p 惨/a 。/wj 几/m 个/q 学生/n 见面/vi ,/wd 一个/mq 说/v 功课/n 累/a ,/wd 另/rz 一个/mq 绝对/d 不/d 会/v 说/v 学习/v 轻松/a 。/wj 成人/n 见面/vi ,/wd 这个/rz 说/v 他/rr 家/n 的/ude1 房子/n 天天/d 漏水/vi ,/wd 那个/rz 马上/d 接/v 道/v 他/rr 那/rzv 点儿/q 工资/n 真是/d 不/d 够/v 养家/vi 呀/y 。/wj
|
48
|
+
|
49
|
+
|
50
|
+
比/p 惨/a 是/vshi 一/m 种/q 自我/rr 保护/v 的/ude1 方式/n 。/wj 它/rr 的/ude1 心理/n 基础/n 是/vshi 不/d 患/v 寡/ag 而/cc 患/v 不/d 均/d 的/ude1 传统/n 社会/n 认识/n 。/wj 人们/n 不仅/c 物质/n 上/f 要/v 追求/v 平均/a ,/wd 心理/n 上/f 也/d 是/vshi 如此/rzv ,/wd 如果/c 不/d 能/v 和/cc 人/n 一起/s 富/a ,/wd 就/d 希望/v 大家/rr 一起/d 穷/a 。/wj 凡人/n 遇到/v 伤心/a 之/uzhi 事/n ,/wd 这时候/rzt 有/vyou 一个/mq 人/n 对/p 他/rr 或/c 她/rr 说/v ,/wd 我/rr 比/p 你/rr 更/d 惨/a ,/wd 这样/rzv 心理/n 也/d 就/d 平衡/a 了/y ,/wd 也/d 不/d 那么/rz 伤心/a 了/y 。/wj 而/cc “/wyz 屌/n 丝/n ”/wyy 在/p 网络/n 上/f 的/ude1 自嘲/vi ,/wd 则/c 亦/d 有/vyou 比/p 惨/a 之/uzhi 意/ng ,/wd 而/cc 本质/n 则/d 是/vshi 一/m 种/q 发泄/v 和/cc 寻求/v 心理/n 的/ude1 慰藉/vn 。/wj “/wyz 屌/n 丝/n ”/wyy 更/d 似乎/d 是/vshi 在/p 宣称/v ,/wd 反正/d 我/rr 就/d 是/vshi 这么/rz 副/b 屌/n 样/u ,/wd 再/d 怎么/ryv 差/v 都/d 无所谓/vl 了/y 。/wj
|
51
|
+
|
52
|
+
现实/n 沉默/a 网上/s 自嘲/vi ,/wd “/wyz 屌/n 丝/n ”/wyy 是/vshi 小/a 人物/n 的/ude1 集体/n 自我/rr 认同/v
|
53
|
+
|
54
|
+
“/wyz 屌/n 丝/n ”/wyy 的/ude1 比/p 惨/a ,/wd 就/d 像/v 小/a 人物/n 之间/f 的/ude1 日常/b 寒暄/v ,/wd “/wyz 屌/n 丝/n ”/wyy 已/d 是/vshi 这个/rz 时代/n 小人物/n 的/ude1 形象/n 代表/n 。/wj
|
55
|
+
|
56
|
+
|
57
|
+
冯小刚/nr 的/ude1 电影/n 里/f 曾经/d 对/p 中国/ns 社会/n 的/ude1 小人物/n 有着/v 经典/n 的/ude1 诠释/vn :/wp 中国/ns 的/ude1 很多/m 小人物/n 的/ude1 梦想/n 和/cc 趣味/n 与/p 他/rr 本身/rz 的/ude1 身份/n 有着/v 天壤之别/nl ,/wd 他们/rr 往往/d 身份/n 卑微/an 却/d 又/d 梦想/v 统治/vn 世界/n 。/wj 因为/c 在/p 这个/rz 国家/n ,/wd 在/p 长/ad 达/v 几十/m 年/qt 的/ude1 时间/n 里/f ,/wd 一个/mq 普通人/n 想/v 要/v 一举/d 成为/v 一个/mq 威/ng 震/vi 寰宇/n 、/wn 万/m 人/n 拥戴/v 的/ude1 英雄/n ,/wd 从来/d 都/d 不/d 会/v 被/pbei 视为/v 是/vshi 荒唐/a 变态/n ,/wd 而/cc 恰恰/d 会/v 被/pbei 视为/v 一个/mq 值得/v 鼓励/v 和/cc 学习/v 的/ude1 有/vyou 志/n 青年/n 。/wj
|
58
|
+
|
59
|
+
|
60
|
+
然而/c 崇高/a 的/ude1 理想/n 和/cc 残酷/a 的/ude1 现实/n 之间/f 存在/v 深深/z 的/ude1 断层/n ,/wd 小/a 人物/n 的/ude1 身份/n 和/cc 不切实际/vl 的/ude1 梦想/n 在/p 一个/mq 人/n 身上/s 纠结/vi ,/wd 在/p 个人/n 自由/an 大大/d 获得/v 解放/v 的/ude1 今天/t ,/wd 却/d 又/d 凸显/v 了/ule 小/a 人物/n 的/ude1 迷茫/an 和/cc 无助/an 。/wj 而/cc 正是/v 这种/r 迷茫/an 和/cc 无助/an 加速/vi 了/ule “/wyz 屌/n 丝/n ”/wyy 文化/n 的/ude1 产生/vn 和/cc 蔓延/vi 。/wj 相/d 比较/d 于/p 冯小刚/nr 电影/n 里/f 的/ude1 小/a 人物/n ,/wd “/wyz 屌/n 丝/n ”/wyy 拥有/v 相同/a 甚至/c 更加/d 卑微/a 的/ude1 身份/n ,/wd 却/d 未必/d 拥有/v 多么/d 宏大/a 、/wn 崇高/a 的/ude1 理想/n ,/wd 他们/rr 安于现状/vl 却/d 又/d 不/d 满/v 于/p 现实/n ,/wd 他们/rr 渴望/v 成功/an ,/wd 却/d 又/d 无法/v 克服/v 成功/a 路上/s 的/ude1 种种/q 困难/an 。/wj 于是/cc ,/wd 他们/rr 选择/v 了/ule 现实/n 中/f 的/ude1 沉默/an ,/wd 网络/n 中/f 的/ude1 自嘲/vn 。/wj
|
61
|
+
|
62
|
+
群体/n 自嘲/vi 是/vshi 解/v 构/vg 现实/n 的/ude1 武器/n 也/d 是/vshi 争取/v 诠释/v 自己/rr 生活/vi 的/ude1 权利/n
|
63
|
+
|
64
|
+
自嘲/vi 是/vshi 一/m 种/q 调节/vn 心理/n 的/ude1 天平/n ,/wd 心理学/n 家/q 认为/v :/wp “/wyz 一个/mq 人/n 的/ude1 身体/n 状态/n 是/vshi 受/v 其/rz 心理/n 和/cc 精神/n 状态/n 所/usuo 影响/v 的/ude1 ,/wd 大约/d 有/vyou 一半/m 以上/f 的/ude1 疾病/n 都/d 是/vshi 由/p 心理/n 和/cc 精神/n 方面/n 引起/v 的/ude1 。/wj ”/wyy 所以/c ,/wd 任何/rz 一个/mq 在/p 现实/n 生活/vn 中/f 并/d 不/d 那么/rz 如意/a 的/ude1 人/n ,/wd 对/p 自己/rr 进行/vx 自嘲/vi 都/d 是/vshi 很/d 正常/a 的/ude1 ,/wd “/wyz 屌/n 丝/n ”/wyy 这个/rz 词语/n 无疑/d 更/d 是/vshi 自嘲/vi 文化/n 发展/v 到/v 一定/b 程度/n 的/ude1 产物/n 。/wj
|
65
|
+
|
66
|
+
|
67
|
+
然后/c ,/wd 与/p 普通/a 的/ude1 自嘲/vi 不同/a ,/wd “/wyz 屌/n 丝/n ”/wyy 的/ude1 自嘲/vn 是/vshi 一/m 次/qv 自发/b 的/ude1 、/wn 群体/n 性/k 的/ude1 自嘲/vi ,/wd 如此/rzv 大/a 规模/n 的/ude1 自嘲/vn 定然/d 是/vshi 拜/v 网络/n 所/usuo 赐/v ,/wd 而/cc 在/p 别人/rr 嘲讽/v 自己/rr 之前/f 抢先/vi 把/pba 自己/rr 嘲讽/v 完毕/vi ,/wd 基本上/d 是/vshi 一/m 种/q 自我/rr 保护/v 。/wj 究/vg 其/rz 根本/a ,/wd 其实/d 与/p 当年/t 王/nr1 朔/ng 的/ude1 “/wyz 我/rr 是/vshi 流氓/n 我/rr 怕/v 谁/ry ”/wyy 类似/a 。/wj 对方/n 尚未/d 发作/vi ,/wd 且/c 先/d 笑脸相迎/vl ——/wp “/wyz 我/rr 有/vyou 病/n ,/wd 您/rr 别/d 跟/p 我/rr 一般/a 见识/n …/ws …/ws ”/wyy
|
68
|
+
|
69
|
+
|
70
|
+
其实/d ,/wd 归根结底/dl ,/wd “/wyz 屌/n 丝/n ”/wyy 文化/n 不过/c 是/vshi 又/d 一/m 种/q 网络/n 亚文化/n 的/ude1 崛起/vn ,/wd 它/rr 意味着/v 中国/ns 人/n 更/d 多/a 的/ude1 获得/v 了/ule 自己/rr 诠释/v 生活/vn 的/ude1 角度/n 与/cc 权利/n 。/wj 一切/rz 政治/n 、/wn 经济/n 与/cc 社会/n 的/ude1 话题/n ,/wd 在/p 法律/n 允许/v 的/ude1 范围/n 内/f 都/d 可以/v 纳入/v 自己/rr 的/ude1 价值/n 体系/n ,/wd 通过/p 自己/rr 的/ude1 经验/n 与/cc 学识/n ,/wd 作出/v 自己/rr 的/ude1 判断/vn 。/wj 他们/rr 用/p 一/m 种/q 新/a 的/ude1 语言/n 方式/n ,/wd 结构/n 着/uzhe 完全/ad 灌输/v 式/k 的/ude1 教育/vn 与/cc 宣传/vn 。/wj
|
71
|
+
|
72
|
+
|
73
|
+
解/v 构/vg 的/ude1 这种/r 积极/a 意义/n 还/d 在于/v ,/wd 每个/r 公民/n 都/d 有/vyou 自己/rr 观察/v 生活/vn 、/wn 认识/v 真理/n 的/ude1 眼睛/n 与/cc 心灵/n ,/wd 没有/v 谁/ry 再/d 可以/v 强加/vi 给/p 他们/rr 任何/rz 他们/rr 不再/d 相信/v 的/ude1 东西/n 。/wj 而/cc 那些/rz 貌似/v 强大/a 的/ude1 说教/vn ,/wd 同样/d 失去/v 了/ule 动员/v 的/ude1 能力/n ,/wd 反而/d 被/pbei 人们/n 置/v 之/uzhi 一/m 笑/v 。/wj 就/d 如同/v “/wyz 屌/n 丝/n ”/wyy 对待/v “/wyz 高/a 富/vg 帅/ng ”/wyy 的/ude1 态度/n ,/wd 有/vyou 嘲讽/vn 、/wn 有/vyou 跪拜/v ,/wd 但/c 本质/n 上/f 都/d 是/vshi 一/m 种/q 解/v 构/ng ,/wd 并且/c 也/d 是/vshi 网/n 民/ng 的/ude1 一/m 种/q 自娱/vn 自乐/vn 。/wj
|
74
|
+
|
75
|
+
网络/n 亚文化/n 需要/v 包容/v 屌/n 丝/n 们/k 需要/v 的/ude1 是/vshi 爱/v
|
76
|
+
|
77
|
+
“/wyz 屌/n 丝/n ”/wyy 爆/v 红/a ,/wd 也/d 引来/v 了/ule 反弹/vi 。/wj 有/vyou 文化/n 学者/n 在/p 微/ag 博/ag 上/f 批判/v 说/v ,/wd “/wyz 屌/n 丝/q 文化/n ”/wyy 是/vshi 一/m 种/q 对/p 社会/n 拜/v 金/b 风潮/n 的/ude1 无奈/d 掺杂/v 的/ude1 产物/n ,/wd 亦/d 充满/v 了/ule 格调/n 不/d 高/a 的/ude1 低俗/a 气/n 。/wj
|
78
|
+
|
79
|
+
|
80
|
+
当然/d ,/wd 对于/p 这/rzv 点/qt ,/wd 网/n 民/ng 是/vshi 不买账/vl 的/ude1 。/wj 其实/d 网/v 民/ng 只/d 是/vshi 用于/v 自嘲/vi ,/wd 不过/c 跟/p “/wyz 咆哮/vi 体/ng ”/wyy 和/cc “/wyz 伤/n 不/d 起/vf ”/wyy 是/vshi 一个/mq 性质/n 。/wj 动不动/d 上升/vi 至/p 道德/n 层面/n ,/wd 是/vshi 小题大做/vl 得/ude3 有/vyou 点/qt 凶猛/a ——/wp 作为/v 一/m 种/q 网络/n 亚文化/n ,/wd 跟/p 同性恋/vn 和/cc 朋/ng 克/vg 摇滚/n 一样/uyy 不/d 属于/v 主流/n 社会/n 罢了/y ,/wd 更/d 远远/d 称/v 不/d 上/vf 有害/a 。/wj
|
81
|
+
|
82
|
+
|
83
|
+
一个/mq 社会/n 的/ude1 道德/n 水准/n 和/cc 价值观/n 会/v 因为/p 某个/rz 网络/n 词语/n 发生/v 了/ule 大/a 倒退/vn ?/ww 那/rzv 是/vshi 不/d 是/vshi 对/p 整个/b 社会/n 太/d 没/v 信心/n 了/y 。/wj 当然/d ,/wd “/wyz 屌/n 丝/n ”/wyy 文化/n 中/f 不/d 是/vshi 毫无/v 问题/n ,/wd 其中/rz 对于/p 女性/n 的/ude1 态度/n 以及/cc 对/p 女性/n 有/vyou 侮辱/vn 的/ude1 词汇/n 在/p 网络/n 上/f 流行/v 就/d 不/d 妥当/a 。/wj
|
84
|
+
|
85
|
+
|
86
|
+
屌/n 丝/q 亚文化/n 下/f ,/wd 看/v 起来/vf 嬉皮笑脸/al 满不在乎/vl 面孔/n 的/ude1 背后/f ,/wd 其实/d 和/cc 这个/rz 社会/n 中/f 其他/rzv 所有/b 人/n 一样/uyy ,/wd 他们/rr 所/usuo 需要/v 的/ude1 ,/wd 是/vshi 爱/v 。/wj
|
87
|
+
|
data/test/userdict.txt
ADDED
metadata
ADDED
@@ -0,0 +1,206 @@
|
|
1
|
+
--- !ruby/object:Gem::Specification
|
2
|
+
name: nlpir
|
3
|
+
version: !ruby/object:Gem::Version
|
4
|
+
version: 0.0.4
|
5
|
+
platform: x86-mingw32
|
6
|
+
authors:
|
7
|
+
- JoeWoo
|
8
|
+
autorequire:
|
9
|
+
bindir: bin
|
10
|
+
cert_chain: []
|
11
|
+
date: 2013-07-30 00:00:00.000000000 Z
|
12
|
+
dependencies:
|
13
|
+
- !ruby/object:Gem::Dependency
|
14
|
+
name: bundler
|
15
|
+
requirement: !ruby/object:Gem::Requirement
|
16
|
+
requirements:
|
17
|
+
- - ~>
|
18
|
+
- !ruby/object:Gem::Version
|
19
|
+
version: '1.3'
|
20
|
+
type: :development
|
21
|
+
prerelease: false
|
22
|
+
version_requirements: !ruby/object:Gem::Requirement
|
23
|
+
requirements:
|
24
|
+
- - ~>
|
25
|
+
- !ruby/object:Gem::Version
|
26
|
+
version: '1.3'
|
27
|
+
- !ruby/object:Gem::Dependency
|
28
|
+
name: rake
|
29
|
+
requirement: !ruby/object:Gem::Requirement
|
30
|
+
requirements:
|
31
|
+
- - '>='
|
32
|
+
- !ruby/object:Gem::Version
|
33
|
+
version: '0'
|
34
|
+
type: :development
|
35
|
+
prerelease: false
|
36
|
+
version_requirements: !ruby/object:Gem::Requirement
|
37
|
+
requirements:
|
38
|
+
- - '>='
|
39
|
+
- !ruby/object:Gem::Version
|
40
|
+
version: '0'
|
41
|
+
description: '"A rubygem wrapper of chinese segment tools ICTCLAS2013"'
|
42
|
+
email:
|
43
|
+
- 0wujian0@gmail.com
|
44
|
+
executables:
|
45
|
+
- NLPIR.dll
|
46
|
+
extensions: []
|
47
|
+
extra_rdoc_files: []
|
48
|
+
files:
|
49
|
+
- .gitignore
|
50
|
+
- LICENSE.txt
|
51
|
+
- README.md
|
52
|
+
- Rakefile
|
53
|
+
- bin/NLPIR.dll
|
54
|
+
- lib/Data/BIG2GBK.map
|
55
|
+
- lib/Data/BIG5.pdat
|
56
|
+
- lib/Data/BIG5.wordlist
|
57
|
+
- lib/Data/BiWord.big
|
58
|
+
- lib/Data/Configure.xml
|
59
|
+
- lib/Data/CoreDict.pdat
|
60
|
+
- lib/Data/CoreDict.pos
|
61
|
+
- lib/Data/CoreDict.unig
|
62
|
+
- lib/Data/FieldDict.pdat
|
63
|
+
- lib/Data/FieldDict.pos
|
64
|
+
- lib/Data/GBK.pdat
|
65
|
+
- lib/Data/GBK.wordlist
|
66
|
+
- lib/Data/GBK2BIG.map
|
67
|
+
- lib/Data/GBK2GBKC.map
|
68
|
+
- lib/Data/GBK2UTF.map
|
69
|
+
- lib/Data/GBKA.pdat
|
70
|
+
- lib/Data/GBKA.wordlist
|
71
|
+
- lib/Data/GBKA2UTF.map
|
72
|
+
- lib/Data/GBKC.pdat
|
73
|
+
- lib/Data/GBKC.wordlist
|
74
|
+
- lib/Data/GBKC2GBK.map
|
75
|
+
- lib/Data/GranDict.pdat
|
76
|
+
- lib/Data/GranDict.pos
|
77
|
+
- lib/Data/ICTPOS.map
|
78
|
+
- lib/Data/NLPIR.ctx
|
79
|
+
- lib/Data/NLPIR.user
|
80
|
+
- lib/Data/NLPIR_First.map
|
81
|
+
- lib/Data/NewWord.lst
|
82
|
+
- lib/Data/PKU.map
|
83
|
+
- lib/Data/PKU_First.map
|
84
|
+
- lib/Data/UTF2GBK.map
|
85
|
+
- lib/Data/UTF2GBKA.map
|
86
|
+
- lib/Data/UTF8.pdat
|
87
|
+
- lib/Data/UTF8.wordlist
|
88
|
+
- lib/Data/UserDict.pdat
|
89
|
+
- lib/Data/charset.type
|
90
|
+
- lib/Data/nr.ctx
|
91
|
+
- lib/Data/nr.fsa
|
92
|
+
- lib/Data/nr.role
|
93
|
+
- lib/nlpir.rb
|
94
|
+
- lib/nlpir/version.rb
|
95
|
+
- nlpir.gemspec
|
96
|
+
- test/Data/BIG2GBK.map
|
97
|
+
- test/Data/BIG5.pdat
|
98
|
+
- test/Data/BIG5.wordlist
|
99
|
+
- test/Data/BiWord.big
|
100
|
+
- test/Data/Configure.xml
|
101
|
+
- test/Data/CoreDict.pdat
|
102
|
+
- test/Data/CoreDict.pos
|
103
|
+
- test/Data/CoreDict.unig
|
104
|
+
- test/Data/FieldDict.pdat
|
105
|
+
- test/Data/FieldDict.pos
|
106
|
+
- test/Data/GBK.pdat
|
107
|
+
- test/Data/GBK.wordlist
|
108
|
+
- test/Data/GBK2BIG.map
|
109
|
+
- test/Data/GBK2GBKC.map
|
110
|
+
- test/Data/GBK2UTF.map
|
111
|
+
- test/Data/GBKA.pdat
|
112
|
+
- test/Data/GBKA.wordlist
|
113
|
+
- test/Data/GBKA2UTF.map
|
114
|
+
- test/Data/GBKC.pdat
|
115
|
+
- test/Data/GBKC.wordlist
|
116
|
+
- test/Data/GBKC2GBK.map
|
117
|
+
- test/Data/GranDict.pdat
|
118
|
+
- test/Data/GranDict.pos
|
119
|
+
- test/Data/ICTPOS.map
|
120
|
+
- test/Data/NLPIR.ctx
|
121
|
+
- test/Data/NLPIR.user
|
122
|
+
- test/Data/NLPIR_First.map
|
123
|
+
- test/Data/NewWord.lst
|
124
|
+
- test/Data/PKU.map
|
125
|
+
- test/Data/PKU_First.map
|
126
|
+
- test/Data/UTF2GBK.map
|
127
|
+
- test/Data/UTF2GBKA.map
|
128
|
+
- test/Data/UTF8.pdat
|
129
|
+
- test/Data/UTF8.wordlist
|
130
|
+
- test/Data/UserDict.pdat
|
131
|
+
- test/Data/charset.type
|
132
|
+
- test/Data/nr.ctx
|
133
|
+
- test/Data/nr.fsa
|
134
|
+
- test/Data/nr.role
|
135
|
+
- test/test.txt
|
136
|
+
- test/test_nlpir.rb
|
137
|
+
- test/test_result.txt
|
138
|
+
- test/userdict.txt
|
139
|
+
homepage: https://github.com/JoeWoo/nlpir_win
|
140
|
+
licenses:
|
141
|
+
- MIT
|
142
|
+
metadata: {}
|
143
|
+
post_install_message:
|
144
|
+
rdoc_options: []
|
145
|
+
require_paths:
|
146
|
+
- lib
|
147
|
+
required_ruby_version: !ruby/object:Gem::Requirement
|
148
|
+
requirements:
|
149
|
+
- - '>='
|
150
|
+
- !ruby/object:Gem::Version
|
151
|
+
version: 2.0.0
|
152
|
+
required_rubygems_version: !ruby/object:Gem::Requirement
|
153
|
+
requirements:
|
154
|
+
- - '>='
|
155
|
+
- !ruby/object:Gem::Version
|
156
|
+
version: '0'
|
157
|
+
requirements: []
|
158
|
+
rubyforge_project:
|
159
|
+
rubygems_version: 2.0.0
|
160
|
+
signing_key:
|
161
|
+
specification_version: 4
|
162
|
+
summary: '"ICTCLAS是由中国科学院计算技术研究所研发。中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。"'
|
163
|
+
test_files:
|
164
|
+
- test/Data/BIG2GBK.map
|
165
|
+
- test/Data/BIG5.pdat
|
166
|
+
- test/Data/BIG5.wordlist
|
167
|
+
- test/Data/BiWord.big
|
168
|
+
- test/Data/Configure.xml
|
169
|
+
- test/Data/CoreDict.pdat
|
170
|
+
- test/Data/CoreDict.pos
|
171
|
+
- test/Data/CoreDict.unig
|
172
|
+
- test/Data/FieldDict.pdat
|
173
|
+
- test/Data/FieldDict.pos
|
174
|
+
- test/Data/GBK.pdat
|
175
|
+
- test/Data/GBK.wordlist
|
176
|
+
- test/Data/GBK2BIG.map
|
177
|
+
- test/Data/GBK2GBKC.map
|
178
|
+
- test/Data/GBK2UTF.map
|
179
|
+
- test/Data/GBKA.pdat
|
180
|
+
- test/Data/GBKA.wordlist
|
181
|
+
- test/Data/GBKA2UTF.map
|
182
|
+
- test/Data/GBKC.pdat
|
183
|
+
- test/Data/GBKC.wordlist
|
184
|
+
- test/Data/GBKC2GBK.map
|
185
|
+
- test/Data/GranDict.pdat
|
186
|
+
- test/Data/GranDict.pos
|
187
|
+
- test/Data/ICTPOS.map
|
188
|
+
- test/Data/NLPIR.ctx
|
189
|
+
- test/Data/NLPIR.user
|
190
|
+
- test/Data/NLPIR_First.map
|
191
|
+
- test/Data/NewWord.lst
|
192
|
+
- test/Data/PKU.map
|
193
|
+
- test/Data/PKU_First.map
|
194
|
+
- test/Data/UTF2GBK.map
|
195
|
+
- test/Data/UTF2GBKA.map
|
196
|
+
- test/Data/UTF8.pdat
|
197
|
+
- test/Data/UTF8.wordlist
|
198
|
+
- test/Data/UserDict.pdat
|
199
|
+
- test/Data/charset.type
|
200
|
+
- test/Data/nr.ctx
|
201
|
+
- test/Data/nr.fsa
|
202
|
+
- test/Data/nr.role
|
203
|
+
- test/test.txt
|
204
|
+
- test/test_nlpir.rb
|
205
|
+
- test/test_result.txt
|
206
|
+
- test/userdict.txt
|