nlpir 0.0.4-x86-mingw32 → 1.0.0-x86-mingw32

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (62) hide show
  1. checksums.yaml +4 -4
  2. data/README.md +146 -8
  3. data/bin/NLPIR.dll +0 -0
  4. data/lib/Data/Configure.xml +16 -15
  5. data/lib/Data/DocExtractor.user +2 -0
  6. data/lib/Data/English/English.pdat +0 -0
  7. data/lib/Data/English/English.pos +0 -0
  8. data/lib/Data/English/English.ung +0 -0
  9. data/lib/Data/English/English.wordlist +0 -0
  10. data/lib/Data/English/Irrel2regular.map +0 -0
  11. data/lib/Data/English/ne.pdat +0 -0
  12. data/lib/Data/English/ne.pos +0 -0
  13. data/lib/Data/English/ne.wordlist +0 -0
  14. data/lib/Data/FTU8.pdat +0 -0
  15. data/lib/Data/FTU8.wordlist +0 -0
  16. data/lib/Data/FTU82GBK.map +0 -0
  17. data/lib/Data/FieldDict.pdat +0 -0
  18. data/lib/Data/FieldDict.pos +0 -0
  19. data/lib/Data/GBK2FTU8.map +0 -0
  20. data/lib/Data/ICTPOS.map +4 -0
  21. data/lib/Data/NLPIR.user +0 -0
  22. data/lib/Data/NewWord.lst +18 -15
  23. data/lib/Data/PKU.map +4 -0
  24. data/lib/Data/PKU_First.map +4 -0
  25. data/lib/Data/UserDict.pdat +0 -0
  26. data/lib/Data/location.map +0 -0
  27. data/lib/Data/location.pdat +0 -0
  28. data/lib/Data/location.wordlist +0 -0
  29. data/lib/Data/sentiment.pdat +0 -0
  30. data/lib/Data/sentiment.ung +0 -0
  31. data/lib/nlpir.rb +187 -163
  32. data/lib/nlpir/version.rb +1 -1
  33. data/test/Data/Configure.xml +16 -15
  34. data/test/Data/DocExtractor.user +2 -0
  35. data/test/Data/English/English.pdat +0 -0
  36. data/test/Data/English/English.pos +0 -0
  37. data/test/Data/English/English.ung +0 -0
  38. data/test/Data/English/English.wordlist +0 -0
  39. data/test/Data/English/Irrel2regular.map +0 -0
  40. data/test/Data/English/ne.pdat +0 -0
  41. data/test/Data/English/ne.pos +0 -0
  42. data/test/Data/English/ne.wordlist +0 -0
  43. data/test/Data/FTU8.pdat +0 -0
  44. data/test/Data/FTU8.wordlist +0 -0
  45. data/test/Data/FTU82GBK.map +0 -0
  46. data/test/Data/GBK2FTU8.map +0 -0
  47. data/test/Data/ICTPOS.map +4 -0
  48. data/test/Data/NLPIR.user +0 -0
  49. data/test/Data/NewWord.lst +18 -63
  50. data/test/Data/PKU.map +4 -0
  51. data/test/Data/PKU_First.map +4 -0
  52. data/test/Data/UserDict.pdat +0 -0
  53. data/test/Data/location.map +0 -0
  54. data/test/Data/location.pdat +0 -0
  55. data/test/Data/location.wordlist +0 -0
  56. data/test/Data/sentiment.pdat +0 -0
  57. data/test/Data/sentiment.ung +0 -0
  58. data/test/findnewword.txt +103 -0
  59. data/test/test_nlpir.rb +137 -140
  60. data/test/test_result.txt +52 -35
  61. data/test/userdict.txt +5 -5
  62. metadata +59 -3
@@ -1,3 +1,3 @@
1
1
  module Nlpir
2
- VERSION = "0.0.4"
2
+ VERSION = "1.0.0"
3
3
  end
@@ -1,15 +1,16 @@
1
- <?xmlversion="1.0"encoding="GB2312"?>
2
- <NLPIR>
3
- <TagSet>ICTPOS.map</TagSet>//���Ա�ע��ӳ���ļ�
4
- <UserDict>on</UserDict>//On��UserDictionaryapplied;Off:notapplied��
5
- <UserDictPrior>On</UserDictPrior>//�û��ʵ�����,Addedin2006-03-16,requiredbyNECOn���û��ʵ�ͺ��Ĵʵ���ͬʱ�еĴʻ㣬�û��ʵ����ȣ������ܲ�Ҫ���ã���������Ĵʵ��еĴʶ�����Ϊ�û��ʵ䣬��Ч���ʵ��䷴
6
- <FieldDict>off</FieldDict>//On��FieldDictionaryapplied;Off:notapplied��
7
- <GranularityContorl>off</GranularityContorl>
8
- <Log>On</Log>//On,Off�����磺Off:�ر���־���ܣ�On:����־����
9
- <version>2013</version>//ϵͳ�汾��
10
- <Modify>2012-11-14</Modify>//ϵͳ����޶�ʱ��
11
- <Lexicon>2012-11-14</Lexicon>//�ʵ�����޶�ʱ��
12
- <adaptive>true</adaptive>//����Ӧ�ִʣ�Ĭ��Ϊfalse������Ӧ�ִʵ�Ч�ʻ�ϵ�
13
- <author>�Ż�ƽ��ʿ</author>//����
14
- <Contact>pipy_zhang@msn.com</Contact>//������ϵ��ʽ
15
- </NLPIR>
1
+ <?xmlversion="1.0"encoding="GB2312"?>
2
+ <NLPIR>
3
+ <TagSet>ICTPOS.map</TagSet>//���Ա�ע��ӳ���ļ�
4
+ <UserDict>on</UserDict>//On��UserDictionaryapplied;Off:notapplied��
5
+ <UserDictPrior>Off</UserDictPrior>//�û��ʵ�����,Addedin2006-03-16,requiredbyNECOn���û��ʵ�ͺ��Ĵʵ���ͬʱ�еĴʻ㣬�û��ʵ����ȣ������ܲ�Ҫ���ã���������Ĵʵ��еĴʶ�����Ϊ�û��ʵ䣬��Ч���ʵ��䷴
6
+ <FieldDict>on</FieldDict>//On��FieldDictionaryapplied;Off:notapplied��
7
+ <GranularityContorl>off</GranularityContorl>
8
+ <Log>Off</Log>//On,Off�����磺Off:�ر���־���ܣ�On:����־����
9
+ <version>2013</version>//ϵͳ�汾��
10
+ <Modify>2012-11-14</Modify>//ϵͳ����޶�ʱ��
11
+ <Lexicon>2012-11-14</Lexicon>//�ʵ�����޶�ʱ��
12
+ <Sentiment>On</Sentiment>//On,Off�����磺Off:�ر���з������ܣ�On:����з�������
13
+ <adaptive>true</adaptive>//����Ӧ�ִʣ�Ĭ��Ϊfalse������Ӧ�ִʵ�Ч�ʻ�ϵ�
14
+ <author>�Ż�ƽ��ʿ</author>//����
15
+ <Contact>pipy_zhang@msn.com</Contact>//������ϵ��ʽ
16
+ </NLPIR>
@@ -0,0 +1,2 @@
1
+ ���ť��ݸ޴ܸ���΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�ábQBw6u|V
2
+ -rt�����������I+g���蟋�����'"&t#''������̣ռ�܃�����רע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ���������˛��̷���ޜ��̍�Ӟ�����������ā���و����ҁ��䂜�񖔁˃�������ᔆ���Oww.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��עЮ������. /=-++<���ɩв�ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿ�����΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����Fww.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������ϓ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ����������������順�ӧ����������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ�������Ϣ��������Ϣ��ȫ���������������ھ��ѧ���������ҵӦ�á�������Դ��ӭ����www.nlpir.org.��ע����΢��@ICTCLAS�Ż�ƽ��ʿ�Ż�ƽ��ʿרע��΢�����㡢��Ȼ���Դ���
Binary file
Binary file
Binary file
Binary file
Binary file
Binary file
@@ -94,3 +94,7 @@ wyz
94
94
  x
95
95
  y
96
96
  z
97
+ xu
98
+ xe
99
+ xs
100
+ xm
Binary file
@@ -1,73 +1,28 @@
1
+
1
2
  ��˿ ���� �⹹ ��Q �������Ļ� ���� Ⱥ���Գ� ���ݱ�΢
3
+ ����ɽ �ΰ������� ���������� �������� ��Ʒ���� ��������
4
+ �й���ɫ������� �����������׶� ��ѧ��չ�� ��̬���� ��ṫƽ���� �������� �л�����ΰ���� ���幦���� �����ռ俪�� ��������� ���緢չһ�廯 С����� �������� ��������Ļ�ǿ�� ��ҵ��λ ���� ����ѡ�� �������� ���� ��������г��������� ��������� �������� ȫ������ ��Ҫս�Ի��� ȡ���ش��չ ��̬ϵͳ �Ȳ��ƽ� ���� �ӿ�ת�� ���ʽ���Σ�� ���¶���׼�� ������������ ��������Ƚ��Ļ� ũҵ�ۺ��������� ʳƷҩƷ��ȫ ��۵�����ϵ ����ͬԸ�� �����͹��� ˾������ �������ϱ��� ȫ���л���Ů ս�������˲�ҵ ����Ϸ�Ȩ�� ȫ������ͬ ������������ ��ǰ����ƽ�� �Ļ���ʵ�� ��֤���񵱼����� ��������ϵ ȫ��ҽ�� ����ֿ� ����������չ �����Ч �����ƶȸĸ� �������� ����δ�� ʵ�徭�� ��ѧ��ˮƽ ���㵳�� ���Ȼ� ȫ�潨��С����� �������� ��ʳ��ȫ ����ʵ�� ����ɲ� �������� �������� ���ر��� ����ڵ� ��ѧ�ش� �������� ���������� ��������� ��ȫ��в ��������� �����Ļ� ������� ����Ӱ���� �Ծ����� �Ͷ����� �ִ�����ҵ �������� ���˹�ͬ�� ��ʵ�ƽ� �Ҹ����� ���ļ�ֵ�� ���η��� ����������� ������ ƽ�Ȼ��� ������ҡ��� ����� ��Ҫս�Ի����� ת�侭�÷�չ��ʽ �ӿ�ת�侭�÷�չ��ʽ ���������ļ�ֵ��ϵ ����ȡ���ش��չ ʵ���л�����ΰ���� �����ں�ʽ��չ ��������������Ȼ� �ĸ↑�� ά����ṫƽ����
2
5
  ��˿ ���� �⹹ ��Q �������Ļ� ���� Ⱥ���Գ� ���ݱ�΢
6
+ ��˿ ���� �⹹ ��˿�Ļ� ��Q �������Ļ� Ⱥ���Գ� ���ݱ�΢ ��˧
7
+ ��˿#����#�⹹#��˿�Ļ�#��Q#�������Ļ�#Ⱥ���Գ�#���ݱ�΢#��˧#
3
8
 
4
9
 
5
10
 
6
11
 
7
12
 
8
13
 
14
+ ������������#��Ӫ�Թ�Ĺ#�������Թ�Ĺ#�����������#�������#�����Թ�Ĺ����#��������#�����Թ�Ĺ#���й�Ĺ#��������г�#������������#������������#���ᱩ��#�����г�#��������#������Ĺ#��չˮƽ#�����ƶ�#������ҵ#�ʽ�Ͷ��#������������#���ڱ���#������#�ؼ�����#��Ĺ�۸�#�������#���Ƿ���#����Ĺ��#���ⲹ��#ɥ����Ʒ#������Ʒ#�ǻҼĴ�#�������Թ�Ĺ����#
15
+ ������������#��Ӫ�Թ�Ĺ#�������Թ�Ĺ#�����������#�������#�����Թ�Ĺ����#��������#�����Թ�Ĺ#���й�Ĺ#��������г�#������������#������������#���ᱩ��#�����г�#��������#������Ĺ#��չˮƽ#�����ƶ�#������ҵ#�ʽ�Ͷ��#������������#���ڱ���#������#�ؼ�����#��Ĺ�۸�#�������#���Ƿ���#����Ĺ��#���ⲹ��#ɥ����Ʒ#������Ʒ#�ǻҼĴ�#�������Թ�Ĺ����#
9
16
 
10
17
 
11
-
12
-
13
-
14
-
15
-
16
-
17
-
18
-
19
-
20
-
21
-
22
-
23
-
24
-
25
-
26
-
27
- 屌丝/n_new/10.19
28
- 屌丝/n_new/10.19
29
- 屌丝/n_new/10.19
30
- 屌丝/n_new/10.19
31
- 屌丝/n_new/10.19
32
- 屌丝/n_new/10.19
33
- 屌丝/n_new/10.19
34
- 屌丝/n_new/10.19
35
- 屌丝/n_new/10.19
36
- 屌丝/n_new/10.19
37
- 屌丝/n_new/10.19
38
- 屌丝/n_new/10.19
39
- 屌丝/n_new/10.19
40
- 屌丝/n_new/10.19
41
- 屌丝/n_new/10.19
42
- 屌丝/n_new/10.19
43
- 屌丝/n_new/10.19
44
- 屌丝/n_new/10.19
45
- 屌丝/n_new/10.19
46
- 屌丝/n_new/10.19
47
- 屌丝/n_new/10.19
48
- 屌丝/n_new/10.19
49
- 屌丝/n_new/10.19
50
- 屌丝/n_new/10.19
51
- 屌丝/n_new/10.19
52
- 屌丝/n_new/10.19
53
- 屌丝/n_new/10.19
54
- 屌丝/n_new/10.19
55
- 屌丝/n_new/10.19
56
- 屌丝/n_new/10.19
57
- 屌丝/n_new/10.19
58
- 屌丝/n_new/10.19
59
- 屌丝/n_new/10.19
60
- 屌丝/n_new/10.19
61
- 屌丝/n_new/10.19
62
- 屌丝/n_new/10.19
63
- 屌丝/n_new/10.19
64
- 屌丝/n_new/10.19
65
- 屌丝/n_new/10.19
66
- 屌丝/n_new/10.19
67
- 屌丝/n_new/10.19
68
- 屌丝/n_new/10.19
69
- 屌丝/n_new/10.19
70
- 屌丝/n_new/10.19
71
- 屌丝/n_new/10.19
72
- 屌丝/n_new/10.19
73
- 屌丝/n_new/10.19
18
+ ��˿#����#�⹹#��˿�Ļ�#��Q#�������Ļ�#Ⱥ���Գ�#���ݱ�΢#
19
+ ������������#��Ӫ�Թ�Ĺ#�������Թ�Ĺ#�����������#�������#�����Թ�Ĺ����#��������#�����Թ�Ĺ#���й�Ĺ#��������г�#������������#������������#���ᱩ��#�����г�#��������#������Ĺ#��չˮƽ#�����ƶ�#������ҵ#�ʽ�Ͷ��#������������#���ڱ���#������#�ؼ�����#��Ĺ�۸�#�������#���Ƿ���#����Ĺ��#���ⲹ��#ɥ����Ʒ#������Ʒ#�ǻҼĴ�#�������Թ�Ĺ����#
20
+ ��˿#����#�⹹#��˿�Ļ�#��Q#�������Ļ�#Ⱥ���Գ�#���ݱ�΢#
21
+ ������������#��Ӫ�Թ�Ĺ#�������Թ�Ĺ#�����������#�������#�����Թ�Ĺ����#��������#�����Թ�Ĺ#���й�Ĺ#��������г�#������������#������������#���ᱩ��#�����г�#��������#������Ĺ#��չˮƽ#�����ƶ�#������ҵ#�ʽ�Ͷ��#������������#���ڱ���#������#�ؼ�����#��Ĺ�۸�#�������#���Ƿ���#����Ĺ��#���ⲹ��#ɥ����Ʒ#������Ʒ#�ǻҼĴ�#�������Թ�Ĺ����#
22
+ ��˿#����#�⹹#��˿�Ļ�#��Q#�������Ļ�#Ⱥ���Գ�#���ݱ�΢#
23
+ ������������#��Ӫ�Թ�Ĺ#�������Թ�Ĺ#�����������#�������#�����Թ�Ĺ����#��������#�����Թ�Ĺ#���й�Ĺ#��������г�#������������#������������#���ᱩ��#�����г�#��������#������Ĺ#��չˮƽ#�����ƶ�#������ҵ#�ʽ�Ͷ��#������������#���ڱ���#������#�ؼ�����#��Ĺ�۸�#�������#���Ƿ���#����Ĺ��#���ⲹ��#ɥ����Ʒ#������Ʒ#�ǻҼĴ�#�������Թ�Ĺ����#
24
+ ������������#��Ӫ�Թ�Ĺ#�������Թ�Ĺ#�����������#�������#�����Թ�Ĺ����#��������#�����Թ�Ĺ#���й�Ĺ#��������г�#������������#������������#���ᱩ��#�����г�#��������#������Ĺ#��չˮƽ#�����ƶ�#������ҵ#�ʽ�Ͷ��#������������#���ڱ���#������#�ؼ�����#��Ĺ�۸�#�������#���Ƿ���#����Ĺ��#���ⲹ��#ɥ����Ʒ#������Ʒ#�ǻҼĴ�#�������Թ�Ĺ����#
25
+ ������������#��Ӫ�Թ�Ĺ#�������Թ�Ĺ#�����������#�������#�����Թ�Ĺ����#��������#�����Թ�Ĺ#���й�Ĺ#��������г�#������������#������������#���ᱩ��#�����г�#��������#������Ĺ#��չˮƽ#�����ƶ�#������ҵ#�ʽ�Ͷ��#������������#���ڱ���#������#�ؼ�����#��Ĺ�۸�#�������#���Ƿ���#����Ĺ��#���ⲹ��#ɥ����Ʒ#������Ʒ#�ǻҼĴ�#�������Թ�Ĺ����#
26
+ ������������#��Ӫ�Թ�Ĺ#�������Թ�Ĺ#�����������#�������#�����Թ�Ĺ����#��������#�����Թ�Ĺ#���й�Ĺ#��������г�#������������#������������#���ᱩ��#�����г�#��������#������Ĺ#��չˮƽ#�����ƶ�#������ҵ#�ʽ�Ͷ��#������������#���ڱ���#������#�ؼ�����#��Ĺ�۸�#�������#���Ƿ���#����Ĺ��#���ⲹ��#ɥ����Ʒ#������Ʒ#�ǻҼĴ�#�������Թ�Ĺ����#
27
+ ��˿#����#�⹹#��˿�Ļ�#��Q#�������Ļ�#Ⱥ���Գ�#���ݱ�΢#
28
+ ��˿#����#�⹹#��˿�Ļ�#��Q#�������Ļ�#Ⱥ���Գ�#���ݱ�΢#
@@ -94,3 +94,7 @@ w
94
94
  x
95
95
  y
96
96
  z
97
+ xu
98
+ xe
99
+ xs
100
+ xm
@@ -94,3 +94,7 @@ w
94
94
  x
95
95
  y
96
96
  z
97
+ x
98
+ x
99
+ x
100
+ x
Binary file
Binary file
Binary file
Binary file
Binary file
@@ -0,0 +1,103 @@
1
+ 分享日志热门日志 淋语教学大纲【不学就会被吸惹】
2
+ 分享
3
+ 淋语教学大纲【不学就会被吸惹】
4
+ 来源: 电阴农妇泰勒十万伏特的日志
5
+ 前言:
6
+
7
+ 淋语(Linglish),是冥王星的官方语言,是宇宙天后淋淋(蔡依林)的专用语言,在地球上约有130亿人使用。学好淋语很重要,欢迎购买《淋语教学大纲》!让我们一起学习淋语吧!
8
+
9
+
10
+
11
+ 必会淋词篇:
12
+
13
+ 1.淋淋/00/蔡10/地才/蓝吊带:指蔡依林(Jolin Tsai)。
14
+
15
+ 2.宇宙天后:指淋淋。
16
+
17
+ 3.公主:指淋淋。
18
+
19
+ 4.三木木:指淋淋
20
+
21
+ 5.骑士:指淋淋的粉丝
22
+
23
+ 6.淋B/淋逼/013/淋13:指淋淋的阴部,一个光明温暖的地方。
24
+
25
+ 7.吸/被吸/开吸/吸入/进b:淋B会吸入宇宙万物,小心哦。
26
+
27
+
28
+
29
+ 语气助词篇:
30
+
31
+ 1.噜
32
+
33
+ a.语气助词,一般意为“了”,常用于肯定句句末,用于陈述事实。
34
+
35
+ 例:①天亮噜。②淋淋要发新专辑噜。
36
+
37
+ b.固定短语“天了噜”,表示惊讶。
38
+
39
+ 例:天了噜,嘎老逼被吸噜。
40
+
41
+
42
+
43
+ 2.惹
44
+
45
+ a.语气助词,带有傲娇语气,多数情况下可与“噜”换用,陈述某种事实。
46
+
47
+ 例:①我可是直男惹。②我可是万年骄傲受惹。③淋淋会吸人的惹。
48
+
49
+ b.叹词,用于陈述句或疑问句句首,也可以单独使用,表示惊讶。
50
+
51
+ 例:①惹!酵母新单居然上榜!②惹?酵母代言的冰红茶这么好卖?③惹!
52
+
53
+
54
+
55
+ 3.奴
56
+
57
+ a.语气助词,多用于肯定句句末,带有较强的感情色彩,一般情况下可与“噜”互换。在表达强烈的兴奋、悲伤的语气时,“奴”为专用助词。
58
+
59
+ 例:①真是气cry我奴!②嘎老逼还有130年就发新专辑,珍是开熏死了奴!
60
+
61
+
62
+
63
+ 4.厚
64
+
65
+ a.叹词,多用于句首,带有较强的感情色彩。和“奴”相比,“厚”多用于抒发兴奋、激动等较为正面的情绪。
66
+
67
+ 例:①厚!霉霉又有写歌灵感噜!②厚!擦妈瘦噜!
68
+
69
+ b.固定短语“厚厚厚”,表达激动、兴奋,用于句首。
70
+
71
+ 例:厚厚厚,我要被吸噜!
72
+
73
+
74
+
75
+ 5.轰
76
+
77
+ a.语气助词,多用于疑问句、反问句句末。
78
+
79
+ 例:①新专辑MUSE好听轰?②难道你不想被吸轰?
80
+
81
+ b.相当于东北话的“嚎”,表达赞叹、同意。
82
+
83
+ 例:①没错轰。②也是轰。③太好了轰。
84
+
85
+ c.通假字,通“疯”。
86
+
87
+ 例:①你这个轰子。②你轰了吗?
88
+
89
+
90
+
91
+ 6.嘻嘻/吸吸
92
+
93
+ a.语气词,多用于恐吓、威胁时的冷笑。
94
+
95
+ 例:①嘻嘻,你要被吸噜!②吸吸,开!
96
+
97
+
98
+
99
+ 7.揪咪
100
+
101
+ a.语气词,装可爱专用。
102
+
103
+ 例:揪咪!小灰灰珍可爱惹!
@@ -9,150 +9,147 @@ include Nlpir
9
9
  $s = "坚定不移沿着中国特色社会主义道路前进,为全面建成小康社会而奋斗"
10
10
  $text = "去年开始,打开百度李毅吧,满屏的帖子大多含有“屌丝”二字,一般网友不仅不懂这词什么意思,更难理解这个词为什么会这么火。然而从下半年开始,“屌丝”已经覆盖网络各个角落,人人争说屌丝,人人争当屌丝。
11
11
  从遭遇恶搞到群体自嘲,“屌丝”名号横空出世“屌丝”一词最早的来源是百度“三巨头吧”对“李毅吧”球迷的恶搞称谓,有嘲讽之意,但却被李毅吧的球迷就此领受下来。“屌丝”二字蕴含着无奈和自嘲的意味,但是李毅吧球迷“不以为耻、反以为荣”,从此以“屌丝”自称,并开始一路爆红网络。"
12
+ $text2 = "淋语(linguage),简称淋语、淋文,是一种主要为淋王星所使用的语言,是淋王星的官方语言。淋语属于黏着语、通过在词语上粘贴语法成分来构成句子,称为活用,其间的结合并不紧密、不改变原来词汇的含义只表语法功能。淋语博大精深自宇宙大爆炸以来已有数亿人民使用自成一个体系。"
12
13
 
13
14
  class NlpirTest < Test::Unit::TestCase
14
- def test_init
15
- assert_equal NLPIR_TRUE,
16
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
17
- end
18
-
19
- def test_exit
20
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
21
-
22
- assert_equal NLPIR_TRUE,
23
- NLPIR_Exit()
24
- end
25
15
 
26
- def test_process_paragraph
27
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
28
-
29
- assert_equal "坚定不移/vl 沿着/p 中国/ns 特色/n 社会主义/n 道路/n 前进/vi ,/wd 为/v 全面/ad 建成/v 小康/n 社会/n 而/cc 奋斗/vi ",
30
- NLPIR_ParagraphProcess($s).force_encoding('utf-8')
31
- assert_equal "坚定不移 沿着 中国 特色 社会主义 道路 前进 , 为 全面 建成 小康 社会 而 奋斗 ",
32
- NLPIR_ParagraphProcess($s,NLPIR_FALSE).force_encoding('utf-8')
33
-
34
- NLPIR_Exit()
35
-
36
- end
37
-
38
- def test_process_paragraph_with_PKU_POS_MAP_SECOND
39
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
40
-
41
- NLPIR_SetPOSmap(PKU_POS_MAP_FIRST)
42
- assert_equal "坚定不移/v 沿着/p 中国/n 特色/n 社会主义/n 道路/n 前进/v ,/w 为/v 全面/a 建成/v 小康/n 社会/n 而/c 奋斗/v ",
43
- NLPIR_ParagraphProcess($s).force_encoding('utf-8')
44
-
45
- NLPIR_Exit()
46
-
47
- end
48
-
49
- def test_process_paragraphA
50
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
51
-
52
- assert_equal 15,
53
- NLPIR_ParagraphProcessA($s).size
54
-
55
- NLPIR_Exit()
56
- end
57
-
58
- def test_process_paragraphAW
59
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
60
-
61
- assert_equal 15,
62
- NLPIR_ParagraphProcessAW($s).size
63
-
64
- NLPIR_Exit()
65
- end
16
+ def test_process_alias
17
+ nlpir_init(File.expand_path("../", __FILE__), UTF8_CODE)
18
+
19
+ assert_equal "坚定不移/vl 沿着/p 中国/ns 特色/n 社会主义/n 道路/n 前进/vi ,/wd 为/v 全面/ad 建成/v 小康/n 社会/n 而/cc 奋斗/vi ",
20
+ text_proc($s)
21
+ assert_equal "坚定不移 沿着 中国 特色 社会主义 道路 前进 , 为 全面 建成 小康 社会 而 奋斗 ",
22
+ text_proc($s,NLPIR_FALSE)
23
+
24
+ setPOSmap(PKU_POS_MAP_FIRST)
25
+ assert_equal "坚定不移/v 沿着/p 中国/n 特色/n 社会主义/n 道路/n 前进/v ,/w 为/v 全面/a 建成/v 小康/n 社会/n 而/c 奋斗/v ",
26
+ text_proc($s)
27
+
28
+ assert_equal 15,
29
+ text_procA($s).size
30
+ assert_equal 15,
31
+ text_procAW($s).size
32
+
33
+ result=""
34
+ words_list = text_procA($s)
35
+ i=1
36
+ words_list.each do |a|
37
+ sWhichDic=""
38
+ case a.word_type
39
+ when 0
40
+ sWhichDic = "核心词典"
41
+ when 1
42
+ sWhichDic = "用户词典"
43
+ when 2
44
+ sWhichDic = "专业词典"
45
+ end
46
+ result << "No.#{i}:start:#{a.start}, length:#{a.length}, POS_ID:#{a.sPOS},word_ID:#{a.word_ID},word_type:#{a.word_type} , UserDefine:#{sWhichDic}, Word:#{$s.byteslice(a.start,a.length)}, Weight:#{a.weight}\n"
47
+ i += 1
48
+ end
49
+ assert_equal "No.1:start:0, length:12, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:17262,word_type:0 , UserDefine:核心词典, Word:坚定不移, Weight:10520\nNo.2:start:12, length:6, POS_ID:[112, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:28059,word_type:0 , UserDefine:核心词典, Word:沿着, Weight:10798\nNo.3:start:18, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:32696,word_type:0 , UserDefine:核心词典, Word:中国, Weight:6097\nNo.4:start:24, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:12288,word_type:0 , UserDefine:核心词典, Word:特色, Weight:8469\nNo.5:start:30, length:12, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:48646,word_type:0 , UserDefine:核心词典, Word:社会主义, Weight:7442\nNo.6:start:42, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:75518,word_type:0 , UserDefine:核心词典, Word:道路, Weight:8859\nNo.7:start:48, length:6, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:35004,word_type:0 , UserDefine:核心词典, Word:前进, Weight:9350\nNo.8:start:54, length:1, POS_ID:[119, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:49,word_type:0 , UserDefine:核心词典, Word:,, Weight:2703\nNo.9:start:55, length:3, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:66615,word_type:0 , UserDefine:核心词典, Word:为, Weight:5539\nNo.10:start:58, length:6, POS_ID:[97, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:40698,word_type:0 , UserDefine:核心词典, Word:全面, Weight:7844\nNo.11:start:64, length:6, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:84698,word_type:0 , UserDefine:核心词典, Word:建成, Weight:9027\nNo.12:start:70, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:81502,word_type:0 , UserDefine:核心词典, Word:小康, Weight:10000\nNo.13:start:76, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:48622,word_type:0 , UserDefine:核心词典, Word:社会, Weight:6646\nNo.14:start:82, length:3, POS_ID:[99, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:32081,word_type:0 , UserDefine:核心词典, Word:而, Weight:6610\nNo.15:start:85, length:6, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:27256,word_type:0 , UserDefine:核心词典, Word:奋斗, Weight:9364\n",
50
+ result
51
+
52
+ add_userword("1989年春夏之交的政治风波 n")
53
+ assert_equal "1989年春夏之交的政治风波/n 1989年政治风波/n 24小时降雪量/n 24/m 小时/q 降雨量/n 863/m 计划/n ABC/n 防护/v 训练/v APEC/n 会议/n BB/n 机/n BP机/n C2系统/n C3I/n 系统/n C3/n 系统/n C4ISR/n 系统/n C4I/n 系统/n CCITT/n 建议/n ",
54
+ text_proc("1989年春夏之交的政治风波1989年政治风波24小时降雪量24小时降雨量863计划ABC防护训练APEC会议BB机BP机C2系统C3I系统C3系统C4ISR系统C4I系统CCITT建议")
55
+ del_userword("1989年春夏之交的政治风波")
56
+
57
+ assert_equal 5,
58
+ import_userdict("./userdict.txt")
59
+ save_userdict()
60
+ assert_equal "1989年春夏之交的政治风波/n 1989年政治风波/n 24小时降雪量/n 24/m 小时/q 降雨量/n 863/m 计划/n ABC/n 防护/v 训练/v APEC/n 会议/n BB/n 机/n BP机/n C2系统/n C3I/n 系统/n C3/n 系统/n C4ISR/n 系统/n C4I/n 系统/n CCITT/n 建议/n ",
61
+ text_proc("1989年春夏之交的政治风波1989年政治风波24小时降雪量24小时降雨量863计划ABC防护训练APEC会议BB机BP机C2系统C3I系统C3系统C4ISR系统C4I系统CCITT建议")
62
+
63
+ file_proc("./test.txt", "./test_result.txt", NLPIR_TRUE)
64
+ assert_equal 17036,
65
+ File.open("./test_result.txt").size
66
+
67
+ assert_equal 15,
68
+ text_wordcount($s)
69
+
70
+ assert_equal "李毅/n/4.57#球迷/n/2.20#屌丝/n_newword/1.77#开始/v/1.74#百度/n/1.39#",
71
+ text_keywords($text, 50,NLPIR_TRUE)
72
+ assert_equal "李毅/n/8.90#社会/n/4.06#",
73
+ file_keywords("./test.txt",2, NLPIR_TRUE)
74
+
75
+ assert_equal "淋语/n_new/4.99#",
76
+ text_newwords($text2, 50, NLPIR_TRUE)
77
+ assert_equal "淋语/n_new/5.96#指淋淋/n_new/5.60#",
78
+ file_newwords("./findnewword.txt", 50, NLPIR_TRUE)
79
+
80
+ assert_equal 1644572591,
81
+ text_fingerprint($text)
82
+ nlpir_exit()
66
83
 
67
- def test_userDict
68
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
69
-
70
- NLPIR_AddUserWord("1989年春夏之交的政治风波 n")
71
-
72
- s = NLPIR_ParagraphProcess("1989年春夏之交的政治风波1989年政治风波24小时降雪量24小时降雨量863计划ABC防护训练APEC会议BB机BP机C2系统C3I系统C3系统C4ISR系统C4I系统CCITT建议")
73
- s.force_encoding('utf-8')
74
- assert_match "1989年春夏之交的政治风波\/n", s
75
-
76
- NLPIR_DelUsrWord("1989年春夏之交的政治风波")
77
-
78
- NLPIR_Exit()
79
- end
80
-
81
- def test_ImportUserDict
82
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
83
-
84
- assert_equal 5,
85
- NLPIR_ImportUserDict("./userdict.txt")
86
-
87
- s = NLPIR_ParagraphProcess("1989年春夏之交的政治风波1989年政治风波24小时降雪量24小时降雨量863计划ABC防护训练APEC会议BB机BP机C2系统C3I系统C3系统C4ISR系统C4I系统CCITT建议")
88
- s.force_encoding('utf-8')
89
- assert_match "C2系统\/n", s
90
-
91
- NLPIR_Exit()
92
- end
93
-
94
- def test_process_file
95
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
96
-
97
- NLPIR_FileProcess("./test.txt", "./test_result.txt", NLPIR_TRUE)
98
- assert_equal 18482,
99
- File.open("./test_result.txt").size
100
-
101
- NLPIR_Exit()
102
- end
103
-
104
- def test_words_count
105
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
106
-
107
- assert_equal 15,
108
- NLPIR_GetParagraphProcessAWordCount($s)
109
-
110
- NLPIR_Exit()
111
- end
112
-
113
- def test_GetKeyWords
114
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
115
-
116
- assert_equal "屌丝/n_new/10.19 球迷/n/2.43 开始/v/1.74 百度/nz/1.73 网络/n/1.39 自嘲/vi/1.39 ",
117
- NLPIR_GetKeyWords($text, 50,NLPIR_TRUE).force_encoding('utf-8')
118
-
119
- NLPIR_Exit()
120
- end
121
-
122
- def test_GetKeyWords_form_file
123
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
124
-
125
- assert_equal "屌丝/n_new/15.12 网民/n_new/6.66 解构/n_new/5.27 ",
126
- NLPIR_GetFileKeyWords("./test.txt",2, NLPIR_TRUE).force_encoding('utf-8')
127
-
128
- NLPIR_Exit()
129
- end
130
-
131
- def test_find_NewWords
132
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
133
-
134
- assert_equal "屌丝/n_new/10.19 ",
135
- NLPIR_GetNewWords($text, 50, NLPIR_TRUE).force_encoding('utf-8')
136
-
137
- NLPIR_Exit()
138
- end
139
-
140
- def test_fin_NewWords_from_file
141
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
142
-
143
- assert_equal "屌丝/n_new/15.12 网民/n_new/6.66 解构/n_new/5.27 阿Q/n_new/4.99 网络亚文化/n_new/4.16 贴吧/n_new/3.33 群体自嘲/n_new/3.33 身份卑微/n_new/3.33 ",
144
- NLPIR_GetFileNewWords("./test.txt", 50, NLPIR_TRUE).force_encoding('utf-8')
145
-
146
- NLPIR_Exit()
147
- end
148
-
149
- def test_get_finger_print
150
- NLPIR_Init(nil, UTF8_CODE ,File.expand_path("../", __FILE__))
151
-
152
- assert_equal 499666667,
153
- NLPIR_FingerPrint($text)
154
-
155
- NLPIR_Exit()
156
84
  end
157
85
 
86
+ # def test_process_origin
87
+ # NLPIR_Init(File.expand_path("../", __FILE__), UTF8_CODE)
88
+ # setPOSmap(ICT_POS_MAP_SECOND)
89
+ # assert_equal "坚定不移/vl 沿着/p 中国/ns 特色/n 社会主义/n 道路/n 前进/vi ,/wd 为/v 全面/ad 建成/v 小康/n 社会/n 而/cc 奋斗/vi ",
90
+ # NLPIR_ParagraphProcess($s)
91
+ # assert_equal "坚定不移 沿着 中国 特色 社会主义 道路 前进 , 为 全面 建成 小康 社会 而 奋斗 ",
92
+ # NLPIR_ParagraphProcess($s,NLPIR_FALSE)
93
+
94
+ # NLPIR_SetPOSmap(PKU_POS_MAP_FIRST)
95
+ # assert_equal "坚定不移/v 沿着/p 中国/n 特色/n 社会主义/n 道路/n 前进/v ,/w 为/v 全面/a 建成/v 小康/n 社会/n 而/c 奋斗/v ",
96
+ # NLPIR_ParagraphProcess($s)
97
+
98
+ # assert_equal 15,
99
+ # NLPIR_ParagraphProcessA($s).size
100
+ # assert_equal 15,
101
+ # NLPIR_ParagraphProcessAW($s).size
102
+
103
+ # result=""
104
+ # words_list = NLPIR_ParagraphProcessA($s)
105
+ # i=1
106
+ # words_list.each do |a|
107
+ # sWhichDic=""
108
+ # case a.word_type
109
+ # when 0
110
+ # sWhichDic = "核心词典"
111
+ # when 1
112
+ # sWhichDic = "用户词典"
113
+ # when 2
114
+ # sWhichDic = "专业词典"
115
+ # end
116
+ # result << "No.#{i}:start:#{a.start}, length:#{a.length}, POS_ID:#{a.sPOS},word_ID:#{a.word_ID},word_type:#{a.word_type} , UserDefine:#{sWhichDic}, Word:#{$s.byteslice(a.start,a.length)}, Weight:#{a.weight}\n"
117
+ # i += 1
118
+ # end
119
+ # assert_equal "No.1:start:0, length:12, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:17262,word_type:0 , UserDefine:核心词典, Word:坚定不移, Weight:10520\nNo.2:start:12, length:6, POS_ID:[112, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:28059,word_type:0 , UserDefine:核心词典, Word:沿着, Weight:10798\nNo.3:start:18, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:32696,word_type:0 , UserDefine:核心词典, Word:中国, Weight:6097\nNo.4:start:24, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:12288,word_type:0 , UserDefine:核心词典, Word:特色, Weight:8469\nNo.5:start:30, length:12, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:48646,word_type:0 , UserDefine:核心词典, Word:社会主义, Weight:7442\nNo.6:start:42, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:75518,word_type:0 , UserDefine:核心词典, Word:道路, Weight:8859\nNo.7:start:48, length:6, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:35004,word_type:0 , UserDefine:核心词典, Word:前进, Weight:9350\nNo.8:start:54, length:1, POS_ID:[119, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:49,word_type:0 , UserDefine:核心词典, Word:,, Weight:2703\nNo.9:start:55, length:3, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:66615,word_type:0 , UserDefine:核心词典, Word:为, Weight:5539\nNo.10:start:58, length:6, POS_ID:[97, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:40698,word_type:0 , UserDefine:核心词典, Word:全面, Weight:7844\nNo.11:start:64, length:6, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:84698,word_type:0 , UserDefine:核心词典, Word:建成, Weight:9027\nNo.12:start:70, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:81502,word_type:0 , UserDefine:核心词典, Word:小康, Weight:10000\nNo.13:start:76, length:6, POS_ID:[110, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:48622,word_type:0 , UserDefine:核心词典, Word:社会, Weight:6646\nNo.14:start:82, length:3, POS_ID:[99, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:32081,word_type:0 , UserDefine:核心词典, Word:而, Weight:6610\nNo.15:start:85, length:6, POS_ID:[118, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],word_ID:27256,word_type:0 , UserDefine:核心词典, Word:奋斗, Weight:9364\n",
120
+ # result
121
+
122
+ # NLPIR_AddUserWord("1989年春夏之交的政治风波 n")
123
+ # assert_equal "1989年春夏之交的政治风波/n 1989年政治风波/n 24小时降雪量/n 24/m 小时/q 降雨量/n 863/m 计划/n ABC/n 防护/v 训练/v APEC/n 会议/n BB/n 机/n BP机/n C2系统/n C3I/n 系统/n C3/n 系统/n C4ISR/n 系统/n C4I/n 系统/n CCITT/n 建议/n ",
124
+ # NLPIR_ParagraphProcess("1989年春夏之交的政治风波1989年政治风波24小时降雪量24小时降雨量863计划ABC防护训练APEC会议BB机BP机C2系统C3I系统C3系统C4ISR系统C4I系统CCITT建议")
125
+ # NLPIR_DelUsrWord("1989年春夏之交的政治风波")
126
+
127
+ # assert_equal 5,
128
+ # NLPIR_ImportUserDict("./userdict.txt")
129
+ # NLPIR_SaveTheUsrDic()
130
+ # assert_equal "1989年春夏之交的政治风波/n 1989年政治风波/n 24小时降雪量/n 24/m 小时/q 降雨量/n 863/m 计划/n ABC/n 防护/v 训练/v APEC/n 会议/n BB/n 机/n BP机/n C2系统/n C3I/n 系统/n C3/n 系统/n C4ISR/n 系统/n C4I/n 系统/n CCITT/n 建议/n ",
131
+ # NLPIR_ParagraphProcess("1989年春夏之交的政治风波1989年政治风波24小时降雪量24小时降雨量863计划ABC防护训练APEC会议BB机BP机C2系统C3I系统C3系统C4ISR系统C4I系统CCITT建议")
132
+
133
+ # NLPIR_FileProcess("./test.txt", "./test_result.txt", NLPIR_TRUE)
134
+ # assert_equal 16932,
135
+ # File.open("./test_result.txt").size
136
+
137
+ # assert_equal 15,
138
+ # NLPIR_GetParagraphProcessAWordCount($s)
139
+
140
+ # assert_equal "李毅/n/4.57#球迷/n/2.20#屌丝/n_newword/1.77#开始/v/1.74#百度/n/1.39#",
141
+ # NLPIR_GetKeyWords($text, 50,NLPIR_TRUE)
142
+ # assert_equal "李毅/n/8.90#社会/n/4.06#",
143
+ # NLPIR_GetFileKeyWords("./test.txt",2, NLPIR_TRUE)
144
+
145
+ # assert_equal "淋语/n_new/4.99#",
146
+ # NLPIR_GetNewWords($text2, 50, NLPIR_TRUE)
147
+ # assert_equal "淋语/n_new/5.96#指淋淋/n_new/5.60#",
148
+ # NLPIR_GetFileNewWords("./findnewword.txt", 50, NLPIR_TRUE)
149
+
150
+ # assert_equal 1644572591,
151
+ # NLPIR_FingerPrint($text)
152
+ # NLPIR_Exit()
153
+
154
+ # end
158
155
  end