doomiaichat 4.9.0 → 5.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/dist/openai.js CHANGED
@@ -13,72 +13,7 @@ var __importDefault = (this && this.__importDefault) || function (mod) {
13
13
  };
14
14
  Object.defineProperty(exports, "__esModule", { value: true });
15
15
  const azure_openai_1 = require("azure-openai");
16
- // import { EventEmitter } from "events";
17
16
  const gptbase_1 = __importDefault(require("./gptbase"));
18
- const SECTION_LENGTH = 1024; ///每2400个字符分成一组
19
- const MESSAGE_LENGTH = 1; ///每次送8句话给openai 进行解析,送多了,会报错
20
- //请将答案放在最后,标记为答案:()
21
- // const QUESTION_TEXT_MAPPING: any = {
22
- // singlechoice: '你是一名专业的出题老师,根据以下内容,生成@ITEMCOUNT@道单选题,每道题目4个选项,每道题的选项中的元素用大写字母ABCD开头,每道题一个正确答案,输出结果必须是JSON数组并按照[{"question":"","choice":[],"answer":[]}]的结构输出',
23
- // multiplechoice: '你是一名专业的出题老师,根据以下内容,请生成@ITEMCOUNT@道多选题,提供4个选项,每道题的选项中的元素用大写字母ABCD开头,每道题的答案至少有两个选项,输出结果必须是JSON数组并按照[{"question":"","choice":[],"answer":[]}]的结构输出', //请将答案放在最后,标记为答案:()
24
- // trueorfalse: '你是一名专业的出题老师,根据以下内容,请生成@ITEMCOUNT@道判断题,每道题正确和错误两个选项,输出结果必须是JSON数组并按照[{"question":"","choice":["A.正确","B.错误"],"answer":[]}]的结构输出', //标记为答案:(正确或错误)
25
- // completion: '你是一名专业的出题老师,根据以下内容,请生成@ITEMCOUNT@道填空题和对应答案,输出结果必须是JSON数组并按照[{"question":"","answer":["填空答案1","填空答案2"]}]的结构输出' //请将答案放在最后,标记为答案:()
26
- // }
27
- const FAQ_ROLE_DEFINE = `
28
- 角色扮演:你是一位精通各行业的培训专家,你擅长从资料里提取重点要点,并形成用于培训员工的问题及对应的答案和答案的关键词。请记住:
29
- 1、问题需要偏口语化,问题需要与所给的资料相关,绝不能问超出所给资料的范围;每个问题需要有主语,所提问题需要准确、完整、清晰,绝不能有歧义;意思相近的问题不要重复给出;
30
- 2、对应的答案必须要在资料中能找到,绝对不能给出在资料里没有的答案,答案的关键词必须完整在所给的答案中出现,绝不能给出不在答案里的关键词;
31
- 3、生成问题的时候,请出具有代表性的问题,对于一些无关紧要的问题可以忽略。特别注意资料中关于数字、参数、特点等关键信息的提取,在给出的问题中尽可能覆盖;
32
- 4、生成的结果严格按照[{"question":"提问内容","answer":"答案内容","keywords":["关键词1","关键词2"]}]的标准JSON数组结构输出。
33
- `;
34
- const QUESTION_ROLE_DEFINE = {
35
- singlechoice: `
36
- 角色扮演:你是一位精通各行业的培训专家,你擅长从资料里提取重点要点,并形成用于培训员工的单选题,每道题包括一个问题和四个选项,其中只有一个选项是正确的。请记住:
37
- 1、问题需要与所给的资料相关,绝不能问超出所给资料的范围;每个问题需要有主语,所提问题需要准确、完整、清晰,绝不能有歧义;意思相近的问题不要重复给出;
38
- 2、四个选项用大写字母ABCD开头,其中只有一个是正确的选项,而且这个正确的选项必须要在资料中能找到,绝对不能给出在资料里没有的正确选项;
39
- 3、生成问题的时候,请出具有代表性的问题,对于一些无关紧要的问题可以忽略。特别注意资料中关于数字、参数、特点等关键信息的提取,在给出的问题中尽可能覆盖;
40
- 4、生成的结果严格按照标准JSON数组并按照[{"question":"","choice":[],"answer":[]}]的结构输出`,
41
- multiplechoice: `
42
- 角色扮演:你是一位精通各行业的培训专家,你擅长从资料里提取重点要点,并形成用于培训员工的多选题,每道题包括一个问题和四个选项,其中至少有两个选项是正确的。请记住:
43
- 1、问题需要与所给的资料相关,绝不能问超出所给资料的范围;每个问题需要有主语,所提问题需要准确、完整、清晰,绝不能有歧义;意思相近的问题不要重复给出;
44
- 2、四个选项用大写字母ABCD开头,其中至少有两个是正确的选项,而且正确的选项必须要在资料中能找到,绝对不能给出在资料里没有的正确选项;
45
- 3、生成问题的时候,请出具有代表性的问题,对于一些无关紧要的问题可以忽略。特别注意资料中关于数字、参数、特点等关键信息的提取,在给出的问题中尽可能覆盖;
46
- 4、生成的结果严格按照标准JSON数组并按照[{"question":"","choice":[],"answer":[]}]的结构输出
47
- `,
48
- trueorfalse: `
49
- 角色扮演:你是一位精通各行业的培训专家,你擅长从资料里提取重点要点,并形成用于培训员工的判断题,每道题包括一个问题和一个正确和一个错误的两个选项。请记住:
50
- 1、问题需要与所给的资料相关,绝不能问超出所给资料的范围;每个问题需要有主语,所提问题需要准确、完整、清晰,绝不能有歧义;意思相近的问题不要重复给出;
51
- 2、两个选项必须为“正确”和“错误”这两个,正确答案必须是其中一个;
52
- 3、生成问题的时候,请出具有代表性的问题,对于一些无关紧要的问题可以忽略。特别注意资料中关于数字、参数、特点等关键信息的提取,在给出的问题中尽可能覆盖;
53
- 5、生成的结果严格按照标准JSON数组并按照[{"question":"","choice":["A.正确","B.错误"],"answer":[]}]的结构输出'
54
- `,
55
- completion: `
56
- 角色扮演:你是一位精通各行业的培训专家,你擅长从资料里提取重点要点,并形成用于培训员工的填空题及对应的答案。请记住:
57
- 1、问题需要与所给的资料相关,绝不能问超出所给资料的范围;每个问题需要有主语,所提问题需要准确、完整、清晰,绝不能有歧义;意思相近的问题不要重复给出;
58
- 2、对应的答案必须要在资料中能找到,绝对不能给出在资料里没有的答案,答案尽量选择数字、词组等,字数不超过10个字,避免出现过长的答案;
59
- 3、生成问题的时候,请出具有代表性的问题,对于一些无关紧要的问题可以忽略。特别注意资料中关于数字、参数、特点等关键信息的提取,在给出的问题中尽可能覆盖;
60
- 4、生成的结果严格按照标准JSON数组并按照[{"question":"","answer":["填空答案1","填空答案2"]}]的结构输出'
61
- `
62
- };
63
- /**
64
- * 问题生成的Prompt
65
- */
66
- const QUESTION_PROMPT = {
67
- singlechoice: '根据以下内容,生成@ITEMCOUNT@道单选题,每道题目4个选项,每道题的选项中的元素用大写字母ABCD开头,每道题一个正确答案,输出结果必须是JSON数组并按照[{"question":"","choice":[],"answer":[]}]的结构输出。如果内容不足以提取问题和答案,请直接输出JSON空数组。',
68
- multiplechoice: '根据以下内容,请生成@ITEMCOUNT@道多选题,提供4个选项,每道题的选项中的元素用大写字母ABCD开头,每道题的答案至少有两个选项,输出结果必须是JSON数组并按照[{"question":"","choice":[],"answer":[]}]的结构输出。如果内容不足以提取问题和答案,请直接输出JSON空数组。',
69
- trueorfalse: '根据以下内容,请生成@ITEMCOUNT@道判断题,每道题正确和错误两个选项,输出结果必须是JSON数组并按照[{"question":"","choice":["A.正确","B.错误"],"answer":[]}]的结构输出。如果内容不足以提取问题和答案,请直接输出JSON空数组。',
70
- completion: '根据以下内容,请生成@ITEMCOUNT@道填空题和对应答案,输出结果必须是JSON数组并按照[{"question":"","answer":["填空答案1","填空答案2"]}]的结构输出。如果内容不足以提取问题和答案,请直接输出JSON空数组。'
71
- };
72
- /**
73
- * 问题生成的Prompt
74
- */
75
- const QUESTION_PROMPT_FIXED = {
76
- singlechoice: '[{"question":"","choice":[],"answer":[]}]',
77
- multiplechoice: '[{"question":"","choice":[],"answer":[]}]',
78
- trueorfalse: '[{"question":"","choice":["A.正确","B.错误"],"answer":[]}]',
79
- completion: '[{"question":"","answer":["填空答案1","填空答案2"]}]'
80
- };
81
- const QUESTION_TYPE = ['singlechoice', 'multiplechoice', 'trueorfalse', 'completion'];
82
17
  class OpenAIGpt extends gptbase_1.default {
83
18
  /**
84
19
  *
@@ -173,12 +108,13 @@ class OpenAIGpt extends gptbase_1.default {
173
108
  if (!this.aiApi) {
174
109
  this.aiApi = this.createOpenAI(this.apiKey);
175
110
  }
111
+ // const DATA_END_TAG = `"usage":null}`
176
112
  let message = typeof (chatText) == 'string' ?
177
113
  [{ role: 'user', content: chatText }] : chatText;
178
114
  axiosOption = Object.assign({}, axiosOption || { timeout: 60000 }, { responseType: 'stream' });
179
115
  let requestid = Math.ceil(Math.random() * (new Date().getTime() * Math.random()) / 1000);
180
116
  try {
181
- let finishreason = null, usage = null;
117
+ let finishreason = null, usage = null, errtxt = '';
182
118
  ///便于知道返回的requestid
183
119
  // console.log('model', callChatOption?.model || this.chatModel,)
184
120
  const response = yield this.aiApi.createChatCompletion({
@@ -194,9 +130,15 @@ class OpenAIGpt extends gptbase_1.default {
194
130
  ///已经返回了结束原因
195
131
  if (finishreason)
196
132
  return;
197
- for (const line of lines) {
198
- const message = line.replace(/^data: /, '');
199
- if (message === '[DONE]') {
133
+ // console.log('before add', lines.join('').split('data:'));
134
+ let alltext = (errtxt + lines.join('')).split('data:');
135
+ // console.log('alltext',alltext)
136
+ errtxt = '';
137
+ for (const line of alltext) {
138
+ let txt = line.trim();
139
+ if (!txt)
140
+ continue;
141
+ if (txt === '[DONE]') {
200
142
  let output = { successed: true, requestid, text: replytext.join(''), finish_reason: 'stop', usage };
201
143
  if (attach)
202
144
  output = Object.assign({}, output, attach);
@@ -206,7 +148,8 @@ class OpenAIGpt extends gptbase_1.default {
206
148
  try {
207
149
  ///{ delta: { content: '$\\' }, index: 0, finish_reason: null }
208
150
  ///发送出去
209
- const parsed = JSON.parse(message);
151
+ const parsed = JSON.parse(txt);
152
+ ///已经返回一个正确的了,可以重置这个变量了
210
153
  finishreason = parsed.choices[0].finish_reason;
211
154
  usage = parsed.usage;
212
155
  let streamtext = parsed.choices[0].delta.content;
@@ -219,7 +162,8 @@ class OpenAIGpt extends gptbase_1.default {
219
162
  return;
220
163
  }
221
164
  catch (error) {
222
- this.emit('chaterror', { successed: false, requestid, error: 'JSON parse stream message', message });
165
+ errtxt += txt; ///这一段json没有结束,作为下一次的流过来时使用
166
+ this.emit('chaterror', { successed: false, requestid, error: 'JSON parse stream message', errtxt });
223
167
  }
224
168
  }
225
169
  });
@@ -231,522 +175,5 @@ class OpenAIGpt extends gptbase_1.default {
231
175
  }
232
176
  });
233
177
  }
234
- /**
235
- * 点评问题回答的评价
236
- * @param question
237
- * @param answer
238
- * @param axiosOption
239
- */
240
- commentQuestionAnswer(question, answer, axiosOption = { timeout: 30000 }) {
241
- return __awaiter(this, void 0, void 0, function* () {
242
- if (!question || !answer)
243
- return { successed: false, error: { errcode: 2, errmsg: '缺失参数' } };
244
- let message = [
245
- { role: 'system', content: '你是一名专业的知识点评师。' },
246
- { role: 'user', content: `问题题干:“${question}”` },
247
- { role: 'user', content: `回答内容:“${answer}”` },
248
- { role: 'user', content: `请根据以上的回答内容进行点评,给出一段不超过200字的评语,并给出0-100的评分。` },
249
- { role: 'user', content: `结果完整按照{"comment":"点评内容","score":"评分"}的JSON结构输出` }
250
- ];
251
- const result = yield this.chatRequest(message, {}, axiosOption);
252
- if (result.successed && result.message) {
253
- let value = result.message[0].message.content.trim();
254
- let replyJson = this.fixedJsonString(value);
255
- ///能够提取到内容
256
- if (replyJson.length)
257
- return Object.assign({ successed: true }, replyJson[0]);
258
- ///回答的内容非JSON格式,自己来提取算了
259
- console.log('自己组装');
260
- let matched = value.match(/\d+分/g), score = 0;
261
- if (matched && matched.length) {
262
- score = Number(matched[0].replace('分', ''));
263
- }
264
- return { successed: true, comment: value, score };
265
- }
266
- return { successed: false };
267
- });
268
- }
269
- /**
270
- * 判断一句话的表达情绪
271
- * @param {*} s1
272
- * @param {*} axiosOption
273
- */
274
- getScentenceEmotional(s1, axiosOption = { timeout: 30000 }) {
275
- return __awaiter(this, void 0, void 0, function* () {
276
- if (!s1)
277
- return { successed: false, error: { errcode: 2, errmsg: '缺失参数' } };
278
- const emotion = ['愤怒', '威胁', '讽刺', '愧疚', '兴奋', '友好', '消极', '生气', '正常'];
279
- const messages = [
280
- { role: 'system', content: `你是一名专业的语言大师` },
281
- { role: 'user', content: s1 },
282
- { role: 'user', content: `请分析上述内容的语言情绪,请从"${emotion.join(',')}"这些情绪中对应一个输出` },
283
- ];
284
- const result = yield this.chatRequest(messages, {}, axiosOption);
285
- if (result.successed && result.message) {
286
- let value = result.message[0].message.content.trim();
287
- for (const word of emotion) {
288
- if (value.indexOf(word) >= 0)
289
- return { successed: true, emotion: word };
290
- }
291
- }
292
- return { successed: true, emotion: '未知' };
293
- });
294
- }
295
- /**
296
- * 获取两句话的相似度取值
297
- * @param {*} s1
298
- * @param {*} s2
299
- */
300
- getScentenseSimilarity(s1, s2, axiosOption = { timeout: 30000 }) {
301
- return __awaiter(this, void 0, void 0, function* () {
302
- if (!s1 || !s2)
303
- return { successed: false, error: { errcode: 2, errmsg: '缺失参数' } };
304
- const messages = [
305
- { role: 'system', content: '你是一名专业的语言分析大师' },
306
- { role: 'user', content: s1 },
307
- { role: 'user', content: s2 },
308
- { role: 'user', content: '请从语义上对比以上两句话的相似度,请仅输出0至100之间的整数对比结果即可' },
309
- ];
310
- const result = yield this.chatRequest(messages, { maxtoken: 32 }, axiosOption);
311
- if (result.successed && result.message) {
312
- let value = result.message[0].message.content.replace(/[^\d]/g, "");
313
- if (value > 100)
314
- value = Math.floor(value / 10);
315
- return { successed: true, value: Number(value) };
316
- }
317
- return { successed: false, error: result.error, value: 0 };
318
- });
319
- }
320
- /**
321
- * 获得一种内容的相似说法
322
- * 比如:
323
- * 你今年多大?
324
- * 相似问法:您是哪一年出生的
325
- * 您今年贵庚?
326
- * @param {*} content
327
- * @param {需要出来的数量} count
328
- */
329
- getSimilarityContent(content, count = 1, axiosOption = {}) {
330
- return __awaiter(this, void 0, void 0, function* () {
331
- let chnReg = /([\u4e00-\u9fa5]|[\ufe30-\uffa0])/.test(content); ///检查源话是否含有中文内容
332
- let engReg = /[a-zA-Z]/.test(content); ///检查源话是否含有英文内容
333
- ///如果源话是全中文,那么结果中不应该出来英文的相似说法,如果源话是全英文,则结果不能出现全中文的说法
334
- let prefix = (!chnReg && engReg) ? '请用完整的英文表达,' : ((chnReg && !engReg) ? '请用完整的中文表达,' : '');
335
- const text = `${prefix}生成与下面句子意思相同的内容"${content}"`;
336
- let result = yield this.chatRequest(text, { replyCounts: count }, axiosOption);
337
- if (!result.successed || !result.message)
338
- return result;
339
- let replys = result.message.map(item => { return item.message.content.trim(); });
340
- return { successed: true, message: replys };
341
- });
342
- }
343
- /**
344
- * 提取内容的中心思想摘要
345
- * @param content
346
- * @param axiosOption
347
- */
348
- getSummaryOfContent(content, axiosOption = {}) {
349
- return __awaiter(this, void 0, void 0, function* () {
350
- let arrContent = [];
351
- if (typeof (content) == 'string') {
352
- let splittext = this.splitLongText(content);
353
- for (const string of splittext) {
354
- arrContent.push({ role: 'user', content: string });
355
- }
356
- }
357
- else {
358
- arrContent = content;
359
- }
360
- let summary = [];
361
- while (arrContent.length > 0) {
362
- let subarray = arrContent.slice(0, MESSAGE_LENGTH);
363
- subarray.push({ role: 'user', content: '根据上述内容精简,提炼内容提纲及摘要内容,每项摘要内容尽量精简数据化不超过100字,结果严格按照[{outline:"提纲标题","summary":["摘要内容1","摘要内容2","摘要内容3"]}]的JSON结构输出' });
364
- let result = yield this.chatRequest(subarray, {}, axiosOption);
365
- if (result.successed && result.message) {
366
- try {
367
- // console.log('result.message[0].content', result.message[0].message.content)
368
- let jsonObjItems = JSON.parse(result.message[0].message.content);
369
- if (Array.isArray(jsonObjItems))
370
- summary = summary.concat(jsonObjItems);
371
- }
372
- catch (error) {
373
- console.log('result.message[0].content', error);
374
- }
375
- }
376
- ////删除已经处理的文本
377
- arrContent.splice(0, MESSAGE_LENGTH);
378
- }
379
- return { successed: true, article: summary };
380
- });
381
- }
382
- /**
383
- * 从指定的文本内容中生成相关的问答
384
- * @param {*} content
385
- * @param {*} count
386
- * @param {*} axiosOption
387
- * @returns
388
- */ //并在答案末尾处必须给出答案内容中的关键词
389
- generateQuestionsFromContent(content, count = 1, everyContentLength = SECTION_LENGTH, axiosOption = {}) {
390
- var _a;
391
- return __awaiter(this, void 0, void 0, function* () {
392
- let arrContent = this.splitLongText(content, everyContentLength || SECTION_LENGTH);
393
- ///如果最后一段的文字内容过短,则把最后一段内容追加到前一段中,并删除最后一段
394
- let totalLen = arrContent.length;
395
- if (totalLen >= 2 && (((_a = arrContent[totalLen - 1]) === null || _a === void 0 ? void 0 : _a.length) || 0) < 100) {
396
- arrContent[totalLen - 2] += arrContent[totalLen - 1];
397
- arrContent.splice(totalLen - 1, 1);
398
- }
399
- ///没20句话分为一组,适应大文件内容多次请求组合结果
400
- ///每一句话需要产生的题目
401
- let questions4EverySentense = count / arrContent.length; //Math.ceil(arrContent.length / 20);
402
- let faqs = [], gotted = 0;
403
- while (arrContent.length > 0 && gotted < count) {
404
- questions4EverySentense = (count - gotted) / arrContent.length;
405
- ////每次最多送MESSAGE_LENGTH句话给openai
406
- let itemCount = Math.min(Math.ceil(questions4EverySentense), count - gotted);
407
- let subarray = [
408
- { role: 'system', content: FAQ_ROLE_DEFINE },
409
- { role: 'user', content: `从以下内容中提取${itemCount}条提问及答案,并从答案内容提取出至少2个关键词,最终结果按照[{"question":"提问内容","answer":"答案内容","keywords":["关键词1","关键词2"]}]的JSON数组结构输出。如果内容不足以提取问题和答案,请直接输出JSON空数组 []。` },
410
- { role: 'user', content: arrContent.slice(0, 1)[0] }
411
- ];
412
- console.log('Faq Question Pick Prompt:', subarray);
413
- let result = yield this.chatRequest(subarray, { replyCounts: 1 }, axiosOption);
414
- ///如果请求发生了网络错误(不是内容合规问题),则再重试一次,如果任然有错则放弃
415
- if (!result.successed && result.error != 'content_filter') {
416
- console.log('network error,retry onemore time');
417
- result = yield this.chatRequest(subarray, { replyCounts: 1 }, axiosOption);
418
- }
419
- if (result.successed && result.message) {
420
- let msgs = yield this.pickUpFaqContent(result.message);
421
- if (msgs.length) {
422
- ///对外发送检出问答题的信号
423
- this.emit('parseout', { type: 'qa', items: msgs });
424
- gotted += msgs.length; //result.message.length;
425
- faqs = faqs.concat(msgs);
426
- }
427
- }
428
- ////删除已经处理的文本
429
- arrContent.splice(0, 1);
430
- }
431
- arrContent = []; /// 释放内存
432
- ///发出信号,解析完毕
433
- this.emit('parseover', { type: 'qa', items: faqs });
434
- return { successed: true, message: faqs.slice(0, count) };
435
- });
436
- }
437
- /**
438
- * 解析Faq返回的问题
439
- * @param {*} messages
440
- * @returns
441
- */
442
- pickUpFaqContent(messages) {
443
- var _a, _b;
444
- return __awaiter(this, void 0, void 0, function* () {
445
- if (!((_b = (_a = messages[0]) === null || _a === void 0 ? void 0 : _a.message) === null || _b === void 0 ? void 0 : _b.content))
446
- return [];
447
- let answerString = messages[0].message.content.trim().replace(/\t|\n|\v|\r|\f/g, '');
448
- if (answerString === '[]')
449
- return [];
450
- let jsonObj = this.fixedJsonString(answerString);
451
- if (!jsonObj.length) {
452
- let fixedAsk = [
453
- { role: 'system', content: '角色扮演:假设你是一位高级JSON数据分析师' },
454
- { role: 'user', content: `请分析以下内容,严格按照[{"question":"提问内容","answer":"答案内容","keywords":["关键词1","关键词2"]}]的标准JSON数组结构输出。如果内容不足以提取问题和答案,请直接输出JSON空数组,无需提供参考。` },
455
- { role: 'user', content: answerString },
456
- ];
457
- console.log('pickUpFaqContent fixedAsk', fixedAsk);
458
- let fixedJsonResult = yield this.chatRequest(fixedAsk, { replyCounts: 1 }, {});
459
- if (fixedJsonResult.successed) {
460
- answerString = fixedJsonResult.message[0].message.content.trim().replace(/\t|\n|\v|\r|\f/g, '');
461
- jsonObj = this.fixedJsonString(answerString);
462
- }
463
- if (!jsonObj.length)
464
- return [];
465
- }
466
- try {
467
- //let jsonObj = JSON.parse(answerString);
468
- //let jsonObj = eval(answerString);
469
- jsonObj.map((item) => {
470
- let realKeyword = [];
471
- let keywords = (item.keywords + '').split(',');
472
- let answer = item.answer || '';
473
- for (const k of keywords) {
474
- if (k && answer.indexOf(k) >= 0)
475
- realKeyword.push(k);
476
- }
477
- item.keywords = realKeyword;
478
- return item;
479
- });
480
- return jsonObj;
481
- }
482
- catch (err) {
483
- console.log('JSON error', err);
484
- return [];
485
- }
486
- });
487
- }
488
- /**
489
- * 从指定的文本内容中生成一张试卷
490
- * @param {*} content
491
- * @param {试卷的参数} paperOption
492
- * totalscore: 试卷总分,默认100
493
- * section: {type:[0,1,2,3]为单选、多选、判断、填空题型 count:生成多少道 score:本段分数}
494
- * @param {*} axiosOption
495
- * @returns
496
- */ //并在答案末尾处必须给出答案内容中的关键词
497
- generateExaminationPaperFromContent(content, paperOption = {}, everyContentLength = SECTION_LENGTH, axiosOption = {}) {
498
- var _a, _b, _c, _d, _e, _f, _g, _h, _j, _k, _l, _m, _o;
499
- return __awaiter(this, void 0, void 0, function* () {
500
- let arrContent = this.splitLongText(content, everyContentLength || SECTION_LENGTH);
501
- ///如果最后一段的文字内容过短,则把最后一段内容追加到前一段中,并删除最后一段
502
- let totalLen = arrContent.length;
503
- if (totalLen >= 2 && (((_a = arrContent[totalLen - 1]) === null || _a === void 0 ? void 0 : _a.length) || 0) < 100) {
504
- arrContent[totalLen - 2] += arrContent[totalLen - 1];
505
- arrContent.splice(totalLen - 1, 1);
506
- }
507
- let sectionCount = {
508
- singlechoice: (((_b = paperOption.singlechoice) === null || _b === void 0 ? void 0 : _b.count) || 0) / arrContent.length,
509
- multiplechoice: (((_c = paperOption.multiplechoice) === null || _c === void 0 ? void 0 : _c.count) || 0) / arrContent.length,
510
- trueorfalse: (((_d = paperOption.trueorfalse) === null || _d === void 0 ? void 0 : _d.count) || 0) / arrContent.length,
511
- completion: (((_e = paperOption.completion) === null || _e === void 0 ? void 0 : _e.count) || 0) / arrContent.length
512
- };
513
- ///剩余待生成的题目数量
514
- let remainCount = {
515
- singlechoice: ((_f = paperOption.singlechoice) === null || _f === void 0 ? void 0 : _f.count) || 0,
516
- multiplechoice: ((_g = paperOption.multiplechoice) === null || _g === void 0 ? void 0 : _g.count) || 0,
517
- trueorfalse: ((_h = paperOption.trueorfalse) === null || _h === void 0 ? void 0 : _h.count) || 0,
518
- completion: ((_j = paperOption.completion) === null || _j === void 0 ? void 0 : _j.count) || 0
519
- };
520
- ///每种类型的题目的分数
521
- let ITEM_SCORE = {
522
- singlechoice: ((_k = paperOption.singlechoice) === null || _k === void 0 ? void 0 : _k.score) || 0,
523
- multiplechoice: ((_l = paperOption.multiplechoice) === null || _l === void 0 ? void 0 : _l.score) || 0,
524
- trueorfalse: ((_m = paperOption.trueorfalse) === null || _m === void 0 ? void 0 : _m.score) || 0,
525
- completion: ((_o = paperOption.completion) === null || _o === void 0 ? void 0 : _o.score) || 0
526
- };
527
- ///最后生成出来的结果
528
- let paperReturned = {
529
- singlechoice: [], multiplechoice: [], trueorfalse: [], completion: []
530
- }, noMoreQuestionRetrive = false, totalscore = 0;
531
- while (arrContent.length > 0 && !noMoreQuestionRetrive) {
532
- ////每次最多送MESSAGE_LENGTH句话给openai
533
- /**
534
- * 每种类型的题目进行遍历
535
- */
536
- noMoreQuestionRetrive = true;
537
- for (const key of QUESTION_TYPE) {
538
- ///还需要抓取题目
539
- if (remainCount[key] > 0) {
540
- noMoreQuestionRetrive = false;
541
- //let itemCount = Math.min(remainCount[key], Math.ceil(subarray.length * sectionCount[key]));
542
- let itemCount = Math.min(remainCount[key], Math.ceil(sectionCount[key]));
543
- let subarray = [
544
- { role: 'system', content: QUESTION_ROLE_DEFINE[key] },
545
- { role: 'user', content: QUESTION_PROMPT[key].replace('@ITEMCOUNT@', itemCount) },
546
- { role: 'user', content: arrContent.slice(0, 1)[0] }
547
- ];
548
- // subarray.unshift()
549
- console.log('subarray', subarray);
550
- let result = yield this.chatRequest(subarray, { replyCounts: 1 }, axiosOption);
551
- ///如果请求发生了网络错误(不是内容合规问题),则再重试一次,如果任然有错则放弃
552
- if (!result.successed && result.error != 'content_filter') {
553
- console.log('network error,retry onemore time');
554
- result = yield this.chatRequest(subarray, { replyCounts: 1 }, axiosOption);
555
- }
556
- console.log('subarray returned', result.successed);
557
- if (result.successed && result.message) {
558
- //console.log('paper result', key, result.message.length)
559
- let pickedQuestions = yield this.pickUpQuestions(result.message, itemCount, key, ITEM_SCORE[key]);
560
- if (pickedQuestions.length) {
561
- ///对外发送检出题目的信号
562
- this.emit('parseout', { type: 'question', name: key, items: pickedQuestions });
563
- paperReturned[key] = paperReturned[key].concat(pickedQuestions);
564
- remainCount[key] = remainCount[key] - pickedQuestions.length;
565
- totalscore = totalscore + pickedQuestions.length * ITEM_SCORE[key];
566
- }
567
- }
568
- //subarray.splice(0, 1); ///把第一个角色定位的问法删除
569
- // subarray.splice(subarray.length - 1, 1); ///把第一个角色定位的问法删除
570
- }
571
- }
572
- ////删除已经处理的文本
573
- arrContent.splice(0, MESSAGE_LENGTH);
574
- }
575
- console.log('parseover');
576
- ///发出信号,解析完毕
577
- this.emit('parseover', { type: 'question', items: paperReturned });
578
- return { successed: true, score: totalscore, paper: paperReturned };
579
- });
580
- }
581
- /**
582
- * 从答复中得到题目
583
- * @param {*} result
584
- *
585
- */
586
- pickUpQuestions(result, count, questiontype, score = 1) {
587
- var _a, _b;
588
- return __awaiter(this, void 0, void 0, function* () {
589
- if (!((_b = (_a = result[0]) === null || _a === void 0 ? void 0 : _a.message) === null || _b === void 0 ? void 0 : _b.content))
590
- return [];
591
- let answerString = result[0].message.content.trim().replace(/\t|\n|\v|\r|\f/g, '');
592
- if (answerString === '[]')
593
- return [];
594
- let jsonObj = this.fixedJsonString(answerString);
595
- ////修复的结果无法用程序修复,请求GPT来分析修复一下这个结果
596
- if (!jsonObj.length) {
597
- let fixedAsk = [
598
- { role: 'system', content: '角色扮演:假设你是一位高级JSON数据分析师' },
599
- { role: 'user', content: `请分析以下内容,严格按照${QUESTION_PROMPT_FIXED[questiontype]}的标准JSON数组结构输出。如果内容不足以提取问题和答案,请直接输出JSON空数组,无需提供参考。` },
600
- { role: 'user', content: answerString },
601
- ];
602
- console.log('fixedAsk', fixedAsk);
603
- let fixedJsonResult = yield this.chatRequest(fixedAsk, { replyCounts: 1 }, {});
604
- if (fixedJsonResult.successed) {
605
- answerString = fixedJsonResult.message[0].message.content.trim().replace(/\t|\n|\v|\r|\f/g, '');
606
- jsonObj = this.fixedJsonString(answerString);
607
- }
608
- if (!jsonObj.length)
609
- return [];
610
- }
611
- let returnItems = [];
612
- try {
613
- // let jsonObj = JSON.parse(answerString);
614
- returnItems = jsonObj.map((questionitem) => {
615
- console.log('answer item from jsonObj', questionitem);
616
- if (questionitem.choice && Array.isArray(questionitem.choice) && questiontype != 'completion') {
617
- questionitem.fullanswer = (questionitem.answer + '').replace(/,|[^ABCDE]/g, '');
618
- questionitem.score = score;
619
- if (questionitem.choice) {
620
- questionitem.choice = questionitem.choice.map((item, index) => {
621
- let seqNo = 'ABCDEFG'[index]; //String.fromCharCode(65 + index);
622
- let correctReg = new RegExp(`${seqNo}.|${seqNo}`, 'ig');
623
- // console.log('itemitemitem', item)
624
- //let answer = jsonObj.fullanswer
625
- return {
626
- id: seqNo,
627
- content: (item + '').replace(correctReg, '').trim(),
628
- iscorrect: (questionitem.fullanswer || '').indexOf(seqNo) >= 0 ? 1 : 0
629
- //|| jsonObj.fullanswer.indexOf(m))
630
- };
631
- });
632
- }
633
- ///如果是非判断题,题目的选项数量小于2 ,则无效
634
- ///如果是判断题,题目的选项必须=2
635
- if (!questionitem.choice || (questiontype != 'trueorfalse' && questionitem.choice.length < 3) || (questiontype == 'trueorfalse' && questionitem.choice.length != 2)) {
636
- return null;
637
- }
638
- }
639
- switch (questiontype) {
640
- case 'singlechoice':
641
- questionitem.answer = (questionitem.answer + '').replace(/,|[^ABCDEFG]/g, '').split('').slice(0, 1);
642
- break;
643
- case 'multiplechoice':
644
- questionitem.answer = Array.from(new Set((questionitem.answer + '').replace(/,|[^ABCDEFG]/g, '').split('')));
645
- break;
646
- case 'trueorfalse':
647
- let rightItem = questionitem.choice.find((x) => { return x.iscorrect == 1; });
648
- questionitem.answer = [(rightItem === null || rightItem === void 0 ? void 0 : rightItem.id) || 'Z']; //[(questionitem.answer + '').indexOf('正确') >= 0 ? 'A' : 'B']
649
- break;
650
- }
651
- ///单选题验证
652
- if (questiontype == 'singlechoice') {
653
- let rightAnswer = questionitem.choice ? questionitem.choice.filter((item) => { return item.iscorrect === 1; }) : [];
654
- ///单选题的正确选项大于了1个
655
- if (rightAnswer.length != 1 || !questionitem.answer || questionitem.answer.length !== 1)
656
- return null;
657
- ///正确选项和答案不一致
658
- if (rightAnswer[0].id.toUpperCase() != (questionitem.answer[0] || '').toUpperCase())
659
- return null;
660
- }
661
- ///多选题验证
662
- if (questiontype == 'multiplechoice') {
663
- let rightAnswer = questionitem.choice ? questionitem.choice.filter((item) => { return item.iscorrect === 1; }) : [];
664
- ///单选题的正确选项大于了1个
665
- if (rightAnswer.length === 0 || !questionitem.answer || questionitem.answer.length === 0)
666
- return null;
667
- }
668
- ///判断题验证:防止没有答案的
669
- if (questiontype == 'trueorfalse' && !questionitem.answer.length)
670
- return null;
671
- return questionitem;
672
- });
673
- }
674
- catch (err) {
675
- console.log('error happened:', err);
676
- }
677
- return returnItems.filter(i => { return i != null; }).slice(0, count);
678
- });
679
- }
680
- /**
681
- * 验证JSON字符串是否是真正可转换为JSON的合法格式
682
- * 这里只能做一个最简单的处理,就是用两端的符号
683
- * @param jsonstr
684
- */
685
- fixedJsonString(jsonstr) {
686
- console.log('original json string:', jsonstr);
687
- ///检查返回的是不是一个数组对象(我们需要的是数组对象)
688
- let firstBracketSymbol = jsonstr.indexOf("["); ////必须过滤出来数组
689
- let lastBracketSymbol = jsonstr.lastIndexOf("]");
690
- ///第一个花括号出现的位置,如果花括号出现的位置早于 [ ,则默认返回的对象不是一个数组,仅仅是一个对象,
691
- ///则需要我们用中括号包住
692
- let firstBraceSymbol = jsonstr.indexOf("{");
693
- let lastBraceSymbol = jsonstr.lastIndexOf("}");
694
- ///返回的不是一个数组结构的,只是一个{},我们帮他完成数组拼接
695
- if (firstBraceSymbol >= 0 &&
696
- firstBraceSymbol < (firstBracketSymbol >= 0 ? firstBracketSymbol : 1000) &&
697
- lastBraceSymbol > firstBraceSymbol &&
698
- lastBraceSymbol >= 0 && lastBraceSymbol > lastBracketSymbol) {
699
- jsonstr = '[' + jsonstr.substr(firstBraceSymbol, lastBraceSymbol - firstBraceSymbol + 1);
700
- +']';
701
- firstBracketSymbol = 0;
702
- lastBracketSymbol = jsonstr.length - 1;
703
- }
704
- else if (firstBracketSymbol < 0 || lastBracketSymbol < 0 || lastBracketSymbol <= firstBracketSymbol) {
705
- return [];
706
- }
707
- jsonstr = jsonstr.substr(firstBracketSymbol, lastBracketSymbol - firstBracketSymbol + 1);
708
- ///尽量处理一些能够一眼识别出来的JSON错误
709
- jsonstr = jsonstr.replace(/}{/g, '},{');
710
- let mutilitems = jsonstr.split('][');
711
- ///确实存在多个数组拼接在一起,中间没有逗号隔开的了
712
- let retObject = [];
713
- for (let str of mutilitems) {
714
- if (!str.startsWith('['))
715
- str = '[' + str;
716
- if (!str.endsWith(']'))
717
- str = str + ']';
718
- // console.log('json str', str)
719
- try {
720
- let jsonObj = eval(str);
721
- retObject = retObject.concat(jsonObj);
722
- }
723
- catch (err) {
724
- console.log('json error', str);
725
- }
726
- }
727
- return retObject;
728
- }
729
- /**
730
- * 将一段很长的文本,按1024长度来划分到多个中
731
- * @param {*} content
732
- */
733
- splitLongText(content, len = SECTION_LENGTH) {
734
- let start = 0, message = [], length = content.length;
735
- while (start < length) {
736
- let realLength = len;
737
- ////以句号或引号进行分段,不要随意截取
738
- for (let i = start + len; i >= start; i--) {
739
- if (/[。”"??]/.test(content[i] + '')) {
740
- realLength = i - start + 1;
741
- break;
742
- }
743
- }
744
- const subtext = content.substr(start, realLength).replace(/\t|\n|\v|\r|\f/g, '');
745
- if (subtext)
746
- message.push(subtext); //message.push({ role: 'user', content: subtext })
747
- start += realLength || len;
748
- }
749
- return message;
750
- }
751
178
  }
752
179
  exports.default = OpenAIGpt;