npm - doomiaichat - Versions diffs - 4.7.0 → 4.9.0 - Mend

doomiaichat 4.7.0 → 4.9.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (4) hide show

package/dist/openai.d.ts CHANGED Viewed

@@ -82,7 +82,7 @@ export default class OpenAIGpt extends GptBase {
      * @param {*} messages
      * @returns
      */
-    protected pickUpFaqContent(messages: Array<any>): Array<FaqItem>;
+    protected pickUpFaqContent(messages: Array<any>): Promise<Array<FaqItem>>;
     /**
      * 从指定的文本内容中生成一张试卷
      * @param {*} content
@@ -97,7 +97,7 @@ export default class OpenAIGpt extends GptBase {
      * @param {*} result
      *
      */
-    protected pickUpQuestions(result: Array<any>, count: number, questiontype: string, score?: number): Array<QuestionItem>;
+    protected pickUpQuestions(result: Array<any>, count: number, questiontype: string, score?: number): Promise<Array<QuestionItem>>;
     /**
      * 验证JSON字符串是否是真正可转换为JSON的合法格式
      * 这里只能做一个最简单的处理，就是用两端的符号

package/dist/openai.js CHANGED Viewed

@@ -64,10 +64,19 @@ const QUESTION_ROLE_DEFINE = {
  * 问题生成的Prompt
  */
 const QUESTION_PROMPT = {
-    singlechoice: '根据以下内容,生成@ITEMCOUNT@道单选题,每道题目4个选项,每道题的选项中的元素用大写字母ABCD开头,每道题一个正确答案,输出结果必须是JSON数组并按照[{"question":"","choice":[],"answer":[]}]的结构输出',
-    multiplechoice: '根据以下内容,请生成@ITEMCOUNT@道多选题,提供4个选项,每道题的选项中的元素用大写字母ABCD开头,每道题的答案至少有两个选项,输出结果必须是JSON数组并按照[{"question":"","choice":[],"answer":[]}]的结构输出',
-    trueorfalse: '根据以下内容,请生成@ITEMCOUNT@道判断题,每道题正确和错误两个选项，输出结果必须是JSON数组并按照[{"question":"","choice":["A.正确","B.错误"],"answer":[]}]的结构输出',
-    completion: '根据以下内容,请生成@ITEMCOUNT@道填空题和对应答案,输出结果必须是JSON数组并按照[{"question":"","answer":["填空答案1","填空答案2"]}]的结构输出'
+    singlechoice: '根据以下内容,生成@ITEMCOUNT@道单选题,每道题目4个选项,每道题的选项中的元素用大写字母ABCD开头,每道题一个正确答案,输出结果必须是JSON数组并按照[{"question":"","choice":[],"answer":[]}]的结构输出。如果内容不足以提取问题和答案，请直接输出JSON空数组。',
+    multiplechoice: '根据以下内容,请生成@ITEMCOUNT@道多选题,提供4个选项,每道题的选项中的元素用大写字母ABCD开头,每道题的答案至少有两个选项,输出结果必须是JSON数组并按照[{"question":"","choice":[],"answer":[]}]的结构输出。如果内容不足以提取问题和答案，请直接输出JSON空数组。',
+    trueorfalse: '根据以下内容,请生成@ITEMCOUNT@道判断题,每道题正确和错误两个选项，输出结果必须是JSON数组并按照[{"question":"","choice":["A.正确","B.错误"],"answer":[]}]的结构输出。如果内容不足以提取问题和答案，请直接输出JSON空数组。',
+    completion: '根据以下内容,请生成@ITEMCOUNT@道填空题和对应答案,输出结果必须是JSON数组并按照[{"question":"","answer":["填空答案1","填空答案2"]}]的结构输出。如果内容不足以提取问题和答案，请直接输出JSON空数组。'
+};
+/**
+ * 问题生成的Prompt
+ */
+const QUESTION_PROMPT_FIXED = {
+    singlechoice: '[{"question":"","choice":[],"answer":[]}]',
+    multiplechoice: '[{"question":"","choice":[],"answer":[]}]',
+    trueorfalse: '[{"question":"","choice":["A.正确","B.错误"],"answer":[]}]',
+    completion: '[{"question":"","answer":["填空答案1","填空答案2"]}]'
 };
 const QUESTION_TYPE = ['singlechoice', 'multiplechoice', 'trueorfalse', 'completion'];
 class OpenAIGpt extends gptbase_1.default {
@@ -137,6 +146,12 @@ class OpenAIGpt extends gptbase_1.default {
                     max_tokens: Number((callChatOption === null || callChatOption === void 0 ? void 0 : callChatOption.maxtoken) || this.maxtoken),
                     n: Number((callChatOption === null || callChatOption === void 0 ? void 0 : callChatOption.replyCounts) || 1) || 1
                 }, axiosOption);
+                // console.log('finish_reason==>', response.data.choices)
+                ////输出的内容不合规
+                if (response.data.choices[0].finish_reason === 'content_filter') {
+                    console.log('content_filter');
+                    return { successed: false, error: 'content_filter' };
+                }
                 return { successed: true, message: response.data.choices, usage: response.data.usage };
             }
             catch (error) {
@@ -372,8 +387,15 @@ class OpenAIGpt extends gptbase_1.default {
      * @returns
      */ //并在答案末尾处必须给出答案内容中的关键词
     generateQuestionsFromContent(content, count = 1, everyContentLength = SECTION_LENGTH, axiosOption = {}) {
+        var _a;
         return __awaiter(this, void 0, void 0, function* () {
             let arrContent = this.splitLongText(content, everyContentLength || SECTION_LENGTH);
+            ///如果最后一段的文字内容过短，则把最后一段内容追加到前一段中，并删除最后一段
+            let totalLen = arrContent.length;
+            if (totalLen >= 2 && (((_a = arrContent[totalLen - 1]) === null || _a === void 0 ? void 0 : _a.length) || 0) < 100) {
+                arrContent[totalLen - 2] += arrContent[totalLen - 1];
+                arrContent.splice(totalLen - 1, 1);
+            }
             ///没20句话分为一组，适应大文件内容多次请求组合结果
             ///每一句话需要产生的题目
             let questions4EverySentense = count / arrContent.length; //Math.ceil(arrContent.length / 20);
@@ -384,19 +406,18 @@ class OpenAIGpt extends gptbase_1.default {
                 let itemCount = Math.min(Math.ceil(questions4EverySentense), count - gotted);
                 let subarray = [
                     { role: 'system', content: FAQ_ROLE_DEFINE },
-                    { role: 'user', content: `从以下内容中提取${itemCount}条提问及答案，并从答案内容提取出至少2个关键词，最终结果按照[{"question":"提问内容","answer":"答案内容","keywords":["关键词1","关键词2"]}]的JSON数组结构输出。` },
-                    { role: 'user', content: arrContent.slice(0, 1)[0]
-                    }
+                    { role: 'user', content: `从以下内容中提取${itemCount}条提问及答案，并从答案内容提取出至少2个关键词，最终结果按照[{"question":"提问内容","answer":"答案内容","keywords":["关键词1","关键词2"]}]的JSON数组结构输出。如果内容不足以提取问题和答案，请直接输出JSON空数组 []。` },
+                    { role: 'user', content: arrContent.slice(0, 1)[0] }
                 ];
-                //subarray.push({ role: 'user', content:'请根据上述内容,给出一道提问与答案以及答案关键词，按照先问题内容，再标准答案，再关键词的顺序输出,关键词之间用、分开'})
-                //subarray.unshift({ role: 'system', content: `你是一位专业培训师,从以下内容中提取${itemCount}条提问及答案，并从答案内容提取出至少2个关键词，最终结果按照[{"question":"提问内容","answer":"答案内容","keywords":["关键词1","关键词2"]}]的JSON数组结构输出。` })
-                // subarray.unshift({role: 'system', content: FAQ_ROLE_DEFINE});
-                //subarray.unshift({ role: 'system', content: `你是一位专业程序开发工程师,根据以下内容,按照[{"question":"问题内容","answer":"答案内容","keywords":["关键词1","关键词2"]}]JSON数组结构,给出${itemCount}条提问问题及答案以及答案关键词` })
-                // console.log('subarray', subarray)
+                console.log('Faq Question Pick Prompt:', subarray);
                 let result = yield this.chatRequest(subarray, { replyCounts: 1 }, axiosOption);
+                ///如果请求发生了网络错误(不是内容合规问题），则再重试一次，如果任然有错则放弃
+                if (!result.successed && result.error != 'content_filter') {
+                    console.log('network error,retry onemore time');
+                    result = yield this.chatRequest(subarray, { replyCounts: 1 }, axiosOption);
+                }
                 if (result.successed && result.message) {
-                    // console.log('result is ', result.message[0].message.content)
-                    let msgs = this.pickUpFaqContent(result.message);
+                    let msgs = yield this.pickUpFaqContent(result.message);
                     if (msgs.length) {
                         ///对外发送检出问答题的信号
                         this.emit('parseout', { type: 'qa', items: msgs });
@@ -420,32 +441,49 @@ class OpenAIGpt extends gptbase_1.default {
      */
     pickUpFaqContent(messages) {
         var _a, _b;
-        if (!((_b = (_a = messages[0]) === null || _a === void 0 ? void 0 : _a.message) === null || _b === void 0 ? void 0 : _b.content))
-            return [];
-        let answerString = messages[0].message.content.trim().replace(/\t|\n|\v|\r|\f/g, '');
-        let jsonObj = this.fixedJsonString(answerString);
-        if (!jsonObj.length)
-            return [];
-        try {
-            //let jsonObj = JSON.parse(answerString);
-            //let jsonObj = eval(answerString);
-            jsonObj.map((item) => {
-                let realKeyword = [];
-                let keywords = (item.keywords + '').split(',');
-                let answer = item.answer || '';
-                for (const k of keywords) {
-                    if (k && answer.indexOf(k) >= 0)
-                        realKeyword.push(k);
+        return __awaiter(this, void 0, void 0, function* () {
+            if (!((_b = (_a = messages[0]) === null || _a === void 0 ? void 0 : _a.message) === null || _b === void 0 ? void 0 : _b.content))
+                return [];
+            let answerString = messages[0].message.content.trim().replace(/\t|\n|\v|\r|\f/g, '');
+            if (answerString === '[]')
+                return [];
+            let jsonObj = this.fixedJsonString(answerString);
+            if (!jsonObj.length) {
+                let fixedAsk = [
+                    { role: 'system', content: '角色扮演：假设你是一位高级JSON数据分析师' },
+                    { role: 'user', content: `请分析以下内容，严格按照[{"question":"提问内容","answer":"答案内容","keywords":["关键词1","关键词2"]}]的标准JSON数组结构输出。如果内容不足以提取问题和答案，请直接输出JSON空数组，无需提供参考。` },
+                    { role: 'user', content: answerString },
+                ];
+                console.log('pickUpFaqContent fixedAsk', fixedAsk);
+                let fixedJsonResult = yield this.chatRequest(fixedAsk, { replyCounts: 1 }, {});
+                if (fixedJsonResult.successed) {
+                    answerString = fixedJsonResult.message[0].message.content.trim().replace(/\t|\n|\v|\r|\f/g, '');
+                    jsonObj = this.fixedJsonString(answerString);
                 }
-                item.keywords = realKeyword;
-                return item;
-            });
-            return jsonObj;
-        }
-        catch (err) {
-            console.log('JSON error', err);
-            return [];
-        }
+                if (!jsonObj.length)
+                    return [];
+            }
+            try {
+                //let jsonObj = JSON.parse(answerString);
+                //let jsonObj = eval(answerString);
+                jsonObj.map((item) => {
+                    let realKeyword = [];
+                    let keywords = (item.keywords + '').split(',');
+                    let answer = item.answer || '';
+                    for (const k of keywords) {
+                        if (k && answer.indexOf(k) >= 0)
+                            realKeyword.push(k);
+                    }
+                    item.keywords = realKeyword;
+                    return item;
+                });
+                return jsonObj;
+            }
+            catch (err) {
+                console.log('JSON error', err);
+                return [];
+            }
+        });
     }
     /**
      * 从指定的文本内容中生成一张试卷
@@ -457,28 +495,34 @@ class OpenAIGpt extends gptbase_1.default {
      * @returns
      */ //并在答案末尾处必须给出答案内容中的关键词
     generateExaminationPaperFromContent(content, paperOption = {}, everyContentLength = SECTION_LENGTH, axiosOption = {}) {
-        var _a, _b, _c, _d, _e, _f, _g, _h, _j, _k, _l, _m;
+        var _a, _b, _c, _d, _e, _f, _g, _h, _j, _k, _l, _m, _o;
         return __awaiter(this, void 0, void 0, function* () {
             let arrContent = this.splitLongText(content, everyContentLength || SECTION_LENGTH);
+            ///如果最后一段的文字内容过短，则把最后一段内容追加到前一段中，并删除最后一段
+            let totalLen = arrContent.length;
+            if (totalLen >= 2 && (((_a = arrContent[totalLen - 1]) === null || _a === void 0 ? void 0 : _a.length) || 0) < 100) {
+                arrContent[totalLen - 2] += arrContent[totalLen - 1];
+                arrContent.splice(totalLen - 1, 1);
+            }
             let sectionCount = {
-                singlechoice: (((_a = paperOption.singlechoice) === null || _a === void 0 ? void 0 : _a.count) || 0) / arrContent.length,
-                multiplechoice: (((_b = paperOption.multiplechoice) === null || _b === void 0 ? void 0 : _b.count) || 0) / arrContent.length,
-                trueorfalse: (((_c = paperOption.trueorfalse) === null || _c === void 0 ? void 0 : _c.count) || 0) / arrContent.length,
-                completion: (((_d = paperOption.completion) === null || _d === void 0 ? void 0 : _d.count) || 0) / arrContent.length
+                singlechoice: (((_b = paperOption.singlechoice) === null || _b === void 0 ? void 0 : _b.count) || 0) / arrContent.length,
+                multiplechoice: (((_c = paperOption.multiplechoice) === null || _c === void 0 ? void 0 : _c.count) || 0) / arrContent.length,
+                trueorfalse: (((_d = paperOption.trueorfalse) === null || _d === void 0 ? void 0 : _d.count) || 0) / arrContent.length,
+                completion: (((_e = paperOption.completion) === null || _e === void 0 ? void 0 : _e.count) || 0) / arrContent.length
             };
             ///剩余待生成的题目数量
             let remainCount = {
-                singlechoice: ((_e = paperOption.singlechoice) === null || _e === void 0 ? void 0 : _e.count) || 0,
-                multiplechoice: ((_f = paperOption.multiplechoice) === null || _f === void 0 ? void 0 : _f.count) || 0,
-                trueorfalse: ((_g = paperOption.trueorfalse) === null || _g === void 0 ? void 0 : _g.count) || 0,
-                completion: ((_h = paperOption.completion) === null || _h === void 0 ? void 0 : _h.count) || 0
+                singlechoice: ((_f = paperOption.singlechoice) === null || _f === void 0 ? void 0 : _f.count) || 0,
+                multiplechoice: ((_g = paperOption.multiplechoice) === null || _g === void 0 ? void 0 : _g.count) || 0,
+                trueorfalse: ((_h = paperOption.trueorfalse) === null || _h === void 0 ? void 0 : _h.count) || 0,
+                completion: ((_j = paperOption.completion) === null || _j === void 0 ? void 0 : _j.count) || 0
             };
             ///每种类型的题目的分数
             let ITEM_SCORE = {
-                singlechoice: ((_j = paperOption.singlechoice) === null || _j === void 0 ? void 0 : _j.score) || 0,
-                multiplechoice: ((_k = paperOption.multiplechoice) === null || _k === void 0 ? void 0 : _k.score) || 0,
-                trueorfalse: ((_l = paperOption.trueorfalse) === null || _l === void 0 ? void 0 : _l.score) || 0,
-                completion: ((_m = paperOption.completion) === null || _m === void 0 ? void 0 : _m.score) || 0
+                singlechoice: ((_k = paperOption.singlechoice) === null || _k === void 0 ? void 0 : _k.score) || 0,
+                multiplechoice: ((_l = paperOption.multiplechoice) === null || _l === void 0 ? void 0 : _l.score) || 0,
+                trueorfalse: ((_m = paperOption.trueorfalse) === null || _m === void 0 ? void 0 : _m.score) || 0,
+                completion: ((_o = paperOption.completion) === null || _o === void 0 ? void 0 : _o.score) || 0
             };
             ///最后生成出来的结果
             let paperReturned = {
@@ -489,7 +533,6 @@ class OpenAIGpt extends gptbase_1.default {
                 /**
                  * 每种类型的题目进行遍历
                  */
-                console.log('arrContent.length', arrContent.length);
                 noMoreQuestionRetrive = true;
                 for (const key of QUESTION_TYPE) {
                     ///还需要抓取题目
@@ -505,10 +548,15 @@ class OpenAIGpt extends gptbase_1.default {
                         // subarray.unshift()
                         console.log('subarray', subarray);
                         let result = yield this.chatRequest(subarray, { replyCounts: 1 }, axiosOption);
+                        ///如果请求发生了网络错误(不是内容合规问题），则再重试一次，如果任然有错则放弃
+                        if (!result.successed && result.error != 'content_filter') {
+                            console.log('network error,retry onemore time');
+                            result = yield this.chatRequest(subarray, { replyCounts: 1 }, axiosOption);
+                        }
                         console.log('subarray returned', result.successed);
                         if (result.successed && result.message) {
                             //console.log('paper result', key, result.message.length)
-                            let pickedQuestions = this.pickUpQuestions(result.message, itemCount, key, ITEM_SCORE[key]);
+                            let pickedQuestions = yield this.pickUpQuestions(result.message, itemCount, key, ITEM_SCORE[key]);
                             if (pickedQuestions.length) {
                                 ///对外发送检出题目的信号
                                 this.emit('parseout', { type: 'question', name: key, items: pickedQuestions });
@@ -537,76 +585,97 @@ class OpenAIGpt extends gptbase_1.default {
      */
     pickUpQuestions(result, count, questiontype, score = 1) {
         var _a, _b;
-        if (!((_b = (_a = result[0]) === null || _a === void 0 ? void 0 : _a.message) === null || _b === void 0 ? void 0 : _b.content))
-            return [];
-        let answerString = result[0].message.content.trim().replace(/\t|\n|\v|\r|\f/g, '');
-        let jsonObj = this.fixedJsonString(answerString);
-        if (!jsonObj.length)
-            return [];
-        let returnItems = [];
-        try {
-            // let jsonObj = JSON.parse(answerString);
-            returnItems = jsonObj.map((questionitem) => {
-                console.log('answer item from jsonObj', questionitem);
-                if (questionitem.choice && Array.isArray(questionitem.choice) && questiontype != 'completion') {
-                    questionitem.fullanswer = (questionitem.answer + '').replace(/,|[^ABCDE]/g, '');
-                    questionitem.score = score;
-                    if (questionitem.choice) {
-                        questionitem.choice = questionitem.choice.map((item, index) => {
-                            let seqNo = 'ABCDEFG'[index]; //String.fromCharCode(65 + index);
-                            let correctReg = new RegExp(`${seqNo}.|${seqNo}`, 'ig');
-                            // console.log('itemitemitem', item)
-                            //let answer = jsonObj.fullanswer
-                            return {
-                                id: seqNo,
-                                content: (item + '').replace(correctReg, '').trim(),
-                                iscorrect: (questionitem.fullanswer || '').indexOf(seqNo) >= 0 ? 1 : 0
-                                //|| jsonObj.fullanswer.indexOf(m))
-                            };
-                        });
+        return __awaiter(this, void 0, void 0, function* () {
+            if (!((_b = (_a = result[0]) === null || _a === void 0 ? void 0 : _a.message) === null || _b === void 0 ? void 0 : _b.content))
+                return [];
+            let answerString = result[0].message.content.trim().replace(/\t|\n|\v|\r|\f/g, '');
+            if (answerString === '[]')
+                return [];
+            let jsonObj = this.fixedJsonString(answerString);
+            ////修复的结果无法用程序修复，请求GPT来分析修复一下这个结果
+            if (!jsonObj.length) {
+                let fixedAsk = [
+                    { role: 'system', content: '角色扮演：假设你是一位高级JSON数据分析师' },
+                    { role: 'user', content: `请分析以下内容，严格按照${QUESTION_PROMPT_FIXED[questiontype]}的标准JSON数组结构输出。如果内容不足以提取问题和答案，请直接输出JSON空数组，无需提供参考。` },
+                    { role: 'user', content: answerString },
+                ];
+                console.log('fixedAsk', fixedAsk);
+                let fixedJsonResult = yield this.chatRequest(fixedAsk, { replyCounts: 1 }, {});
+                if (fixedJsonResult.successed) {
+                    answerString = fixedJsonResult.message[0].message.content.trim().replace(/\t|\n|\v|\r|\f/g, '');
+                    jsonObj = this.fixedJsonString(answerString);
+                }
+                if (!jsonObj.length)
+                    return [];
+            }
+            let returnItems = [];
+            try {
+                // let jsonObj = JSON.parse(answerString);
+                returnItems = jsonObj.map((questionitem) => {
+                    console.log('answer item from jsonObj', questionitem);
+                    if (questionitem.choice && Array.isArray(questionitem.choice) && questiontype != 'completion') {
+                        questionitem.fullanswer = (questionitem.answer + '').replace(/,|[^ABCDE]/g, '');
+                        questionitem.score = score;
+                        if (questionitem.choice) {
+                            questionitem.choice = questionitem.choice.map((item, index) => {
+                                let seqNo = 'ABCDEFG'[index]; //String.fromCharCode(65 + index);
+                                let correctReg = new RegExp(`${seqNo}.|${seqNo}`, 'ig');
+                                // console.log('itemitemitem', item)
+                                //let answer = jsonObj.fullanswer
+                                return {
+                                    id: seqNo,
+                                    content: (item + '').replace(correctReg, '').trim(),
+                                    iscorrect: (questionitem.fullanswer || '').indexOf(seqNo) >= 0 ? 1 : 0
+                                    //|| jsonObj.fullanswer.indexOf(m))
+                                };
+                            });
+                        }
+                        ///如果是非判断题，题目的选项数量小于2 ，则无效
+                        ///如果是判断题，题目的选项必须=2
+                        if (!questionitem.choice || (questiontype != 'trueorfalse' && questionitem.choice.length < 3) || (questiontype == 'trueorfalse' && questionitem.choice.length != 2)) {
+                            return null;
+                        }
                     }
-                    ///如果是非判断题，题目的选项数量小于2 ，则无效
-                    ///如果是判断题，题目的选项必须=2
-                    if (!questionitem.choice || (questiontype != 'trueorfalse' && questionitem.choice.length < 3) || (questiontype == 'trueorfalse' && questionitem.choice.length != 2)) {
-                        return null;
+                    switch (questiontype) {
+                        case 'singlechoice':
+                            questionitem.answer = (questionitem.answer + '').replace(/,|[^ABCDEFG]/g, '').split('').slice(0, 1);
+                            break;
+                        case 'multiplechoice':
+                            questionitem.answer = Array.from(new Set((questionitem.answer + '').replace(/,|[^ABCDEFG]/g, '').split('')));
+                            break;
+                        case 'trueorfalse':
+                            let rightItem = questionitem.choice.find((x) => { return x.iscorrect == 1; });
+                            questionitem.answer = [(rightItem === null || rightItem === void 0 ? void 0 : rightItem.id) || 'Z']; //[(questionitem.answer + '').indexOf('正确') >= 0 ? 'A' : 'B']
+                            break;
                     }
-                }
-                switch (questiontype) {
-                    case 'singlechoice':
-                        questionitem.answer = (questionitem.answer + '').replace(/,|[^ABCDEFG]/g, '').split('').slice(0, 1);
-                        break;
-                    case 'multiplechoice':
-                        questionitem.answer = (questionitem.answer + '').replace(/,|[^ABCDEFG]/g, '').split('');
-                        break;
-                    case 'trueorfalse':
-                        let rightItem = questionitem.choice.find((x) => { return x.iscorrect == 1; });
-                        questionitem.answer = [(rightItem === null || rightItem === void 0 ? void 0 : rightItem.id) || 'Z']; //[(questionitem.answer + '').indexOf('正确') >= 0 ? 'A' : 'B']
-                        break;
-                }
-                ///单选题验证
-                if (questiontype == 'singlechoice') {
-                    let rightAnswer = questionitem.choice ? questionitem.choice.filter((item) => { return item.iscorrect === 1; }) : [];
-                    ///单选题的正确选项大于了1个
-                    if (rightAnswer.length != 1 || !questionitem.answer || questionitem.answer.length !== 1)
-                        return null;
-                    ///正确选项和答案不一致
-                    if (rightAnswer[0].id.toUpperCase() != (questionitem.answer[0] || '').toUpperCase())
-                        return null;
-                }
-                ///多选题验证
-                if (questiontype == 'multiplechoice') {
-                    let rightAnswer = questionitem.choice ? questionitem.choice.filter((item) => { return item.iscorrect === 1; }) : [];
-                    ///单选题的正确选项大于了1个
-                    if (rightAnswer.length === 0 || !questionitem.answer || questionitem.answer.length === 0)
+                    ///单选题验证
+                    if (questiontype == 'singlechoice') {
+                        let rightAnswer = questionitem.choice ? questionitem.choice.filter((item) => { return item.iscorrect === 1; }) : [];
+                        ///单选题的正确选项大于了1个
+                        if (rightAnswer.length != 1 || !questionitem.answer || questionitem.answer.length !== 1)
+                            return null;
+                        ///正确选项和答案不一致
+                        if (rightAnswer[0].id.toUpperCase() != (questionitem.answer[0] || '').toUpperCase())
+                            return null;
+                    }
+                    ///多选题验证
+                    if (questiontype == 'multiplechoice') {
+                        let rightAnswer = questionitem.choice ? questionitem.choice.filter((item) => { return item.iscorrect === 1; }) : [];
+                        ///单选题的正确选项大于了1个
+                        if (rightAnswer.length === 0 || !questionitem.answer || questionitem.answer.length === 0)
+                            return null;
+                    }
+                    ///判断题验证:防止没有答案的
+                    if (questiontype == 'trueorfalse' && !questionitem.answer.length)
                         return null;
-                }
-                return questionitem;
-            });
-        }
-        catch (err) {
-            console.log('error happened:', err);
-        }
-        return returnItems.filter(i => { return i != null; }).slice(0, count);
+                    return questionitem;
+                });
+            }
+            catch (err) {
+                console.log('error happened:', err);
+            }
+            return returnItems.filter(i => { return i != null; }).slice(0, count);
+        });
     }
     /**
      * 验证JSON字符串是否是真正可转换为JSON的合法格式

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "doomiaichat",
-  "version": "4.7.0",
+  "version": "4.9.0",
   "description": "Doomisoft OpenAI",
   "main": "dist/index.js",
   "scripts": {

package/src/openai.ts CHANGED Viewed

@@ -52,10 +52,20 @@ const QUESTION_ROLE_DEFINE: any = {
  * 问题生成的Prompt
  */
 const QUESTION_PROMPT: any ={
-    singlechoice:'根据以下内容,生成@ITEMCOUNT@道单选题,每道题目4个选项,每道题的选项中的元素用大写字母ABCD开头,每道题一个正确答案,输出结果必须是JSON数组并按照[{"question":"","choice":[],"answer":[]}]的结构输出',
-    multiplechoice: '根据以下内容,请生成@ITEMCOUNT@道多选题,提供4个选项,每道题的选项中的元素用大写字母ABCD开头,每道题的答案至少有两个选项,输出结果必须是JSON数组并按照[{"question":"","choice":[],"answer":[]}]的结构输出',
-    trueorfalse: '根据以下内容,请生成@ITEMCOUNT@道判断题,每道题正确和错误两个选项，输出结果必须是JSON数组并按照[{"question":"","choice":["A.正确","B.错误"],"answer":[]}]的结构输出',
-    completion: '根据以下内容,请生成@ITEMCOUNT@道填空题和对应答案,输出结果必须是JSON数组并按照[{"question":"","answer":["填空答案1","填空答案2"]}]的结构输出'
+    singlechoice:'根据以下内容,生成@ITEMCOUNT@道单选题,每道题目4个选项,每道题的选项中的元素用大写字母ABCD开头,每道题一个正确答案,输出结果必须是JSON数组并按照[{"question":"","choice":[],"answer":[]}]的结构输出。如果内容不足以提取问题和答案，请直接输出JSON空数组。',
+    multiplechoice: '根据以下内容,请生成@ITEMCOUNT@道多选题,提供4个选项,每道题的选项中的元素用大写字母ABCD开头,每道题的答案至少有两个选项,输出结果必须是JSON数组并按照[{"question":"","choice":[],"answer":[]}]的结构输出。如果内容不足以提取问题和答案，请直接输出JSON空数组。',
+    trueorfalse: '根据以下内容,请生成@ITEMCOUNT@道判断题,每道题正确和错误两个选项，输出结果必须是JSON数组并按照[{"question":"","choice":["A.正确","B.错误"],"answer":[]}]的结构输出。如果内容不足以提取问题和答案，请直接输出JSON空数组。',
+    completion: '根据以下内容,请生成@ITEMCOUNT@道填空题和对应答案,输出结果必须是JSON数组并按照[{"question":"","answer":["填空答案1","填空答案2"]}]的结构输出。如果内容不足以提取问题和答案，请直接输出JSON空数组。'
+}
+/**
+ * 问题生成的Prompt
+ */
+const QUESTION_PROMPT_FIXED: any = {
+    singlechoice: '[{"question":"","choice":[],"answer":[]}]',
+    multiplechoice: '[{"question":"","choice":[],"answer":[]}]',
+    trueorfalse: '[{"question":"","choice":["A.正确","B.错误"],"answer":[]}]',
+    completion: '[{"question":"","answer":["填空答案1","填空答案2"]}]'
 }
 const QUESTION_TYPE: string[] = ['singlechoice', 'multiplechoice', 'trueorfalse', 'completion']
@@ -129,6 +139,12 @@ export default class OpenAIGpt extends GptBase {
                 max_tokens: Number(callChatOption?.maxtoken || this.maxtoken),
                 n: Number(callChatOption?.replyCounts || 1) || 1
             }, axiosOption);
+            // console.log('finish_reason==>', response.data.choices)
+            ////输出的内容不合规
+            if (response.data.choices[0].finish_reason ==='content_filter') {
+                console.log('content_filter')
+                return { successed: false, error:'content_filter'}
+            }
             return { successed: true, message: response.data.choices, usage: response.data.usage };
         } catch (error) {
             console.log('result is error ', error)
@@ -342,6 +358,12 @@ export default class OpenAIGpt extends GptBase {
      *///并在答案末尾处必须给出答案内容中的关键词
     override async generateQuestionsFromContent(content: string, count: number = 1, everyContentLength: number = SECTION_LENGTH, axiosOption: any = {}): Promise<ChatReponse> {
         let arrContent = this.splitLongText(content, everyContentLength || SECTION_LENGTH);
+        ///如果最后一段的文字内容过短，则把最后一段内容追加到前一段中，并删除最后一段
+        let totalLen = arrContent.length;
+        if (totalLen>=2 && (arrContent[totalLen-1]?.length||0)<100){
+            arrContent[totalLen - 2] +=  arrContent[totalLen - 1];
+            arrContent.splice(totalLen-1,1);
+        }
         ///没20句话分为一组，适应大文件内容多次请求组合结果
         ///每一句话需要产生的题目
         let questions4EverySentense: number = count / arrContent.length; //Math.ceil(arrContent.length / 20);
@@ -352,28 +374,25 @@ export default class OpenAIGpt extends GptBase {
             let itemCount = Math.min(Math.ceil(questions4EverySentense), count - gotted);
             let subarray = [
                 { role: 'system', content: FAQ_ROLE_DEFINE },
-                { role: 'user', content: `从以下内容中提取${itemCount}条提问及答案，并从答案内容提取出至少2个关键词，最终结果按照[{"question":"提问内容","answer":"答案内容","keywords":["关键词1","关键词2"]}]的JSON数组结构输出。`},
-                { role: 'user', content: arrContent.slice(0, 1)[0]
-            }
-                            ]
-            //subarray.push({ role: 'user', content:'请根据上述内容,给出一道提问与答案以及答案关键词，按照先问题内容，再标准答案，再关键词的顺序输出,关键词之间用、分开'})
-            //subarray.unshift({ role: 'system', content: `你是一位专业培训师,从以下内容中提取${itemCount}条提问及答案，并从答案内容提取出至少2个关键词，最终结果按照[{"question":"提问内容","answer":"答案内容","keywords":["关键词1","关键词2"]}]的JSON数组结构输出。` })
-            // subarray.unshift({role: 'system', content: FAQ_ROLE_DEFINE});
-            //subarray.unshift({ role: 'system', content: `你是一位专业程序开发工程师,根据以下内容,按照[{"question":"问题内容","answer":"答案内容","keywords":["关键词1","关键词2"]}]JSON数组结构,给出${itemCount}条提问问题及答案以及答案关键词` })
-            // console.log('subarray', subarray)
+                { role: 'user', content: `从以下内容中提取${itemCount}条提问及答案，并从答案内容提取出至少2个关键词，最终结果按照[{"question":"提问内容","answer":"答案内容","keywords":["关键词1","关键词2"]}]的JSON数组结构输出。如果内容不足以提取问题和答案，请直接输出JSON空数组 []。`},
+                { role: 'user', content: arrContent.slice(0, 1)[0]}
+            ]
+            console.log('Faq Question Pick Prompt:', subarray)
             let result = await this.chatRequest(subarray, { replyCounts: 1 }, axiosOption);
+            ///如果请求发生了网络错误(不是内容合规问题），则再重试一次，如果任然有错则放弃
+            if (!result.successed && result.error!='content_filter'){
+                console.log('network error,retry onemore time')
+                result = await this.chatRequest(subarray, { replyCounts: 1 }, axiosOption);
+            }
             if (result.successed && result.message) {
-                // console.log('result is ', result.message[0].message.content)
-                let msgs = this.pickUpFaqContent(result.message);
+                let msgs = await this.pickUpFaqContent(result.message);
                 if (msgs.length) {
                     ///对外发送检出问答题的信号
                     this.emit('parseout', { type: 'qa', items: msgs })
                     gotted += msgs.length; //result.message.length;
                     faqs = faqs.concat(msgs);
                 }
             }
             ////删除已经处理的文本
             arrContent.splice(0, 1);
         }
@@ -388,11 +407,27 @@ export default class OpenAIGpt extends GptBase {
      * @param {*} messages
      * @returns
      */
-    protected pickUpFaqContent(messages: Array<any>): Array<FaqItem> {
+    protected async pickUpFaqContent(messages: Array<any>): Promise<Array<FaqItem>> {
         if (!messages[0]?.message?.content) return [];
         let answerString = messages[0].message.content.trim().replace(/\t|\n|\v|\r|\f/g, '');
+        if (answerString==='[]') return [];
         let jsonObj = this.fixedJsonString(answerString);
-        if (!jsonObj.length) return []
+        if (!jsonObj.length){
+            let fixedAsk = [
+                { role: 'system', content: '角色扮演：假设你是一位高级JSON数据分析师' },
+                { role: 'user', content: `请分析以下内容，严格按照[{"question":"提问内容","answer":"答案内容","keywords":["关键词1","关键词2"]}]的标准JSON数组结构输出。如果内容不足以提取问题和答案，请直接输出JSON空数组，无需提供参考。` },
+                { role: 'user', content: answerString },
+            ]
+            console.log('pickUpFaqContent fixedAsk', fixedAsk)
+            let fixedJsonResult: any = await this.chatRequest(fixedAsk, { replyCounts: 1 }, {})
+            if (fixedJsonResult.successed) {
+                answerString = fixedJsonResult.message[0].message.content.trim().replace(/\t|\n|\v|\r|\f/g, '');
+                jsonObj = this.fixedJsonString(answerString);
+            }
+            if (!jsonObj.length) return []
+        }
         try {
             //let jsonObj = JSON.parse(answerString);
             //let jsonObj = eval(answerString);
@@ -424,6 +459,12 @@ export default class OpenAIGpt extends GptBase {
      *///并在答案末尾处必须给出答案内容中的关键词
     override async generateExaminationPaperFromContent(content: string, paperOption: any = {}, everyContentLength: number = SECTION_LENGTH, axiosOption: any = {}): Promise<ExaminationPaperResult> {
         let arrContent = this.splitLongText(content, everyContentLength || SECTION_LENGTH);
+        ///如果最后一段的文字内容过短，则把最后一段内容追加到前一段中，并删除最后一段
+        let totalLen = arrContent.length;
+        if (totalLen >= 2 && (arrContent[totalLen - 1]?.length || 0) < 100) {
+            arrContent[totalLen - 2] += arrContent[totalLen - 1];
+            arrContent.splice(totalLen - 1, 1);
+        }
         let sectionCount: any = {
             singlechoice: (paperOption.singlechoice?.count || 0) / arrContent.length,
             multiplechoice: (paperOption.multiplechoice?.count || 0) / arrContent.length,
@@ -455,7 +496,6 @@ export default class OpenAIGpt extends GptBase {
             /**
              * 每种类型的题目进行遍历
              */
-            console.log('arrContent.length', arrContent.length)
             noMoreQuestionRetrive = true;
             for (const key of QUESTION_TYPE) {
                 ///还需要抓取题目
@@ -472,10 +512,15 @@ export default class OpenAIGpt extends GptBase {
                     // subarray.unshift()
                     console.log('subarray', subarray)
                     let result = await this.chatRequest(subarray, { replyCounts: 1 }, axiosOption);
+                    ///如果请求发生了网络错误(不是内容合规问题），则再重试一次，如果任然有错则放弃
+                    if (!result.successed && result.error != 'content_filter') {
+                        console.log('network error,retry onemore time')
+                        result = await this.chatRequest(subarray, { replyCounts: 1 }, axiosOption);
+                    }
                     console.log('subarray returned', result.successed)
                     if (result.successed && result.message) {
                         //console.log('paper result', key, result.message.length)
-                        let pickedQuestions = this.pickUpQuestions(result.message, itemCount, key, ITEM_SCORE[key]);
+                        let pickedQuestions = await this.pickUpQuestions(result.message, itemCount, key, ITEM_SCORE[key]);
                         if (pickedQuestions.length) {
                             ///对外发送检出题目的信号
                             this.emit('parseout', { type: 'question', name: key, items: pickedQuestions })
@@ -502,11 +547,26 @@ export default class OpenAIGpt extends GptBase {
      * @param {*} result
      *
      */
-    protected pickUpQuestions(result: Array<any>, count: number, questiontype: string, score: number = 1): Array<QuestionItem> {
+    protected async pickUpQuestions(result: Array<any>, count: number, questiontype: string, score: number = 1): Promise<Array<QuestionItem>> {
         if (!result[0]?.message?.content) return [];
         let answerString = result[0].message.content.trim().replace(/\t|\n|\v|\r|\f/g, '');
+        if (answerString === '[]') return [];
         let jsonObj = this.fixedJsonString(answerString);
-        if (!jsonObj.length) return []
+        ////修复的结果无法用程序修复，请求GPT来分析修复一下这个结果
+        if (!jsonObj.length){
+            let fixedAsk = [
+                {role:'system',content:'角色扮演：假设你是一位高级JSON数据分析师'},
+                { role: 'user', content: `请分析以下内容，严格按照${QUESTION_PROMPT_FIXED[questiontype]}的标准JSON数组结构输出。如果内容不足以提取问题和答案，请直接输出JSON空数组，无需提供参考。` },
+                { role: 'user', content: answerString },
+            ]
+            console.log('fixedAsk', fixedAsk)
+            let fixedJsonResult:any  =await this.chatRequest(fixedAsk,{replyCounts:1},{})
+            if (fixedJsonResult.successed){
+                answerString = fixedJsonResult.message[0].message.content.trim().replace(/\t|\n|\v|\r|\f/g, '');
+                jsonObj = this.fixedJsonString(answerString);
+            }
+            if (!jsonObj.length) return []
+        }
         let returnItems: QuestionItem[] = [];
         try {
             // let jsonObj = JSON.parse(answerString);
@@ -541,7 +601,7 @@ export default class OpenAIGpt extends GptBase {
                         questionitem.answer = (questionitem.answer + '').replace(/,|[^ABCDEFG]/g, '').split('').slice(0, 1);
                         break;
                     case 'multiplechoice':
-                        questionitem.answer = (questionitem.answer + '').replace(/,|[^ABCDEFG]/g, '').split('');
+                        questionitem.answer =Array.from(new Set((questionitem.answer + '').replace(/,|[^ABCDEFG]/g, '').split('')));
                         break;
                     case 'trueorfalse':
                         let rightItem = questionitem.choice.find((x: any) => { return x.iscorrect == 1 });
@@ -562,6 +622,8 @@ export default class OpenAIGpt extends GptBase {
                     ///单选题的正确选项大于了1个
                     if (rightAnswer.length === 0 || !questionitem.answer || questionitem.answer.length === 0) return null;
                 }
+                ///判断题验证:防止没有答案的
+                if (questiontype == 'trueorfalse' && !questionitem.answer.length )  return null;
                 return questionitem;
             })