npm - cspell-lib - Versions diffs - 8.13.2 → 8.13.3 - Mend

cspell-lib 8.13.2 → 8.13.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (11) hide show

package/dist/lib/index.d.ts +1 -1
package/dist/lib/index.js +1 -1
package/dist/lib/textValidation/lineValidatorFactory.js +41 -6
package/dist/lib/util/text.d.ts +6 -1
package/dist/lib/util/text.js +14 -2
package/dist/lib/util/textApi.d.ts +2 -0
package/dist/lib/util/textApi.js +2 -0
package/dist/lib/util/textRegex.d.ts +2 -1
package/dist/lib/util/textRegex.js +3 -2
package/dist/lib/util/wordSplitter.js +2 -2
package/package.json +16 -16

package/dist/lib/index.d.ts CHANGED Viewed

@@ -25,7 +25,7 @@ export type { TraceOptions, TraceResult, TraceWordResult } from './trace.js';
 export { traceWords, traceWordsAsync } from './trace.js';
 export { getLogger, Logger, setLogger } from './util/logger.js';
 export { resolveFile } from './util/resolveFile.js';
-export * as Text from './util/text.js';
+export * as Text from './util/textApi.js';
 export { checkText, checkTextDocument, CheckTextInfo, IncludeExcludeFlag, IncludeExcludeOptions, TextInfoItem, validateText, ValidationIssue, } from './validator.js';
 export * from '@cspell/cspell-types';
 export { asyncIterableToArray, readFileText as readFile, readFileTextSync as readFileSync, writeToFile, writeToFileIterable, writeToFileIterableP, } from 'cspell-io';

package/dist/lib/index.js CHANGED Viewed

@@ -18,7 +18,7 @@ export { DocumentValidator, shouldCheckDocument } from './textValidation/index.j
 export { traceWords, traceWordsAsync } from './trace.js';
 export { getLogger, setLogger } from './util/logger.js';
 export { resolveFile } from './util/resolveFile.js';
-export * as Text from './util/text.js';
+export * as Text from './util/textApi.js';
 export { checkText, checkTextDocument, IncludeExcludeFlag, validateText, } from './validator.js';
 export * from '@cspell/cspell-types';
 export { asyncIterableToArray, readFileText as readFile, readFileTextSync as readFileSync, writeToFile, writeToFileIterable, writeToFileIterableP, } from 'cspell-io';

package/dist/lib/textValidation/lineValidatorFactory.js CHANGED Viewed

@@ -2,7 +2,8 @@ import assert from 'node:assert';
 import { opConcatMap, opFilter, pipe } from '@cspell/cspell-pipe/sync';
 import { createCachingDictionary } from 'cspell-dictionary';
 import * as RxPat from '../Settings/RegExpPatterns.js';
-import { extractPossibleWordsFromTextOffset, extractText, extractWordsFromCodeTextOffset, extractWordsFromTextOffset, } from '../util/text.js';
+import { extractPossibleWordsFromTextOffset, extractText, extractWordsFromTextOffset, splitWordWithOffset, } from '../util/text.js';
+import { regExpCamelCaseWordBreaksWithEnglishSuffix } from '../util/textRegex.js';
 import { split } from '../util/wordSplitter.js';
 import { defaultMinWordLength } from './defaultConstants.js';
 import { isWordValidWithEscapeRetry } from './isWordValid.js';
@@ -149,8 +150,46 @@ export function lineValidatorFactory(sDict, options) {
             // English exceptions :-(
             if (isAllCapsWithTrailingCommonEnglishSuffixOk(vr))
                 return [];
+            if (isWordIgnored(vr.text) || checkWord(vr).isFound) {
+                rememberFilter((_) => false)(vr);
+                return [];
+            }
+            if (vr.isFlagged)
+                return [vr];
+            const codeWordResults = checkCamelCaseWord(vr);
+            if (!codeWordResults.length) {
+                rememberFilter((_) => false)(vr);
+                return [];
+            }
+            return codeWordResults;
+        }
+        /**
+         * Break a camel case word into its parts and check each part.
+         *
+         * There are two word break patterns:
+         * - `regExpCamelCaseWordBreaks`
+         * - `regExpCamelCaseWordBreaksWithEnglishSuffix` is the default pattern with English suffixes on ALL CAPS words.
+         *
+         * Note: See [#6066](https://github.com/streetsidesoftware/cspell/pull/6066)
+         * Using just `regExpCamelCaseWordBreaks` misses unknown 4-letter words.
+         *
+         * The code below was tried, but it missed words.
+         * - `LSTM` was caught. // cspell:disable-line
+         * - `LSTMs` was missed because it becomes `LST` and `Ms`. // cspell:disable-line
+         *
+         * ```ts
+         * const results = _checkCamelCaseWord(vr, regExpCamelCaseWordBreaks);
+         * if (!results.length) return results;
+         * const resultsEnglishBreaks = _checkCamelCaseWord(vr, regExpCamelCaseWordBreaksWithEnglishSuffix);
+         * return results.length < resultsEnglishBreaks.length ? results : resultsEnglishBreaks;
+         * ```
+         */
+        function checkCamelCaseWord(vr) {
+            return _checkCamelCaseWord(vr, regExpCamelCaseWordBreaksWithEnglishSuffix);
+        }
+        function _checkCamelCaseWord(vr, regExpWordBreaks) {
             const codeWordResults = [];
-            for (const wo of extractWordsFromCodeTextOffset(vr)) {
+            for (const wo of splitWordWithOffset(vr, regExpWordBreaks)) {
                 if (setOfKnownSuccessfulWords.has(wo.text))
                     continue;
                 const issue = wo;
@@ -166,10 +205,6 @@ export function lineValidatorFactory(sDict, options) {
                 issue.text = extractText(lineSegment.segment, issue.offset, issue.offset + issue.text.length);
                 codeWordResults.push(issue);
             }
-            if (!codeWordResults.length || isWordIgnored(vr.text) || checkWord(vr).isFound) {
-                rememberFilter((_) => false)(vr);
-                return [];
-            }
             return codeWordResults;
         }
         function rebaseKnownIssues(possibleWord, known) {

package/dist/lib/util/text.d.ts CHANGED Viewed

@@ -1,11 +1,16 @@
 import type { TextDocumentOffset, TextOffset } from '@cspell/cspell-types';
 import type { Uri } from './Uri.js';
 export { stringToRegExp } from './textRegex.js';
-export declare function splitCamelCaseWordWithOffset(wo: TextOffset): Array<TextOffset>;
+export declare function splitCamelCaseWordWithOffset(wo: TextOffset): TextOffset[];
 /**
  * Split camelCase words into an array of strings.
  */
 export declare function splitCamelCaseWord(word: string): string[];
+export declare function splitWordWithOffset(wo: TextOffset, regExpWordBreaks: RegExp): TextOffset[];
+/**
+ * Split camelCase words into an array of strings.
+ */
+export declare function splitWord(word: string, regExpWordBreaks: RegExp): string[];
 /**
  * This function lets you iterate over regular expression matches.
  */

package/dist/lib/util/text.js CHANGED Viewed

@@ -1,6 +1,6 @@
 import { opConcatMap, opMap, pipe } from '@cspell/cspell-pipe/sync';
 import { binarySearch } from './search.js';
-import { regExAccents, regExAllLower, regExAllUpper, regExFirstUpper, regExIgnoreCharacters, regExpSplitWordBreaks, regExWords, regExWordsAndDigits, } from './textRegex.js';
+import { regExAccents, regExAllLower, regExAllUpper, regExFirstUpper, regExIgnoreCharacters, regExpCamelCaseWordBreaksWithEnglishSuffix, regExWords, regExWordsAndDigits, } from './textRegex.js';
 import { toUri } from './Uri.js';
 import { scanMap } from './util.js';
 export { stringToRegExp } from './textRegex.js';
@@ -15,7 +15,19 @@ export function splitCamelCaseWordWithOffset(wo) {
  * Split camelCase words into an array of strings.
  */
 export function splitCamelCaseWord(word) {
-    return word.split(regExpSplitWordBreaks);
+    return splitWord(word, regExpCamelCaseWordBreaksWithEnglishSuffix);
+}
+export function splitWordWithOffset(wo, regExpWordBreaks) {
+    return splitWord(wo.text, regExpWordBreaks).map(scanMap((last, text) => ({ text, offset: last.offset + last.text.length }), {
+        text: '',
+        offset: wo.offset,
+    }));
+}
+/**
+ * Split camelCase words into an array of strings.
+ */
+export function splitWord(word, regExpWordBreaks) {
+    return word.split(regExpWordBreaks);
 }
 /**
  * This function lets you iterate over regular expression matches.

package/dist/lib/util/textApi.d.ts ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ export { calculateTextDocumentOffsets, camelToSnake, cleanText, cleanTextOffset, extractLinesOfText, extractPossibleWordsFromTextOffset, extractText, extractWordsFromCode, extractWordsFromCodeTextOffset, extractWordsFromText, extractWordsFromTextOffset, isFirstCharacterLower, isFirstCharacterUpper, isLowerCase, isUpperCase, lcFirst, match, matchCase, matchStringToTextOffset, matchToTextOffset, removeAccents, snakeToCamel, splitCamelCaseWord, splitCamelCaseWordWithOffset, stringToRegExp, textOffset, ucFirst, } from './text.js';
2	+ //# sourceMappingURL=textApi.d.ts.map

package/dist/lib/util/textApi.js ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ export { calculateTextDocumentOffsets, camelToSnake, cleanText, cleanTextOffset, extractLinesOfText, extractPossibleWordsFromTextOffset, extractText, extractWordsFromCode, extractWordsFromCodeTextOffset, extractWordsFromText, extractWordsFromTextOffset, isFirstCharacterLower, isFirstCharacterUpper, isLowerCase, isUpperCase, lcFirst, match, matchCase, matchStringToTextOffset, matchToTextOffset, removeAccents, snakeToCamel, splitCamelCaseWord, splitCamelCaseWordWithOffset, stringToRegExp, textOffset, ucFirst, } from './text.js';
2	+ //# sourceMappingURL=textApi.js.map

package/dist/lib/util/textRegex.d.ts CHANGED Viewed

@@ -1,7 +1,8 @@
 export declare const regExUpperSOrIng: RegExp;
 export declare const regExSplitWords: RegExp;
 export declare const regExSplitWords2: RegExp;
-export declare const regExpSplitWordBreaks: RegExp;
+export declare const regExpCamelCaseWordBreaksWithEnglishSuffix: RegExp;
+export declare const regExpCamelCaseWordBreaks: RegExp;
 export declare const regExpAllPossibleWordBreaks: RegExp;
 export declare const regExWords: RegExp;
 export declare const regExWordsAndDigits: RegExp;

package/dist/lib/util/textRegex.js CHANGED Viewed

@@ -1,8 +1,9 @@
 // cspell:ignore ings ning gimuy anrvtbf gimuxy
 export const regExUpperSOrIng = /([\p{Lu}\p{M}]+(?:\\?['’])?(?:s|ing|ies|es|ings|ed|ning))(?!\p{Ll})/gu;
 export const regExSplitWords = /(\p{Ll}\p{M}?)(\p{Lu})/gu;
-export const regExSplitWords2 = /(\p{Lu}\p{M}?)(\p{Lu}\p{M}?\p{Ll})/gu;
-export const regExpSplitWordBreaks = /(?<=\p{Ll}\p{M}?)(?=\p{Lu})|(?<=\p{Lu}\p{M}?)(?=\p{Lu}\p{M}?\p{Ll})(?!\p{Lu}\p{M}?(?:s|ing|ies|es|ings|ed|ning)(?!\p{Ll}))/gu;
+export const regExSplitWords2 = /(\p{Lu}\p{M}?)((\p{Lu}\p{M}?)\p{Ll})/gu;
+export const regExpCamelCaseWordBreaksWithEnglishSuffix = /(?<=\p{Ll}\p{M}?)(?=\p{Lu})|(?<=\p{Lu}\p{M}?)(?=\p{Lu}\p{M}?\p{Ll})(?!\p{Lu}\p{M}?(?:s|ing|ies|es|ings|ed|ning)(?!\p{Ll}))/gu;
+export const regExpCamelCaseWordBreaks = /(?<=\p{Ll}\p{M}?)(?=\p{Lu})|(?<=\p{Lu}\p{M}?)(?=\p{Lu}\p{M}?\p{Ll})/gu;
 export const regExpAllPossibleWordBreaks = /(?<=\p{Ll}\p{M}?)(?=\p{Lu})|(?<=\p{Lu}\p{M}?)(?=\p{Lu}\p{M}?\p{Ll})|(?<=\p{Lu}\p{M}?\p{Lu}\p{M}?)(?=\p{Ll})|(?<=\p{L}\p{M}?)(?=\P{L})|(?<=\P{L})(?=\p{L})/gu;
 export const regExWords = /\p{L}\p{M}?(?:(?:\\?['’])?\p{L}\p{M}?)*/gu;
 // Words can be made of letters, numbers, period, underscore, dash, plus, and single quote

package/dist/lib/util/wordSplitter.js CHANGED Viewed

@@ -111,7 +111,7 @@ function genWordBreakCamel(line) {
     for (const m of text.matchAll(offsetRegEx(regExSplitWords, line.relStart))) {
         if (m.index === undefined)
             break;
-        const i = m.index + 1;
+        const i = m.index + m[1].length;
         breaksCamel1.push({
             offset: m.index,
             breaks: [[i, i], ignoreBreak],
@@ -124,7 +124,7 @@ function genWordBreakCamel(line) {
         if (m.index === undefined)
             break;
         const i = m.index + m[1].length;
-        const j = i + 1;
+        const j = i + m[3].length;
         breaksCamel2.push({
             offset: m.index,
             breaks: [[i, i], [j, j], ignoreBreak],

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "cspell-lib",
-  "version": "8.13.2",
+  "version": "8.13.3",
   "description": "A library of useful functions used across various cspell tools.",
   "type": "module",
   "sideEffects": false,
@@ -58,21 +58,21 @@
   },
   "homepage": "https://github.com/streetsidesoftware/cspell#readme",
   "dependencies": {
-    "@cspell/cspell-bundled-dicts": "8.13.2",
-    "@cspell/cspell-pipe": "8.13.2",
-    "@cspell/cspell-resolver": "8.13.2",
-    "@cspell/cspell-types": "8.13.2",
-    "@cspell/dynamic-import": "8.13.2",
-    "@cspell/strong-weak-map": "8.13.2",
-    "@cspell/url": "8.13.2",
+    "@cspell/cspell-bundled-dicts": "8.13.3",
+    "@cspell/cspell-pipe": "8.13.3",
+    "@cspell/cspell-resolver": "8.13.3",
+    "@cspell/cspell-types": "8.13.3",
+    "@cspell/dynamic-import": "8.13.3",
+    "@cspell/strong-weak-map": "8.13.3",
+    "@cspell/url": "8.13.3",
     "clear-module": "^4.1.2",
-    "comment-json": "^4.2.4",
-    "cspell-config-lib": "8.13.2",
-    "cspell-dictionary": "8.13.2",
-    "cspell-glob": "8.13.2",
-    "cspell-grammar": "8.13.2",
-    "cspell-io": "8.13.2",
-    "cspell-trie-lib": "8.13.2",
+    "comment-json": "^4.2.5",
+    "cspell-config-lib": "8.13.3",
+    "cspell-dictionary": "8.13.3",
+    "cspell-glob": "8.13.3",
+    "cspell-grammar": "8.13.3",
+    "cspell-io": "8.13.3",
+    "cspell-trie-lib": "8.13.3",
     "env-paths": "^3.0.0",
     "fast-equals": "^5.0.1",
     "gensequence": "^7.0.0",
@@ -101,5 +101,5 @@
     "lorem-ipsum": "^2.0.8",
     "perf-insight": "^1.2.0"
   },
-  "gitHead": "5c9aaf8829991e7d6d37355acb9b9685088bba14"
+  "gitHead": "e017775a1d181b20abce3c6325f2527a7554a3a9"
 }