npm - @datagrok/peptides - Versions diffs - 1.17.0 → 1.17.2 - Mend

@datagrok/peptides 1.17.0 → 1.17.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (55) hide show

package/.eslintrc.json +17 -6
package/CHANGELOG.md +4 -0
package/dist/214.js +2 -0
package/dist/436.js +2 -2
package/dist/802.js +2 -0
package/dist/package-test.js +2 -3
package/dist/package.js +2 -3
package/package.json +14 -14
package/src/demo/fasta.ts +8 -2
package/src/model.ts +783 -532
package/src/package-test.ts +1 -3
package/src/package.ts +15 -28
package/src/tests/benchmarks.ts +31 -11
package/src/tests/core.ts +11 -6
package/src/tests/misc.ts +6 -6
package/src/tests/model.ts +79 -44
package/src/tests/table-view.ts +48 -38
package/src/tests/utils.ts +0 -76
package/src/tests/viewers.ts +30 -12
package/src/tests/widgets.ts +30 -11
package/src/utils/algorithms.ts +115 -38
package/src/utils/cell-renderer.ts +181 -72
package/src/utils/constants.ts +33 -7
package/src/utils/misc.ts +244 -10
package/src/utils/parallel-mutation-cliffs.ts +18 -15
package/src/utils/statistics.ts +70 -15
package/src/utils/tooltips.ts +42 -17
package/src/utils/types.ts +29 -26
package/src/utils/worker-creator.ts +5 -0
package/src/viewers/logo-summary.ts +591 -130
package/src/viewers/sar-viewer.ts +893 -239
package/src/widgets/distribution.ts +305 -64
package/src/widgets/manual-alignment.ts +18 -11
package/src/widgets/mutation-cliffs.ts +44 -18
package/src/widgets/peptides.ts +86 -91
package/src/widgets/selection.ts +56 -22
package/src/widgets/settings.ts +94 -44
package/src/workers/mutation-cliffs-worker.ts +3 -16
package/dist/209.js +0 -2
package/dist/361.js +0 -2
package/dist/381.js +0 -2
package/dist/770.js +0 -2
package/dist/831.js +0 -2
package/dist/868.js +0 -2
package/dist/931.js +0 -3
package/dist/931.js.LICENSE.txt +0 -51
package/dist/932.js +0 -2
package/dist/package-test.js.LICENSE.txt +0 -51
package/dist/package.js.LICENSE.txt +0 -51
package/src/tests/peptide-space-test.ts +0 -48
package/src/tests/test-data.ts +0 -649
package/src/utils/molecular-measure.ts +0 -174
package/src/utils/peptide-similarity-space.ts +0 -216
package/src/viewers/peptide-space-viewer.ts +0 -150
package/src/workers/dimensionality-reducer.ts +0 -25

package/src/utils/algorithms.ts CHANGED Viewed

@@ -2,59 +2,104 @@ import * as DG from 'datagrok-api/dg';
 import * as C from './constants';
 import * as type from './types';
 import {ParallelMutationCliffs} from './parallel-mutation-cliffs';
-import {CLUSTER_TYPE} from '../model';
+import {CLUSTER_TYPE} from '../viewers/logo-summary';
 import BitArray from '@datagrok-libraries/utils/src/bit-array';
-import {ClusterStats, ClusterTypeStats, MonomerPositionStats, PositionStats, Stats, SummaryStats, getStats} from './statistics';
-export type TargetOptions = {targetCol?: type.RawColumn | null, currentTarget?: string | null};
+import {
+  ClusterStats,
+  ClusterTypeStats,
+  getStats,
+  MonomerPositionStats,
+  PositionStats,
+  StatsItem,
+  SummaryStats,
+} from './statistics';
+export type MutationCliffsOptions = {
+  maxMutations?: number,
+  minActivityDelta?: number,
+  targetCol?: type.RawColumn | null,
+  currentTarget?: string | null
+};
+/**
+ * Finds mutation cliffs in the set of sequences.
+ * @param activityArray - Activity column raw data.
+ * @param monomerInfoArray - Split sequence raw columns.
+ * @param options - Options for the mutation cliffs algorithm.
+ * @return - Mutation cliffs map.
+ */
 export async function findMutations(activityArray: type.RawData, monomerInfoArray: type.RawColumn[],
-  settings: type.PeptidesSettings = {}, targetOptions: TargetOptions = {}): Promise<type.MutationCliffs> {
+  options: MutationCliffsOptions = {}): Promise<type.MutationCliffs> {
   const nCols = monomerInfoArray.length;
-  if (nCols === 0)
+  if (nCols === 0) {
     throw new Error(`PepAlgorithmError: Couldn't find any column of semType '${C.SEM_TYPES.MONOMER}'`);
+  }
-  settings.minActivityDelta ??= 0;
-  settings.maxMutations ??= 1;
-  const substitutionsInfo = await new ParallelMutationCliffs().calc(activityArray, monomerInfoArray, settings, targetOptions);
+  options.minActivityDelta ??= 0;
+  options.maxMutations ??= 1;
+  const mutationCliffsService = new ParallelMutationCliffs();
+  const substitutionsInfo = await mutationCliffsService.calc(activityArray, monomerInfoArray, options);
+  mutationCliffsService.terminate();
   return substitutionsInfo;
 }
-export function calculateMonomerPositionStatistics(df: DG.DataFrame, positionColumns: DG.Column<string>[],
-  options: {isFiltered?: boolean, columns?: string[]} = {}): MonomerPositionStats {
+/**
+ * Calculates statistics for each monomer position.
+ * @param activityCol - Activity column.
+ * @param filter - Dataframe filter to consider.
+ * @param positionColumns - Position columns containing monomers.
+ * @param [options] - Options for the algorithm.
+ * @param [options.isFiltered] - Whether the dataframe is filtered.
+ * @param [options.columns] - Columns to consider when calculating statistics.
+ * @return - Statistics for each monomer position.
+ */
+export function calculateMonomerPositionStatistics(activityCol: DG.Column<number>, filter: DG.BitSet,
+  positionColumns: DG.Column<string>[], options: {
+    isFiltered?: boolean,
+    columns?: string[]
+  } = {}): MonomerPositionStats {
   options.isFiltered ??= false;
-  const monomerPositionObject = {general: {}} as MonomerPositionStats & {general: SummaryStats};
-  const activityCol = df.getCol(C.COLUMNS_NAMES.ACTIVITY);
+  const monomerPositionObject = {general: {}} as MonomerPositionStats & { general: SummaryStats };
   let activityColData: Float64Array = activityCol.getRawData() as Float64Array;
-  let sourceDfLen = df.rowCount;
+  let sourceDfLen = activityCol.length;
   if (options.isFiltered) {
-    sourceDfLen = df.filter.trueCount;
+    sourceDfLen = filter.trueCount;
     const tempActivityData = new Float64Array(sourceDfLen);
-    const selectedIndexes = df.filter.getSelectedIndexes();
-    for (let i = 0; i < sourceDfLen; ++i)
+    const selectedIndexes = filter.getSelectedIndexes();
+    for (let i = 0; i < sourceDfLen; ++i) {
       tempActivityData[i] = activityColData[selectedIndexes[i]];
+    }
     activityColData = tempActivityData;
-    positionColumns = DG.DataFrame.fromColumns(positionColumns).clone(df.filter).columns.toList();
+    positionColumns = DG.DataFrame.fromColumns(positionColumns).clone(filter).columns.toList();
   }
   options.columns ??= positionColumns.map((col) => col.name);
   for (const posCol of positionColumns) {
-    if (!options.columns.includes(posCol.name))
+    if (!options.columns.includes(posCol.name)) {
       continue;
+    }
     const posColData = posCol.getRawData();
     const posColCateogries = posCol.categories;
-    const currentPositionObject = {general: {}} as PositionStats & {general: SummaryStats};
+    const currentPositionObject = {general: {}} as PositionStats & { general: SummaryStats };
     for (let categoryIndex = 0; categoryIndex < posColCateogries.length; ++categoryIndex) {
       const monomer = posColCateogries[categoryIndex];
-      if (monomer === '')
+      if (monomer === '') {
         continue;
+      }
       const boolArray: boolean[] = new Array(sourceDfLen).fill(false);
       for (let i = 0; i < sourceDfLen; ++i) {
-        if (posColData[i] === categoryIndex)
+        if (posColData[i] === categoryIndex) {
           boolArray[i] = true;
+        }
       }
       const bitArray = BitArray.fromValues(boolArray);
       const stats = bitArray.allFalse || bitArray.allTrue ?
@@ -69,69 +114,102 @@ export function calculateMonomerPositionStatistics(df: DG.DataFrame, positionCol
   return monomerPositionObject;
 }
-export function getSummaryStats(genObj: SummaryStats, stats: Stats | null = null, summaryStats: SummaryStats | null = null): void {
-  if (stats === null && summaryStats === null)
+/**
+ * Calculates summary statistics for the monomer position statistics such as maximum and minimum values for each
+ * statistic in general and on each position.
+ * @param genObj - Object to store the summary statistics to.
+ * @param stats - Statistics for a single monomer position.
+ * @param summaryStats - Summary statistics for all monomer positions.
+ */
+export function getSummaryStats(genObj: SummaryStats, stats: StatsItem | null = null,
+  summaryStats: SummaryStats | null = null): void {
+  if (stats === null && summaryStats === null) {
     throw new Error(`MonomerPositionStatsError: either stats or summaryStats must be present`);
+  }
   const possibleMaxCount = stats?.count ?? summaryStats!.maxCount;
   genObj.maxCount ??= possibleMaxCount;
-  if (genObj.maxCount < possibleMaxCount)
+  if (genObj.maxCount < possibleMaxCount) {
     genObj.maxCount = possibleMaxCount;
+  }
   const possibleMinCount = stats?.count ?? summaryStats!.minCount;
   genObj.minCount ??= possibleMinCount;
-  if (genObj.minCount > possibleMinCount)
+  if (genObj.minCount > possibleMinCount) {
     genObj.minCount = possibleMinCount;
+  }
   const possibleMaxMeanDifference = stats?.meanDifference ?? summaryStats!.maxMeanDifference;
   genObj.maxMeanDifference ??= possibleMaxMeanDifference;
-  if (genObj.maxMeanDifference < possibleMaxMeanDifference)
+  if (genObj.maxMeanDifference < possibleMaxMeanDifference) {
     genObj.maxMeanDifference = possibleMaxMeanDifference;
+  }
   const possibleMinMeanDifference = stats?.meanDifference ?? summaryStats!.minMeanDifference;
   genObj.minMeanDifference ??= possibleMinMeanDifference;
-  if (genObj.minMeanDifference > possibleMinMeanDifference)
+  if (genObj.minMeanDifference > possibleMinMeanDifference) {
     genObj.minMeanDifference = possibleMinMeanDifference;
+  }
   if (!isNaN(stats?.pValue ?? NaN)) {
     const possibleMaxPValue = stats?.pValue ?? summaryStats!.maxPValue;
     genObj.maxPValue ??= possibleMaxPValue;
-    if (genObj.maxPValue < possibleMaxPValue)
+    if (genObj.maxPValue < possibleMaxPValue) {
       genObj.maxPValue = possibleMaxPValue;
+    }
     const possibleMinPValue = stats?.pValue ?? summaryStats!.minPValue;
     genObj.minPValue ??= possibleMinPValue;
-    if (genObj.minPValue > possibleMinPValue)
+    if (genObj.minPValue > possibleMinPValue) {
       genObj.minPValue = possibleMinPValue;
+    }
   }
   const possibleMaxRatio = stats?.ratio ?? summaryStats!.maxRatio;
   genObj.maxRatio ??= possibleMaxRatio;
-  if (genObj.maxRatio < possibleMaxRatio)
+  if (genObj.maxRatio < possibleMaxRatio) {
     genObj.maxRatio = possibleMaxRatio;
+  }
   const possibleMinRatio = stats?.ratio ?? summaryStats!.minRatio;
   genObj.minRatio ??= possibleMinRatio;
-  if (genObj.minRatio > possibleMinRatio)
+  if (genObj.minRatio > possibleMinRatio) {
     genObj.minRatio = possibleMinRatio;
+  }
 }
+/**
+ * Calculates statistics for each cluster type.
+ * @param df - Dataframe containing the clusters column.
+ * @param clustersColumnName - Name of the original clusters column.
+ * @param customClusters - Array of custom clusters columns names.
+ * @param activityCol - Activity column.
+ * @return - Statistics for each cluster type.
+ */
 export function calculateClusterStatistics(df: DG.DataFrame, clustersColumnName: string,
-  customClusters: DG.Column<boolean>[]): ClusterTypeStats {
+  customClusters: DG.Column<boolean>[], activityCol: DG.Column<number>): ClusterTypeStats {
   const rowCount = df.rowCount;
   const origClustCol = df.getCol(clustersColumnName);
   const origClustColData = origClustCol.getRawData();
   const origClustColCat = origClustCol.categories;
   const origClustMasks: BitArray[] = Array.from({length: origClustColCat.length},
     () => new BitArray(rowCount, false));
-  for (let rowIdx = 0; rowIdx < rowCount; ++rowIdx)
+  for (let rowIdx = 0; rowIdx < rowCount; ++rowIdx) {
     origClustMasks[origClustColData[rowIdx]].setTrue(rowIdx);
+  }
   const customClustMasks = customClusters.map(
     (v) => BitArray.fromUint32Array(rowCount, v.getRawData() as Uint32Array));
   const customClustColNamesList = customClusters.map((v) => v.name);
-  const activityCol = df.getCol(C.COLUMNS_NAMES.ACTIVITY);
   const activityColData = activityCol.getRawData() as Float64Array;
   const origClustStats: ClusterStats = {};
@@ -143,10 +221,9 @@ export function calculateClusterStatistics(df: DG.DataFrame, clustersColumnName:
     const resultStats = clustType === CLUSTER_TYPE.ORIGINAL ? origClustStats : customClustStats;
     for (let maskIdx = 0; maskIdx < masks.length; ++maskIdx) {
       const mask = masks[maskIdx];
-      const stats = mask.allTrue || mask.allFalse ?
+      resultStats[clustNames[maskIdx]] = mask.allTrue || mask.allFalse ?
         {count: mask.length, meanDifference: 0, ratio: 1.0, pValue: null, mask: mask, mean: activityCol.stats.avg} :
         getStats(activityColData, mask);
-      resultStats[clustNames[maskIdx]] = stats;
     }
   }