npm - @datagrok/bio - Versions diffs - 2.1.11 → 2.4.2 - Mend

@datagrok/bio 2.1.11 → 2.4.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (64) hide show

package/README.md +11 -12
package/css/helm.css +10 -0
package/detectors.js +83 -59
package/dist/package-test.js +2 -68651
package/dist/package-test.js.map +1 -0
package/dist/package.js +2 -66040
package/dist/package.js.map +1 -0
package/dockerfiles/Dockerfile +86 -0
package/files/icons/composition-analysis.svg +17 -0
package/files/icons/sequence-diversity-viewer.svg +4 -0
package/files/icons/sequence-similarity-viewer.svg +4 -0
package/files/icons/vdregions-viewer.svg +22 -0
package/files/icons/weblogo-viewer.svg +7 -0
package/files/tests/testUrl.csv +11 -0
package/files/tests/toAtomicLevelTest.csv +4 -0
package/package.json +29 -32
package/src/analysis/sequence-activity-cliffs.ts +15 -13
package/src/analysis/sequence-diversity-viewer.ts +3 -2
package/src/analysis/sequence-search-base-viewer.ts +4 -2
package/src/analysis/sequence-similarity-viewer.ts +4 -4
package/src/analysis/sequence-space.ts +2 -1
package/src/calculations/monomerLevelMols.ts +6 -6
package/src/package-test.ts +9 -2
package/src/package.ts +230 -145
package/src/substructure-search/substructure-search.ts +25 -22
package/src/tests/Palettes-test.ts +9 -9
package/src/tests/WebLogo-positions-test.ts +131 -68
package/src/tests/_first-tests.ts +9 -0
package/src/tests/activity-cliffs-tests.ts +8 -7
package/src/tests/activity-cliffs-utils.ts +17 -9
package/src/tests/bio-tests.ts +30 -21
package/src/tests/checkInputColumn-tests.ts +17 -17
package/src/tests/converters-test.ts +81 -46
package/src/tests/detectors-benchmark-tests.ts +17 -17
package/src/tests/detectors-tests.ts +190 -178
package/src/tests/fasta-export-tests.ts +2 -3
package/src/tests/monomer-libraries-tests.ts +34 -0
package/src/tests/pepsea-tests.ts +21 -0
package/src/tests/renderers-test.ts +33 -29
package/src/tests/sequence-space-test.ts +6 -4
package/src/tests/similarity-diversity-tests.ts +4 -4
package/src/tests/splitters-test.ts +6 -7
package/src/tests/substructure-filters-tests.ts +23 -1
package/src/tests/utils/sequences-generators.ts +7 -7
package/src/tests/utils.ts +2 -1
package/src/tests/viewers.ts +16 -0
package/src/utils/cell-renderer.ts +116 -54
package/src/utils/constants.ts +7 -6
package/src/utils/convert.ts +17 -11
package/src/utils/monomer-lib.ts +174 -0
package/src/utils/multiple-sequence-alignment.ts +49 -26
package/src/utils/pepsea.ts +78 -0
package/src/utils/save-as-fasta.ts +9 -8
package/src/utils/ui-utils.ts +15 -3
package/src/viewers/vd-regions-viewer.ts +125 -83
package/src/viewers/web-logo-viewer.ts +1031 -0
package/src/widgets/bio-substructure-filter.ts +38 -24
package/tsconfig.json +71 -72
package/webpack.config.js +4 -11
package/dist/vendors-node_modules_datagrok-libraries_ml_src_workers_dimensionality-reducer_js.js +0 -8988
package/jest.config.js +0 -33
package/src/__jest__/remote.test.ts +0 -77
package/src/__jest__/test-node.ts +0 -98
package/test-Bio-91c83d8913ff-bb573307.html +0 -392

package/src/tests/detectors-tests.ts CHANGED Viewed

@@ -1,11 +1,12 @@
 import * as grok from 'datagrok-api/grok';
 import * as ui from 'datagrok-api/ui';
 import * as DG from 'datagrok-api/dg';
-import * as bio from '@datagrok-libraries/bio';
 import {after, before, category, test, expect, expectObject} from '@datagrok-libraries/utils/src/test';
 import {importFasta} from '../package';
+import {ALIGNMENT, ALPHABET, NOTATION, TAGS as bioTAGS} from '@datagrok-libraries/bio/src/utils/macromolecule';
+import {UnitsHandler} from '@datagrok-libraries/bio/src/utils/units-handler';
 /*
 // snippet to list df columns of semType='Macromolecule' (false positive)
@@ -21,103 +22,115 @@ for (let i = 0; i < df.columns.length; i++) {
 type DfReaderFunc = () => Promise<DG.DataFrame>;
 category('detectors', () => {
-  const csvDf1: string = `col1
-1
-2
-3`;
+  const enum csvTests {
+    negEmpty = 'negEmpty',
+    neg1 = 'neg1',
+    neg2 = 'neg2',
+    neg3 = 'neg3',
+    negSmiles = 'negSmiles',
+    fastaDna1 = 'csvFastaDna1',
+    fastaRna1 = 'fastaRna1',
+    fastaPt1 = 'fastaPt1',
+    fastaUn = 'fastaUn',
+    sepDna = 'sepDna',
+    sepRna = 'sepRna',
+    sepPt = 'sepPt',
+    sepUn1 = 'sepUn1',
+    sepUn2 = 'sepUn2',
+    sepMsaDna1 = 'sepMsaDna1',
+    fastaMsaDna1 = 'fastaMsaDna1',
+    fastaMsaPt1 = 'fastaMsaPt1',
+  }
-  const csvDfEmpty: string = `id,col1
+  const csvData = new class {
+    [csvTests.negEmpty]: string = `id,col1
 1,
 2,
 3,
 4,
 5,`;
-  const csvDf2: string = `col1
+    [csvTests.neg1]: string = `col1
+1
+2
+3`;
+    [csvTests.neg2]: string = `col1
 4
 5
 6
 7`;
-  const csvDf3: string = `col1
+    [csvTests.neg3]: string = `col1
 8
 9
 10
 11
 12`;
-  const csvDfSmiles: string = `col1
+    [csvTests.negSmiles]: string = `col1
 CCCCN1C(=O)CN=C(c2cc(F)ccc12)C3CCCCC3
 C1CCCCC1
 CCCCCC
 `;
-  const csvDfDna1: string = `seq
+    [csvTests.fastaDna1]: string = `seq
 ACGTC
 CAGTGT
 TTCAAC
 `;
-  const csvDfRna1: string = `seq
+    [csvTests.fastaRna1]: string = `seq
 ACGUC
 CAGUGU
 UUCAAC
 `;
-  /** Pure amino acids sequence */
-  const csvDfPt1: string = `seq
+    /** Pure amino acids sequence */
+    [csvTests.fastaPt1]: string = `seq
 FWPHEY
 YNRQWYV
 MKPSEYV
 `;
-  const csvDfSepDna: string = `seq
+    [csvTests.fastaUn]: string = `seq
+[meI][hHis][Aca]NT[dE][Thr_PO3H2][Aca]D
+[meI][hHis][Aca][Cys_SEt]T[dK][Thr_PO3H2][Aca][Tyr_PO3H2]
+[Lys_Boc][hHis][Aca][Cys_SEt]T[dK][Thr_PO3H2][Aca][Tyr_PO3H2]
+`;
+    [csvTests.sepDna]: string = `seq
 A*C*G*T*C
 C*A*G*T*G*T
 T*T*C*A*A*C
 `;
-  const csvDfSepRna: string = `seq
+    [csvTests.sepRna]: string = `seq
 A*C*G*U*C
 C*A*G*U*G*U
 U*U*C*A*A*C
 `;
-  const csvDfSepPt: string = `seq
+    [csvTests.sepPt]: string = `seq
 F-W-P-H-E-Y
 Y-N-R-Q-W-Y-V
 M-K-P-S-E-Y-V
 `;
-  const csvDfSepUn1: string = `seq
+    [csvTests.sepUn1]: string = `seq
 abc-dfgg-abc1-cfr3-rty-wert
 rut12-her2-rty-wert-abc-abc1-dfgg
 rut12-rty-her2-abc-cfr3-wert-rut12
 `;
-  const csvDfSepUn2: string = `seq
+    [csvTests.sepUn2]: string = `seq
 abc/dfgg/abc1/cfr3/rty/wert
 rut12/her2/rty/wert//abc/abc1/dfgg
 rut12/rty/her2/abc/cfr3//wert/rut12
 `;
-  const csvDfSepMsaDna1: string = `seq
+    [csvTests.sepMsaDna1]: string = `seq
 A-C--G-T--C-T
 C-A-C--T--G-T
 A-C-C-G-T-A-C-T
 `;
-  const csvDfMsaDna1: string = `seq
+    [csvTests.fastaMsaDna1]: string = `seq
 AC-GT-CT
 CAC-T-GT
 ACCGTACT
 `;
-  const csvDfMsaPt1: string = `seq
+    [csvTests.fastaMsaPt1]: string = `seq
 FWR-WYV-KHP
 YNR-WYV-KHP
 MWRSWY-CKHP
 `;
+  }();
   const enum Samples {
     peptidesComplex = 'peptidesComplex',
@@ -135,11 +148,12 @@ MWRSWY-CKHP
     testSmilesShort = 'testSmilesShort',
     testCerealCsv = 'testCerealCsv',
     testActivityCliffsCsv = 'testActivityCliffsCsv',
-    testSpgi100 = 'testSpgi100',
     testUnichemSources = 'testUnichemSources',
     testDmvOffices = 'testDmvOffices',
     testAlertCollection = 'testAlertCollection',
     testSpgi = 'testSpgi',
+    testSpgi100 = 'testSpgi100',
+    testUrl = 'testUrl',
   }
   const samples: { [key: string]: string } = {
@@ -158,11 +172,12 @@ MWRSWY-CKHP
     [Samples.testSmilesShort]: 'System:AppData/Bio/tests/testSmilesShort.csv',
     [Samples.testActivityCliffsCsv]: 'System:AppData/Bio/tests/testActivityCliffs.csv', // smiles
     [Samples.testCerealCsv]: 'System:AppData/Bio/tests/testCereal.csv',
-    [Samples.testSpgi100]: 'System:AppData/Bio/tests/testSpgi100.csv',
     [Samples.testUnichemSources]: 'System:AppData/Bio/tests/testUnichemSources.csv',
     [Samples.testDmvOffices]: 'System:AppData/Bio/tests/testDmvOffices.csv',
     [Samples.testAlertCollection]: 'System:AppData/Bio/tests/testAlertCollection.csv',
+    [Samples.testSpgi100]: 'System:AppData/Bio/tests/testSpgi100.csv',
     [Samples.testSpgi]: 'System:AppData/Bio/tests/SPGI-derived.csv',
+    [Samples.testUrl]: 'System:AppData/Bio/tests/testUrl.csv',
   };
   const _samplesDfs: { [key: string]: Promise<DG.DataFrame> } = {};
@@ -192,217 +207,177 @@ MWRSWY-CKHP
     return df;
   }
-  const _csvDfs: { [key: string]: Promise<DG.DataFrame> } = {};
-  const readCsv: (key: string, csv: string) => DfReaderFunc = (key: string, csv: string) => {
+  const readCsv: (key: csvTests) => DfReaderFunc = (key: keyof typeof csvData) => {
     return async () => {
-      if (!(key in _csvDfs)) {
-        _csvDfs[key] = (async (): Promise<DG.DataFrame> => {
-          const df: DG.DataFrame = DG.DataFrame.fromCsv(csv);
-          await grok.data.detectSemanticTypes(df);
-          return df;
-        })();
-      }
-      return _csvDfs[key];
+      // Always recreate test data frame from CSV for reproducible detector behavior in tests.
+      const csv: string = csvData[key];
+      const df: DG.DataFrame = DG.DataFrame.fromCsv(csv);
+      await grok.data.detectSemanticTypes(df);
+      return df;
     };
   };
-  test('NegativeEmpty', async () => { await _testNeg(readCsv('csvDfEmpty', csvDfEmpty), 'col1'); });
-  test('Negative1', async () => { await _testNeg(readCsv('csvDf1', csvDf1), 'col1'); });
-  test('Negative2', async () => { await _testNeg(readCsv('csvDf2', csvDf2), 'col1'); });
-  test('Negative3', async () => { await _testNeg(readCsv('csvDf3', csvDf3), 'col1'); });
-  test('NegativeSmiles', async () => { await _testNeg(readCsv('csvDfSmiles', csvDfSmiles), 'col1'); });
+  test('NegativeEmpty', async () => { await _testNeg(readCsv(csvTests.negEmpty), 'col1'); });
+  test('Negative1', async () => { await _testNeg(readCsv(csvTests.neg1), 'col1'); });
+  test('Negative2', async () => { await _testNeg(readCsv(csvTests.neg2), 'col1'); });
+  test('Negative3', async () => { await _testNeg(readCsv(csvTests.neg3), 'col1'); });
+  test('NegativeSmiles', async () => { await _testNeg(readCsv(csvTests.negSmiles), 'col1'); });
-  test('Dna1', async () => {
-    await _testPos(readCsv('csvDfDna1', csvDfDna1), 'seq', bio.NOTATION.FASTA, bio.ALIGNMENT.SEQ, bio.ALPHABET.DNA, 4, false);
+  test('FastaDna1', async () => {
+    await _testPos(readCsv(csvTests.fastaDna1), 'seq',
+      NOTATION.FASTA, ALIGNMENT.SEQ, ALPHABET.DNA, 4, false);
   });
-  test('Rna1', async () => {
-    await _testPos(readCsv('csvDfRna1', csvDfRna1), 'seq', bio.NOTATION.FASTA, bio.ALIGNMENT.SEQ, bio.ALPHABET.RNA, 4, false);
+  test('FastaRna1', async () => {
+    await _testPos(readCsv(csvTests.fastaRna1), 'seq',
+      NOTATION.FASTA, ALIGNMENT.SEQ, ALPHABET.RNA, 4, false);
   });
-  test('AA1', async () => {
-    await _testPos(readCsv('csvDfPt1', csvDfPt1), 'seq', bio.NOTATION.FASTA, bio.ALIGNMENT.SEQ, bio.ALPHABET.PT, 20, false);
+  test('FastaPt1', async () => {
+    await _testPos(readCsv(csvTests.fastaPt1), 'seq',
+      NOTATION.FASTA, ALIGNMENT.SEQ, ALPHABET.PT, 20, false);
   });
-  test('MsaDna1', async () => {
-    await _testPos(readCsv('csvDfMsaDna1', csvDfMsaDna1), 'seq', bio.NOTATION.FASTA, bio.ALIGNMENT.SEQ_MSA, bio.ALPHABET.DNA, 4, false);
+  test('FastaUn', async () => {
+    await _testPos(readCsv(csvTests.fastaUn), 'seq',
+      NOTATION.FASTA, ALIGNMENT.SEQ_MSA, ALPHABET.UN, 12, true);
+  });
+  test('FastaMsaDna1', async () => {
+    await _testPos(readCsv(csvTests.fastaMsaDna1), 'seq',
+      NOTATION.FASTA, ALIGNMENT.SEQ_MSA, ALPHABET.DNA, 4, false);
   });
-  test('MsaAA1', async () => {
-    await _testPos(readCsv('csvDfMsaPt1', csvDfMsaPt1), 'seq', bio.NOTATION.FASTA,
-      bio.ALIGNMENT.SEQ_MSA, bio.ALPHABET.PT, 20, false);
+  test('FastaMsaPt1', async () => {
+    await _testPos(readCsv(csvTests.fastaMsaPt1), 'seq',
+      NOTATION.FASTA, ALIGNMENT.SEQ_MSA, ALPHABET.PT, 20, false);
   });
   test('SepDna', async () => {
-    await _testPos(readCsv('csvDfSepDna', csvDfSepDna), 'seq', bio.NOTATION.SEPARATOR, bio.ALIGNMENT.SEQ, bio.ALPHABET.DNA, 4, false, '*');
+    await _testPos(readCsv(csvTests.sepDna), 'seq',
+      NOTATION.SEPARATOR, ALIGNMENT.SEQ, ALPHABET.DNA, 4, false, '*');
   });
   test('SepRna', async () => {
-    await _testPos(readCsv('csvDfSepRna', csvDfSepRna), 'seq', bio.NOTATION.SEPARATOR, bio.ALIGNMENT.SEQ, bio.ALPHABET.RNA, 4, false, '*');
+    await _testPos(readCsv(csvTests.sepRna), 'seq',
+      NOTATION.SEPARATOR, ALIGNMENT.SEQ, ALPHABET.RNA, 4, false, '*');
   });
   test('SepPt', async () => {
-    await _testPos(readCsv('csvDfSepPt', csvDfSepPt), 'seq',
-      bio.NOTATION.SEPARATOR, bio.ALIGNMENT.SEQ, bio.ALPHABET.PT, 20, false, '-');
+    await _testPos(readCsv(csvTests.sepPt), 'seq',
+      NOTATION.SEPARATOR, ALIGNMENT.SEQ, ALPHABET.PT, 20, false, '-');
   });
   test('SepUn1', async () => {
-    await _testPos(readCsv('csvDfSepUn1', csvDfSepUn1), 'seq',
-      bio.NOTATION.SEPARATOR, bio.ALIGNMENT.SEQ, bio.ALPHABET.UN, 8, true, '-');
+    await _testPos(readCsv(csvTests.sepUn1), 'seq',
+      NOTATION.SEPARATOR, ALIGNMENT.SEQ, ALPHABET.UN, 8, true, '-');
   });
   test('SepUn2', async () => {
-    await _testPos(readCsv('csvDfSepUn2', csvDfSepUn2), 'seq',
-      bio.NOTATION.SEPARATOR, bio.ALIGNMENT.SEQ, bio.ALPHABET.UN, 9, true, '/');
+    await _testPos(readCsv(csvTests.sepUn2), 'seq',
+      NOTATION.SEPARATOR, ALIGNMENT.SEQ, ALPHABET.UN, 9, true, '/');
   });
   test('SepMsaN1', async () => {
-    await _testPos(readCsv('csvDfSepMsaDna1', csvDfSepMsaDna1), 'seq',
-      bio.NOTATION.SEPARATOR, bio.ALIGNMENT.SEQ_MSA, bio.ALPHABET.DNA, 4, false, '-');
+    await _testPos(readCsv(csvTests.sepMsaDna1), 'seq',
+      NOTATION.SEPARATOR, ALIGNMENT.SEQ_MSA, ALPHABET.DNA, 4, false, '-');
   });
-  test('SamplesFastaCsvPt', async () => {
-    await _testPos(readSamples(Samples.fastaCsv), 'sequence', bio.NOTATION.FASTA, bio.ALIGNMENT.SEQ, bio.ALPHABET.PT, 20, false);
-  });
-  test('SamplesFastaCsvNegativeEntry', async () => {
-    await _testNeg(readSamples(Samples.fastaCsv), 'Entry');
-  });
-  test('SamplesFastaCsvNegativeLength', async () => {
-    await _testNeg(readSamples(Samples.fastaCsv), 'Length');
-  });
-  test('SamplesFastaCsvNegativeUniProtKB', async () => {
-    await _testNeg(readSamples(Samples.fastaCsv), 'UniProtKB');
+  test('samplesFastaCsv', async () => {
+    await _testDf(readSamples(Samples.fastaCsv), {
+      'Sequence': new PosCol(NOTATION.FASTA, ALIGNMENT.SEQ, ALPHABET.PT, 20, false),
+    });
   });
-  test('SamplesFastaFastaPt', async () => {
-    await _testPos(readSamples(Samples.fastaFasta, readFileFasta),
-      'sequence', bio.NOTATION.FASTA, bio.ALIGNMENT.SEQ, bio.ALPHABET.PT, 20, false);
+  test('samplesFastaFasta', async () => {
+    await _testDf(readSamples(Samples.fastaFasta), {
+      'sequence': new PosCol(NOTATION.FASTA, ALIGNMENT.SEQ, ALPHABET.PT, 20, false),
+    });
   });
   // peptidesComplex contains monomers with spaces in AlignedSequence columns, which are forbidden
   // test('samplesPeptidesComplexPositiveAlignedSequence', async () => {
   //   await _testPos(readSamples(Samples.peptidesComplex), 'AlignedSequence', 'separator:SEQ:UN', '-');
   // });
-  test('samplesPeptidesComplexNegativeID', async () => {
-    await _testNeg(readSamples(Samples.peptidesComplex), 'ID');
-  });
-  test('SamplesPeptidesComplexNegativeMeasured', async () => {
-    await _testNeg(readSamples(Samples.peptidesComplex), 'Measured');
-  });
-  test('SamplesPeptidesComplexNegativeValue', async () => {
-    await _testNeg(readSamples(Samples.peptidesComplex), 'Value');
-  });
-  test('samplesMsaComplexUn', async () => {
-    await _testPos(readSamples(Samples.msaComplex), 'MSA',
-      bio.NOTATION.SEPARATOR, bio.ALIGNMENT.SEQ_MSA, bio.ALPHABET.UN, 161, true, '/');
-  });
-  test('samplesMsaComplexNegativeActivity', async () => {
-    await _testNeg(readSamples(Samples.msaComplex), 'Activity');
+  test('samplesPeptidesComplex', async () => {
+    await _testDf(readSamples(Samples.peptidesComplex), {} /* no positive */);
   });
-  test('samplesIdCsvNegativeID', async () => {
-    await _testNeg(readSamples(Samples.testIdCsv), 'ID');
+  test('samplesMsaComplex', async () => {
+    await _testDf(readSamples(Samples.msaComplex), {
+      'MSA': new PosCol(NOTATION.SEPARATOR, ALIGNMENT.SEQ_MSA, ALPHABET.UN, 161, true, '/'),
+    });
   });
-  test('samplesSarSmallCsvNegativeSmiles', async () => {
-    await _testNeg(readSamples(Samples.testSmilesCsv), 'smiles');
+  test('samplesIdCsv', async () => {
+    await _testDf(readSamples(Samples.testIdCsv), {} /* no positive */);
   });
-  test('samplesHelmCsvHELM', async () => {
-    await _testPos(readSamples(Samples.helmCsv), 'HELM', bio.NOTATION.HELM, null, null, 160, true, null);
+  test('samplesSarSmallCsv', async () => {
+    await _testDf(readSamples(Samples.testSmilesCsv), {} /* nopositive */);
   });
-  test('samplesHelmCsvNegativeActivity', async () => {
-    await _testNeg(readSamples(Samples.helmCsv), 'Activity');
+  test('samplesHelmCsv', async () => {
+    await _testDf(readSamples(Samples.helmCsv), {
+      'HELM': new PosCol(NOTATION.HELM, null, null, 160, true),
+    });
   });
-  // sample_testHelm.csb
+  // sample_testHelm.csv
   // columns: ID,Test type,HELM string,Valid?,Mol Weight,Mol Formula,SMILES
-  test('samplesTestHelmNegativeID', async () => {
-    await _testNeg(readSamples(Samples.testHelmCsv), 'ID');
-  });
-  test('samplesTestHelmNegativeTestType', async () => {
-    await _testNeg(readSamples(Samples.testHelmCsv), 'Test type');
-  });
-  test('samplesTestHelmPositiveHelmString', async () => {
-    await _testPos(readSamples(Samples.testHelmCsv), 'HELM string', bio.NOTATION.HELM, null, null, 9, true, null);
-  });
-  test('samplesTestHelmNegativeValid', async () => {
-    await _testNeg(readSamples(Samples.testHelmCsv), 'Valid?');
-  });
-  test('samplesTestHelmNegativeMolWeight', async () => {
-    await _testNeg(readSamples(Samples.testHelmCsv), 'Mol Weight');
-  });
-  test('samplesTestHelmNegativeMolFormula', async () => {
-    await _testNeg(readSamples(Samples.testHelmCsv), 'Mol Formula');
+  test('samplesTestHelmCsv', async () => {
+    await _testDf(readSamples(Samples.testHelmCsv), {
+      'HELM string': new PosCol(NOTATION.HELM, null, null, 9, true),
+    });
   });
-  test('samplesTestHelmNegativeSmiles', async () => {
-    await _testNeg(readSamples(Samples.testHelmCsv), 'Smiles');
-  });
-  test('samplesTestDemogNegativeAll', async () => {
-    const dfFunc: DfReaderFunc = readSamples(Samples.testDemogCsv);
-    const df: DG.DataFrame = await dfFunc();
-    for (const col of df.columns.toList())
-      await _testNeg(dfFunc, col.name);
+  test('samplesTestDemogCsv', async () => {
+    await _testDf(readSamples(Samples.testDemogCsv), {} /* no positive */);
   });
-  test('samplesTestSmiles2NegativeSmiles', async () => {
-    await _testNeg(readSamples(Samples.testSmiles2Csv), 'SMILES');
+  test('samplesTestSmiles2Csv', async () => {
+    await _testDf(readSamples(Samples.testSmiles2Csv), {} /* no positive */);
   });
-  test('samplesTestSmilesShortNegativeSmiles', async () => {
-    await _testNeg(readSamples(Samples.testSmilesShort), 'SMILES');
+  test('samplesTestSmilesShort', async () => {
+    await _testDf(readSamples(Samples.testSmilesShort), {} /* no positive */);
   });
   test('samplesTestActivityCliffsNegativeSmiles', async () => {
-    await _testNeg(readSamples(Samples.testActivityCliffsCsv), 'smiles');
+    await _testDf(readSamples(Samples.testActivityCliffsCsv), {} /* no positive */);
   });
-  test('samplesFastaPtPosSequence', async () => {
-    await _testPos(readSamples(Samples.fastaPtCsv), 'sequence',
-      bio.NOTATION.FASTA, bio.ALIGNMENT.SEQ, bio.ALPHABET.PT, 20, false);
+  test('samplesFastaPtCsv', async () => {
+    await _testDf(readSamples(Samples.fastaPtCsv), {
+      'sequence': new PosCol(NOTATION.FASTA, ALIGNMENT.SEQ, ALPHABET.PT, 20, false),
+    });
   });
-  test('samplesTestCerealNegativeCerealName', async () => {
-    await _testNeg(readSamples(Samples.testCerealCsv), 'cereal_name');
+  test('samplesTestCerealCsv', async () => {
+    await _testDf(readSamples(Samples.testCerealCsv), {} /* no positive */);
   });
-  test('samplesTestSpgi100NegativeStereoCategory', async () => {
-    await _testNeg(readSamples(Samples.testSpgi100), 'Stereo Category');
-  });
-  test('samplesTestSpgi100NegativeScaffoldNames', async () => {
-    await _testNeg(readSamples(Samples.testSpgi100), 'Scaffold Names');
-  });
-  test('samplesTestSpgi100NegativePrimaryScaffoldName', async () => {
-    await _testNeg(readSamples(Samples.testSpgi100), 'Primary Scaffold Name');
-  });
-  test('samplesTestSpgi100NegativeSampleName', async () => {
-    await _testNeg(readSamples(Samples.testSpgi100), 'Sample Name');
+  test('samplesTestUnichemSources', async () => {
+    await _testDf(readSamples(Samples.testUnichemSources), {} /* no positive */);
   });
-  test('samplesTestUnichemSourcesNegativeSrcUrl', async () => {
-    await _testNeg(readSamples(Samples.testUnichemSources), 'src_url');
-  });
-  test('samplesTestUnichemSourcesNegativeBaseIdUrl', async () => {
-    await _testNeg(readSamples(Samples.testUnichemSources), 'base_id_url');
+  test('samplesTestDmvOffices', async () => {
+    await _testDf(readSamples(Samples.testDmvOffices), {} /* no positive */);
   });
-  test('samplesTestDmvOfficesNegativeOfficeName', async () => {
-    await _testNeg(readSamples(Samples.testDmvOffices), 'Office Name');
+  test('samplesTestAlertCollection', async () => {
+    await _testDf(readSamples(Samples.testAlertCollection), {} /* no positive */);
   });
-  test('samplesTestDmvOfficesNegativeCity', async () => {
-    await _testNeg(readSamples(Samples.testDmvOffices), 'City');
+  test('samplesTestSpgi', async () => {
+    await _testDf(readSamples(Samples.testSpgi), {} /* no positive */);
   });
-  test('samplesTestAlertCollectionNegativeSmarts', async () => {
-    await _testNeg(readSamples(Samples.testAlertCollection), 'smarts');
+  test('samplesTestSpgi100', async () => {
+    await _testDf(readSamples(Samples.testSpgi100), {} /* no positive */);
   });
-  test('samplesTestSpgiNegativeVals', async () => {
-    await _testNeg(readSamples(Samples.testSpgi), 'vals');
+  test('samplesTestUrl', async () => {
+    await _testDf(readSamples(Samples.testUrl), {} /* no positive */);
   });
 });
 export async function _testNeg(readDf: DfReaderFunc, colName: string) {
   const df: DG.DataFrame = await readDf();
-  const col: DG.Column = df.col(colName)!;
+  const col: DG.Column = df.getCol(colName)!;
   const semType: string = await grok.functions
     .call('Bio:detectMacromolecule', {col: col}) as unknown as string;
   if (semType)
@@ -429,14 +404,14 @@ export async function _testPos(
   if (semType)
     col.semType = semType;
-  expect(col.semType === DG.SEMTYPE.MACROMOLECULE, true);
+  expect(col.semType, DG.SEMTYPE.MACROMOLECULE);
   expect(col.getTag(DG.TAGS.UNITS), units);
-  expect(col.getTag(bio.TAGS.aligned), aligned);
-  expect(col.getTag(bio.TAGS.alphabet), alphabet);
+  expect(col.getTag(bioTAGS.aligned), aligned);
+  expect(col.getTag(bioTAGS.alphabet), alphabet);
   if (separator)
-    expect(col.getTag(bio.TAGS.separator), separator);
+    expect(col.getTag(bioTAGS.separator), separator);
-  const uh = new bio.UnitsHandler(col);
+  const uh = new UnitsHandler(col);
   expect(uh.getAlphabetSize(), alphabetSize);
   expect(uh.getAlphabetIsMultichar(), alphabetIsMultichar);
   if (!uh.isHelm()) {
@@ -445,3 +420,40 @@ export async function _testPos(
   }
 }
+class PosCol {
+  constructor(
+    public readonly units: string,
+    public readonly aligned: string | null,
+    public readonly alphabet: string | null,
+    public readonly alphabetSize: number,
+    public readonly alphabetIsMultichar: boolean,
+    public readonly separator?: string
+  ) { };
+};
+export async function _testDf(readDf: DfReaderFunc, posCols: { [colName: string]: PosCol }): Promise<void> {
+  const df: DG.DataFrame = await readDf();
+  const errList: string[] = [];
+  for (const colName of df.columns.names()) {
+    if (colName in posCols) {
+      const p = posCols[colName];
+      try {
+        await _testPos(readDf, colName, p.units, p.aligned, p.alphabet,
+          p.alphabetSize, p.alphabetIsMultichar, p.separator);
+      } catch (err: any) {
+        const errMsg: string = err.toString();
+        errList.push(`Positive col '${colName}' failed: ${errMsg}`);
+      }
+    } else {
+      try {
+        await _testNeg(readDf, colName);
+      } catch (err: any) {
+        const errMsg: string = err.toString();
+        errList.push(`Negative col '${colName}' failed: ${errMsg}`);
+      }
+    }
+  }
+  if (errList.length > 0)
+    throw new Error(errList.join('\n'));
+}

package/src/tests/fasta-export-tests.ts CHANGED Viewed

@@ -1,15 +1,14 @@
 import * as DG from 'datagrok-api/dg';
 import * as ui from 'datagrok-api/ui';
 import * as grok from 'datagrok-api/grok';
-import * as bio from '@datagrok-libraries/bio';
 import {category, expect, expectArray, test} from '@datagrok-libraries/utils/src/test';
 import {saveAsFastaDo, wrapSequence} from '../utils/save-as-fasta';
+import {splitterAsFasta} from '@datagrok-libraries/bio/src/utils/macromolecule';
 type SaveAsFastaTestArgs = { srcCsv: string, idCols: string [], seqCol: string, lineWidth: number, tgtFasta: string };
 category('fastaExport', () => {
   enum WrapDataTest {
     single = 'single',
     multi = 'multi'
@@ -88,7 +87,7 @@ MRGGL
   });
   function _testWrapSequence(testKey: string, lineWidth: number = 10) {
-    const splitter = bio.splitterAsFasta;
+    const splitter = splitterAsFasta;
     const srcSeq: string = wrapData[testKey].src;
     const wrapRes: string[] = wrapSequence(srcSeq, splitter, lineWidth);

package/src/tests/monomer-libraries-tests.ts ADDED Viewed

@@ -0,0 +1,34 @@
+import * as grok from 'datagrok-api/grok';
+import * as DG from 'datagrok-api/dg';
+import * as ui from 'datagrok-api/ui';
+import {test, after, before, category, expect} from '@datagrok-libraries/utils/src/test';
+import {getMonomerLibHelper, IMonomerLibHelper} from '@datagrok-libraries/bio/src/monomer-works/monomer-utils';
+import {LIB_STORAGE_NAME} from '../utils/monomer-lib';
+category('monomerLibraries', () => {
+  let monomerLibHelper: IMonomerLibHelper;
+  /** Backup actual user's monomer libraries settings */
+  let userLibrariesSettings: any = null;
+  before(async () => {
+    monomerLibHelper = await getMonomerLibHelper();
+    userLibrariesSettings = await grok.dapi.userDataStorage.get(LIB_STORAGE_NAME, true);
+  });
+  after(async () => {
+    await grok.dapi.userDataStorage.put(LIB_STORAGE_NAME, userLibrariesSettings, true);
+  });
+  test('default', async () => {
+    // Clear settings to test default
+    await grok.dapi.userDataStorage.put(LIB_STORAGE_NAME, {}, true);
+    await monomerLibHelper.loadLibraries(true); // test defaultLib
+    // Currently default monomer lib is empty
+    const currentMonomerLib = monomerLibHelper.getBioLib();
+    expect(currentMonomerLib.getTypes().length, 0);
+  });
+});

package/src/tests/pepsea-tests.ts ADDED Viewed

@@ -0,0 +1,21 @@
+import * as DG from 'datagrok-api/dg';
+import {category, expect, test} from '@datagrok-libraries/utils/src/test';
+import {runPepsea} from '../utils/pepsea';
+category('PepSeA', () => {
+  const testCsv = `HELM,MSA
+  "PEPTIDE1{F.L.R.G.W.[MeF].Y.S.N.N.C}$$$$","F.L.R.G.W.MeF.Y..S.N.N.C"
+  "PEPTIDE1{F.L.R.G.Y.[MeF].Y.W.N.C}$$$$","F.L.R.G.Y.MeF.Y.W...N.C"
+  "PEPTIDE1{F.G.Y.[MeF].Y.W.S.D.N.C}$$$$","F...G.Y.MeF.Y.W.S.D.N.C"
+  "PEPTIDE1{F.L.R.G.Y.[MeF].Y.W.S.N.D.C}$$$$","F.L.R.G.Y.MeF.Y.W.S.N.D.C"
+  "PEPTIDE1{F.V.R.G.Y.[MeF].Y.W.S.N.C}$$$$","F.V.R.G.Y.MeF.Y.W.S..N.C"`;
+  test('Basic alignment', async () => {
+    const table = DG.DataFrame.fromCsv(testCsv);
+    const alignedCol = await runPepsea(table.getCol('HELM'), 'msa(HELM)');
+    const alignedTestCol = table.getCol('MSA');
+    for (let i = 0; i < alignedCol.length; ++i)
+      expect(alignedCol.get(i) == alignedTestCol.get(i), true);
+  }, {skipReason: 'GROK-12764'});
+});