npm - @datagrok/bio - Versions diffs - 1.5.3 → 1.5.6 - Mend

@datagrok/bio 1.5.3 → 1.5.6

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (20) hide show

package/detectors.js +11 -0
package/dist/package-test.js +548 -86
package/dist/package.js +520 -67
package/files/samples/sample_HELM.csv +540 -540
package/files/samples/sample_MSA.csv +540 -540
package/files/samples/sar-small.csv +201 -0
package/package.json +5 -4
package/src/const.ts +0 -1
package/src/package.ts +37 -14
package/src/tests/activity-cliffs-tests.ts +1 -0
package/src/tests/convert-test.ts +31 -0
package/src/tests/detectors-test.ts +30 -15
package/src/utils/atomic-works.ts +252 -0
package/src/utils/convert.ts +15 -3
package/src/utils/multiple-sequence-alignment.ts +13 -8
package/src/utils/notation-converter.ts +131 -0
package/src/utils/sequence-space.ts +4 -4
package/src/utils/split-to-monomers.ts +8 -0
package/src/utils/utils.ts +40 -0
package/tsconfig.json +1 -1

package/files/samples/sar-small.csv ADDED Viewed

@@ -0,0 +1,201 @@
+smiles
+O=C1CN=C(c2ccccc2N1)C3CCCCC3
+CN1C(=O)CN=C(c2ccccc12)C3CCCCC3
+CCCCN1C(=O)CN=C(c2ccccc12)C3CCCCC3
+CC(C)CCN1C(=O)CN=C(c2ccccc12)C3CCCCC3
+O=C1CN=C(c2ccccc2N1CC3CCCCC3)C4CCCCC4
+O=C1CN=C(c2cc(Cl)ccc2N1)C3CCCCC3
+CN1C(=O)CN=C(c2cc(Cl)ccc12)C3CCCCC3
+CCCCN1C(=O)CN=C(c2cc(Cl)ccc12)C3CCCCC3
+CC(C)CCN1C(=O)CN=C(c2cc(Cl)ccc12)C3CCCCC3
+O=C1CN=C(c2cc(Cl)ccc2N1CC3CCCCC3)C4CCCCC4
+N#Cc1ccc2NC(=O)CN=C(c2c1)C3CCCCC3
+CN1C(=O)CN=C(c2cc(C#N)ccc12)C3CCCCC3
+CCCCN1C(=O)CN=C(c2cc(C#N)ccc12)C3CCCCC3
+CC(C)CCN1C(=O)CN=C(c2cc(C#N)ccc12)C3CCCCC3
+N#Cc1ccc2c(c1)C(=NCC(=O)N2CC3CCCCC3)C4CCCCC4
+CN(C)c1ccc2NC(=O)CN=C(c2c1)C3CCCCC3
+CN(C)c1ccc2c(c1)C(=NCC(=O)N2C)C3CCCCC3
+CCCCN1C(=O)CN=C(c2cc(ccc12)N(C)C)C3CCCCC3
+CC(C)CCN1C(=O)CN=C(c2cc(ccc12)N(C)C)C3CCCCC3
+CN(C)c1ccc2c(c1)C(=NCC(=O)N2CC3CCCCC3)C4CCCCC4
+O=C1CN=C(c2cc(F)ccc2N1)C3CCCCC3
+CN1C(=O)CN=C(c2cc(F)ccc12)C3CCCCC3
+CCCCN1C(=O)CN=C(c2cc(F)ccc12)C3CCCCC3
+CC(C)CCN1C(=O)CN=C(c2cc(F)ccc12)C3CCCCC3
+O=C1CN=C(c2cc(F)ccc2N1CC3CCCCC3)C4CCCCC4
+O=C1CN=C(c2cc(Br)ccc2N1)C3CCCCC3
+CN1C(=O)CN=C(c2cc(Br)ccc12)C3CCCCC3
+CCCCN1C(=O)CN=C(c2cc(Br)ccc12)C3CCCCC3
+CC(C)CCN1C(=O)CN=C(c2cc(Br)ccc12)C3CCCCC3
+O=C1CN=C(c2cc(Br)ccc2N1CC3CCCCC3)C4CCCCC4
+O=C1CN=C(c2cc(I)ccc2N1)C3CCCCC3
+CN1C(=O)CN=C(c2cc(I)ccc12)C3CCCCC3
+CCCCN1C(=O)CN=C(c2cc(I)ccc12)C3CCCCC3
+CC(C)CCN1C(=O)CN=C(c2cc(I)ccc12)C3CCCCC3
+O=C1CN=C(c2cc(I)ccc2N1CC3CCCCC3)C4CCCCC4
+NC(=O)c1ccc2NC(=O)CN=C(c2c1)C3CCCCC3
+CN1C(=O)CN=C(c2cc(ccc12)C(N)=O)C3CCCCC3
+CCCCN1C(=O)CN=C(c2cc(ccc12)C(N)=O)C3CCCCC3
+CC(C)CCN1C(=O)CN=C(c2cc(ccc12)C(N)=O)C3CCCCC3
+NC(=O)c1ccc2c(c1)C(=NCC(=O)N2CC3CCCCC3)C4CCCCC4
+O=C1CN=C(c2cc(ccc2N1)[N+](=O)[O-])C3CCCCC3
+CN1C(=O)CN=C(c2cc(ccc12)[N+](=O)[O-])C3CCCCC3
+CCCCN1C(=O)CN=C(c2cc(ccc12)[N+](=O)[O-])C3CCCCC3
+CC(C)CCN1C(=O)CN=C(c2cc(ccc12)[N+](=O)[O-])C3CCCCC3
+O=C1CN=C(c2cc(ccc2N1CC3CCCCC3)[N+](=O)[O-])C4CCCCC4
+O=C1CN=C(c2ccccc2)c3ccccc3N1
+CN1C(=O)CN=C(c2ccccc2)c3ccccc13
+CCCCN1C(=O)CN=C(c2ccccc2)c3ccccc13
+CC(C)CCN1C(=O)CN=C(c2ccccc2)c3ccccc13
+O=C1CN=C(c2ccccc2)c3ccccc3N1CC4CCCCC4
+O=C1CN=C(c2ccccc2)c3cc(Cl)ccc3N1
+CN1C(=O)CN=C(c2ccccc2)c3cc(Cl)ccc13
+CCCCN1C(=O)CN=C(c2ccccc2)c3cc(Cl)ccc13
+CC(C)CCN1C(=O)CN=C(c2ccccc2)c3cc(Cl)ccc13
+O=C1CN=C(c2ccccc2)c3cc(Cl)ccc3N1CC4CCCCC4
+N#Cc1ccc2NC(=O)CN=C(c3ccccc3)c2c1
+CN1C(=O)CN=C(c2ccccc2)c3cc(C#N)ccc13
+CCCCN1C(=O)CN=C(c2ccccc2)c3cc(C#N)ccc13
+CC(C)CCN1C(=O)CN=C(c2ccccc2)c3cc(C#N)ccc13
+N#Cc1ccc2c(c1)C(=NCC(=O)N2CC3CCCCC3)c4ccccc4
+CN(C)c1ccc2NC(=O)CN=C(c3ccccc3)c2c1
+CN(C)c1ccc2c(c1)C(=NCC(=O)N2C)c3ccccc3
+CCCCN1C(=O)CN=C(c2ccccc2)c3cc(ccc13)N(C)C
+CC(C)CCN1C(=O)CN=C(c2ccccc2)c3cc(ccc13)N(C)C
+CN(C)c1ccc2c(c1)C(=NCC(=O)N2CC3CCCCC3)c4ccccc4
+O=C1CN=C(c2ccccc2)c3cc(F)ccc3N1
+CN1C(=O)CN=C(c2ccccc2)c3cc(F)ccc13
+CCCCN1C(=O)CN=C(c2ccccc2)c3cc(F)ccc13
+CC(C)CCN1C(=O)CN=C(c2ccccc2)c3cc(F)ccc13
+O=C1CN=C(c2ccccc2)c3cc(F)ccc3N1CC4CCCCC4
+O=C1CN=C(c2ccccc2)c3cc(Br)ccc3N1
+CN1C(=O)CN=C(c2ccccc2)c3cc(Br)ccc13
+CCCCN1C(=O)CN=C(c2ccccc2)c3cc(Br)ccc13
+CC(C)CCN1C(=O)CN=C(c2ccccc2)c3cc(Br)ccc13
+O=C1CN=C(c2ccccc2)c3cc(Br)ccc3N1CC4CCCCC4
+O=C1CN=C(c2ccccc2)c3cc(I)ccc3N1
+CN1C(=O)CN=C(c2ccccc2)c3cc(I)ccc13
+CCCCN1C(=O)CN=C(c2ccccc2)c3cc(I)ccc13
+CC(C)CCN1C(=O)CN=C(c2ccccc2)c3cc(I)ccc13
+O=C1CN=C(c2ccccc2)c3cc(I)ccc3N1CC4CCCCC4
+NC(=O)c1ccc2NC(=O)CN=C(c3ccccc3)c2c1
+CN1C(=O)CN=C(c2ccccc2)c3cc(ccc13)C(N)=O
+CCCCN1C(=O)CN=C(c2ccccc2)c3cc(ccc13)C(N)=O
+CC(C)CCN1C(=O)CN=C(c2ccccc2)c3cc(ccc13)C(N)=O
+NC(=O)c1ccc2c(c1)C(=NCC(=O)N2CC3CCCCC3)c4ccccc4
+O=C1CN=C(c2ccccc2)c3cc(ccc3N1)[N+](=O)[O-]
+CN1C(=O)CN=C(c2ccccc2)c3cc(ccc13)[N+](=O)[O-]
+CCCCN1C(=O)CN=C(c2ccccc2)c3cc(ccc13)[N+](=O)[O-]
+CC(C)CCN1C(=O)CN=C(c2ccccc2)c3cc(ccc13)[N+](=O)[O-]
+O=C1CN=C(c2ccccc2)c3cc(ccc3N1CC4CCCCC4)[N+](=O)[O-]
+COc1ccc(cc1)C2=NCC(=O)Nc3ccccc23
+COc1ccc(cc1)C2=NCC(=O)N(C)c3ccccc23
+CCCCN1C(=O)CN=C(c2ccc(cc2)OC)c3ccccc13
+COc1ccc(cc1)C2=NCC(=O)N(CCC(C)C)c3ccccc23
+COc1ccc(cc1)C2=NCC(=O)N(CC3CCCCC3)c4ccccc24
+COc1ccc(cc1)C2=NCC(=O)Nc3ccc(Cl)cc23
+COc1ccc(cc1)C2=NCC(=O)N(C)c3ccc(Cl)cc23
+CCCCN1C(=O)CN=C(c2ccc(cc2)OC)c3cc(Cl)ccc13
+COc1ccc(cc1)C2=NCC(=O)N(CCC(C)C)c3ccc(Cl)cc23
+COc1ccc(cc1)C2=NCC(=O)N(CC3CCCCC3)c4ccc(Cl)cc24
+COc1ccc(cc1)C2=NCC(=O)Nc3ccc(C#N)cc23
+COc1ccc(cc1)C2=NCC(=O)N(C)c3ccc(C#N)cc23
+CCCCN1C(=O)CN=C(c2ccc(cc2)OC)c3cc(C#N)ccc13
+COc1ccc(cc1)C2=NCC(=O)N(CCC(C)C)c3ccc(C#N)cc23
+COc1ccc(cc1)C2=NCC(=O)N(CC3CCCCC3)c4ccc(C#N)cc24
+COc1ccc(cc1)C2=NCC(=O)Nc3ccc(cc23)N(C)C
+COc1ccc(cc1)C2=NCC(=O)N(C)c3ccc(cc23)N(C)C
+CCCCN1C(=O)CN=C(c2ccc(cc2)OC)c3cc(ccc13)N(C)C
+COc1ccc(cc1)C2=NCC(=O)N(CCC(C)C)c3ccc(cc23)N(C)C
+COc1ccc(cc1)C2=NCC(=O)N(CC3CCCCC3)c4ccc(cc24)N(C)C
+COc1ccc(cc1)C2=NCC(=O)Nc3ccc(F)cc23
+COc1ccc(cc1)C2=NCC(=O)N(C)c3ccc(F)cc23
+CCCCN1C(=O)CN=C(c2ccc(cc2)OC)c3cc(F)ccc13
+COc1ccc(cc1)C2=NCC(=O)N(CCC(C)C)c3ccc(F)cc23
+COc1ccc(cc1)C2=NCC(=O)N(CC3CCCCC3)c4ccc(F)cc24
+COc1ccc(cc1)C2=NCC(=O)Nc3ccc(Br)cc23
+COc1ccc(cc1)C2=NCC(=O)N(C)c3ccc(Br)cc23
+CCCCN1C(=O)CN=C(c2ccc(cc2)OC)c3cc(Br)ccc13
+COc1ccc(cc1)C2=NCC(=O)N(CCC(C)C)c3ccc(Br)cc23
+COc1ccc(cc1)C2=NCC(=O)N(CC3CCCCC3)c4ccc(Br)cc24
+COc1ccc(cc1)C2=NCC(=O)Nc3ccc(I)cc23
+COc1ccc(cc1)C2=NCC(=O)N(C)c3ccc(I)cc23
+CCCCN1C(=O)CN=C(c2ccc(cc2)OC)c3cc(I)ccc13
+COc1ccc(cc1)C2=NCC(=O)N(CCC(C)C)c3ccc(I)cc23
+COc1ccc(cc1)C2=NCC(=O)N(CC3CCCCC3)c4ccc(I)cc24
+COc1ccc(cc1)C2=NCC(=O)Nc3ccc(cc23)C(N)=O
+COc1ccc(cc1)C2=NCC(=O)N(C)c3ccc(cc23)C(N)=O
+CCCCN1C(=O)CN=C(c2ccc(cc2)OC)c3cc(ccc13)C(N)=O
+COc1ccc(cc1)C2=NCC(=O)N(CCC(C)C)c3ccc(cc23)C(N)=O
+COc1ccc(cc1)C2=NCC(=O)N(CC3CCCCC3)c4ccc(cc24)C(N)=O
+COc1ccc(cc1)C2=NCC(=O)Nc3ccc(cc23)[N+](=O)[O-]
+COc1ccc(cc1)C2=NCC(=O)N(C)c3ccc(cc23)[N+](=O)[O-]
+CCCCN1C(=O)CN=C(c2ccc(cc2)OC)c3cc(ccc13)[N+](=O)[O-]
+COc1ccc(cc1)C2=NCC(=O)N(CCC(C)C)c3ccc(cc23)[N+](=O)[O-]
+COc1ccc(cc1)C2=NCC(=O)N(CC3CCCCC3)c4ccc(cc24)[N+](=O)[O-]
+CC1N=C(c2ccccc2NC1=O)C3CCCCC3
+CC1N=C(c2ccccc2N(C)C1=O)C3CCCCC3
+CCCCN1C(=O)C(C)N=C(c2ccccc12)C3CCCCC3
+CC(C)CCN1C(=O)C(C)N=C(c2ccccc12)C3CCCCC3
+CC1N=C(c2ccccc2N(CC3CCCCC3)C1=O)C4CCCCC4
+CC1N=C(c2cc(Cl)ccc2NC1=O)C3CCCCC3
+CC1N=C(c2cc(Cl)ccc2N(C)C1=O)C3CCCCC3
+CCCCN1C(=O)C(C)N=C(c2cc(Cl)ccc12)C3CCCCC3
+CC(C)CCN1C(=O)C(C)N=C(c2cc(Cl)ccc12)C3CCCCC3
+CC1N=C(c2cc(Cl)ccc2N(CC3CCCCC3)C1=O)C4CCCCC4
+CC1N=C(c2cc(C#N)ccc2NC1=O)C3CCCCC3
+CC1N=C(c2cc(C#N)ccc2N(C)C1=O)C3CCCCC3
+CCCCN1C(=O)C(C)N=C(c2cc(C#N)ccc12)C3CCCCC3
+CC(C)CCN1C(=O)C(C)N=C(c2cc(C#N)ccc12)C3CCCCC3
+CC1N=C(c2cc(C#N)ccc2N(CC3CCCCC3)C1=O)C4CCCCC4
+CC1N=C(c2cc(ccc2NC1=O)N(C)C)C3CCCCC3
+CC1N=C(c2cc(ccc2N(C)C1=O)N(C)C)C3CCCCC3
+CCCCN1C(=O)C(C)N=C(c2cc(ccc12)N(C)C)C3CCCCC3
+CC(C)CCN1C(=O)C(C)N=C(c2cc(ccc12)N(C)C)C3CCCCC3
+CC1N=C(c2cc(ccc2N(CC3CCCCC3)C1=O)N(C)C)C4CCCCC4
+CC1N=C(c2cc(F)ccc2NC1=O)C3CCCCC3
+CC1N=C(c2cc(F)ccc2N(C)C1=O)C3CCCCC3
+CCCCN1C(=O)C(C)N=C(c2cc(F)ccc12)C3CCCCC3
+CC(C)CCN1C(=O)C(C)N=C(c2cc(F)ccc12)C3CCCCC3
+CC1N=C(c2cc(F)ccc2N(CC3CCCCC3)C1=O)C4CCCCC4
+CC1N=C(c2cc(Br)ccc2NC1=O)C3CCCCC3
+CC1N=C(c2cc(Br)ccc2N(C)C1=O)C3CCCCC3
+CCCCN1C(=O)C(C)N=C(c2cc(Br)ccc12)C3CCCCC3
+CC(C)CCN1C(=O)C(C)N=C(c2cc(Br)ccc12)C3CCCCC3
+CC1N=C(c2cc(Br)ccc2N(CC3CCCCC3)C1=O)C4CCCCC4
+CC1N=C(c2cc(I)ccc2NC1=O)C3CCCCC3
+CC1N=C(c2cc(I)ccc2N(C)C1=O)C3CCCCC3
+CCCCN1C(=O)C(C)N=C(c2cc(I)ccc12)C3CCCCC3
+CC(C)CCN1C(=O)C(C)N=C(c2cc(I)ccc12)C3CCCCC3
+CC1N=C(c2cc(I)ccc2N(CC3CCCCC3)C1=O)C4CCCCC4
+CC1N=C(c2cc(ccc2NC1=O)C(N)=O)C3CCCCC3
+CC1N=C(c2cc(ccc2N(C)C1=O)C(N)=O)C3CCCCC3
+CCCCN1C(=O)C(C)N=C(c2cc(ccc12)C(N)=O)C3CCCCC3
+CC(C)CCN1C(=O)C(C)N=C(c2cc(ccc12)C(N)=O)C3CCCCC3
+CC1N=C(c2cc(ccc2N(CC3CCCCC3)C1=O)C(N)=O)C4CCCCC4
+CC1N=C(c2cc(ccc2NC1=O)[N+](=O)[O-])C3CCCCC3
+CC1N=C(c2cc(ccc2N(C)C1=O)[N+](=O)[O-])C3CCCCC3
+CCCCN1C(=O)C(C)N=C(c2cc(ccc12)[N+](=O)[O-])C3CCCCC3
+CC(C)CCN1C(=O)C(C)N=C(c2cc(ccc12)[N+](=O)[O-])C3CCCCC3
+CC1N=C(c2cc(ccc2N(CC3CCCCC3)C1=O)[N+](=O)[O-])C4CCCCC4
+CC1N=C(c2ccccc2)c3ccccc3NC1=O
+CC1N=C(c2ccccc2)c3ccccc3N(C)C1=O
+CCCCN1C(=O)C(C)N=C(c2ccccc2)c3ccccc13
+CC(C)CCN1C(=O)C(C)N=C(c2ccccc2)c3ccccc13
+CC1N=C(c2ccccc2)c3ccccc3N(CC4CCCCC4)C1=O
+CC1N=C(c2ccccc2)c3cc(Cl)ccc3NC1=O
+CC1N=C(c2ccccc2)c3cc(Cl)ccc3N(C)C1=O
+CCCCN1C(=O)C(C)N=C(c2ccccc2)c3cc(Cl)ccc13
+CC(C)CCN1C(=O)C(C)N=C(c2ccccc2)c3cc(Cl)ccc13
+CC1N=C(c2ccccc2)c3cc(Cl)ccc3N(CC4CCCCC4)C1=O
+CC1N=C(c2ccccc2)c3cc(C#N)ccc3NC1=O
+CC1N=C(c2ccccc2)c3cc(C#N)ccc3N(C)C1=O
+CCCCN1C(=O)C(C)N=C(c2ccccc2)c3cc(C#N)ccc13
+CC(C)CCN1C(=O)C(C)N=C(c2ccccc2)c3cc(C#N)ccc13
+CC1N=C(c2ccccc2)c3cc(C#N)ccc3N(CC4CCCCC4)C1=O
+CC1N=C(c2ccccc2)c3cc(ccc3NC1=O)N(C)C
+CC1N=C(c2ccccc2)c3cc(ccc3N(C)C1=O)N(C)C
+CCCCN1C(=O)C(C)N=C(c2ccccc2)c3cc(ccc13)N(C)C
+CC(C)CCN1C(=O)C(C)N=C(c2ccccc2)c3cc(ccc13)N(C)C
+CC1N=C(c2ccccc2)c3cc(ccc3N(CC4CCCCC4)C1=O)N(C)C

package/package.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "name": "@datagrok/bio",
   "beta": false,
   "friendlyName": "Bio",
-  "version": "1.5.3",
+  "version": "1.5.6",
   "description": "Bio is a [package](https://datagrok.ai/help/develop/develop#packages) for the [Datagrok](https://datagrok.ai) platform",
   "repository": {
     "type": "git",
@@ -11,14 +11,15 @@
   },
   "dependencies": {
     "@biowasm/aioli": ">=2.4.0",
-    "@datagrok-libraries/bio": "^2.3.1",
+    "@datagrok-libraries/bio": "^2.4.0",
     "@datagrok-libraries/utils": "^1.0.0",
-    "@datagrok-libraries/ml": "^2.0.8",
+    "@datagrok-libraries/ml": "^2.0.9",
     "cash-dom": "latest",
     "datagrok-api": "^1.4.12",
     "dayjs": "latest",
     "ts-loader": "^9.2.5",
-    "typescript": "^4.4.2"
+    "typescript": "^4.4.2",
+    "openchemlib": "6.0.1"
   },
   "devDependencies": {
     "@types/jest": "^27.0.0",

package/src/const.ts CHANGED Viewed

@@ -2,4 +2,3 @@ import * as ui from 'datagrok-api/ui';
 import * as grok from 'datagrok-api/grok';
 import * as DG from 'datagrok-api/dg';
-export const mmSemType = 'Macromolecule';

package/src/package.ts CHANGED Viewed

@@ -5,7 +5,6 @@ import * as DG from 'datagrok-api/dg';
 export const _package = new DG.Package();
-import {mmSemType} from './const';
 import {WebLogo, SeqColStats} from '@datagrok-libraries/bio/src/viewers/web-logo';
 import {VdRegionsViewer} from './viewers/vd-regions-viewer';
 import {runKalign, testMSAEnoughMemory} from './utils/multiple-sequence-alignment';
@@ -17,6 +16,8 @@ import {getEmbeddingColsNames, sequenceSpace} from './utils/sequence-space';
 import {AvailableMetrics} from '@datagrok-libraries/ml/src/typed-metrics';
 import {getActivityCliffs} from '@datagrok-libraries/ml/src/viewers/activity-cliffs';
 import {sequenceGetSimilarities, drawTooltip} from './utils/sequence-activity-cliffs';
+import { getMolfilesFromSeq, HELM_CORE_LIB_FILENAME } from './utils/utils';
+import {getMacroMol} from './utils/atomic-works';
 //name: sequenceAlignment
 //input: string alignType {choices: ['Local alignment', 'Global alignment']}
@@ -51,7 +52,7 @@ export function vdRegionViewer() {
 //top-menu: Bio | Sequence Activity Cliffs...
 //name: Sequence Activity Cliffs
 //description: detect activity cliffs
-//input: dataframe df [Input data table]
+//input: dataframe table [Input data table]
 //input: column sequence {semType: Macromolecule}
 //input: column activities
 //input: double similarity = 80 [Similarity cutoff]
@@ -67,6 +68,7 @@ export async function activityCliffs(df: DG.DataFrame, sequence: DG.Column, acti
     df,
     sequence,
     axesNames,
+    'Activity cliffs',
     activities,
     similarity,
     'Levenshtein',
@@ -102,11 +104,29 @@ export async function sequenceSpaceTopMenu(table: DG.DataFrame, macroMolecule: D
   if (plotEmbeddings) {
     for (const v of grok.shell.views) {
       if (v.name === table.name)
-        (v as DG.TableView).scatterPlot({x: embedColsNames[0], y: embedColsNames[1]});
+        (v as DG.TableView).scatterPlot({x: embedColsNames[0], y: embedColsNames[1], title: 'Sequence space'});
     }
   }
 };
+//top-menu: Bio | Molfiles From HELM...
+//name: Molfiles From HELM
+//description: returns molfiles for each monomer from HELM library
+//input: dataframe df [Input data table]
+//input: column sequence {semType: Macromolecule}
+export async function molfilesFromHELM(df: DG.DataFrame, sequence: DG.Column): Promise<void> {
+  const monomersLibFile = await _package.files.readAsText(HELM_CORE_LIB_FILENAME);
+  const monomersLibDf = DG.DataFrame.fromJson(monomersLibFile);
+  const atomicCodes = getMolfilesFromSeq(sequence, monomersLibDf);
+  let result: string[] = [];
+  for(let i = 0; i < atomicCodes!.length; i++)
+    result.push(getMacroMol(atomicCodes![i]));
+  df.columns.add(DG.Column.fromStrings('regenerated', result));
+}
 //top-menu: Bio | MSA...
 //name: MSA
 //input: dataframe table
@@ -120,20 +140,23 @@ export async function multipleSequenceAlignmentAny(table: DG.DataFrame, col: DG.
 //top-menu: Bio | Composition Analysis
 //output: viewer result
 export async function compositionAnalysis(): Promise<void> {
-  const col = grok.shell.t.columns.bySemType('Macromolecule');//DG.SEMTYPE.MACROMOLECULE);
-  if (col === null) {
+  // Higher priority for columns with MSA data to show with WebLogo.
+  const tv = grok.shell.tv;
+  const df = tv.dataFrame;
+  const semTypeColList = df.columns.bySemTypeAll(DG.SEMTYPE.MACROMOLECULE);
+  let col: DG.Column | undefined = semTypeColList.find((col) => {
+    const units = col.getTag(DG.TAGS.UNITS);
+    return units ? units.indexOf('MSA') !== -1 : false;
+  });
+  if (!col)
+    col = semTypeColList[0];
+  if (!col) {
     grok.shell.error('Current table does not contain sequences');
     return;
   }
-  const wl = await col.dataFrame.plot.fromType('WebLogo', {});
-  for (const v of grok.shell.views) {
-    if (v instanceof DG.TableView && (v as DG.TableView).dataFrame.name === col.dataFrame.name) {
-      (v as DG.TableView).dockManager.dock(wl.root, 'down');
-      break;
-    }
-  }
+  tv.addViewer('WebLogo', {sequenceColumnName: col.name});
 }
 // helper function for importFasta
@@ -182,7 +205,7 @@ export function importFasta(fileContent: string): DG.DataFrame [] {
     (c) => WebLogo.getAlphabetSimilarity(stats.freq, c[1]));
   const maxCos = Math.max(...alphabetCandidatesSim);
   const alphabet = maxCos > 0.65 ? alphabetCandidates[alphabetCandidatesSim.indexOf(maxCos)][0] : 'UN';
-  sequenceCol.semType = mmSemType;
+  sequenceCol.semType = DG.SEMTYPE.MACROMOLECULE;
   const units: string = `fasta:${seqType}:${alphabet}`;
   sequenceCol.setTag(DG.TAGS.UNITS, units);

package/src/tests/activity-cliffs-tests.ts CHANGED Viewed

@@ -26,6 +26,7 @@ category('activityCliffs', async () => {
       actCliffsDf,
       actCliffsDf.col('MSA')!,
       axesNames,
+      'Activity cliffs',
       actCliffsDf.col('Activity')!,
       50,
       'Levenshtein',

package/src/tests/convert-test.ts ADDED Viewed

@@ -0,0 +1,31 @@
+import {after, before, category, test, expect, expectObject} from '@datagrok-libraries/utils/src/test';
+import * as grok from 'datagrok-api/grok';
+import * as ui from 'datagrok-api/ui';
+import * as DG from 'datagrok-api/dg';
+// import {mmSemType} from '../const';
+// import {importFasta} from '../package';
+category('converters', () => {
+//   test('a', async () => {await _a();});
+//   test('b', async () => {await _b();});
+  test('testFastaToSeparator', async () => { await _testFastaToSeparator(); });
+  test('testSeparatorToFasta', async () => { await _testSeparatorToFasta(); });
+});
+// export async function _a() {
+//   expect(1, 1);
+// }
+//
+// export async function _b() {
+//   expect(1, 2);
+// }
+export async function _testFastaToSeparator() {
+  expect(1, 1);
+}
+export async function _testSeparatorToFasta() {
+  expect(1, 2);
+}

package/src/tests/detectors-test.ts CHANGED Viewed

@@ -4,7 +4,6 @@ import * as grok from 'datagrok-api/grok';
 import * as ui from 'datagrok-api/ui';
 import * as DG from 'datagrok-api/dg';
-import {mmSemType} from '../const';
 import {importFasta} from '../package';
 type DfReaderFunc = () => Promise<DG.DataFrame>;
@@ -94,6 +93,8 @@ MWRSWY-CKHP
     fastaCsv = 'FastaCsv',
     msaComplex = 'MsaComplex',
     idCsv = 'IdCsv',
+    sarSmallCsv = 'SarSmallCsv',
+    HelmCsv = 'HelmCsv',
   }
   const samples: { [key: string]: string } = {
@@ -101,6 +102,8 @@ MWRSWY-CKHP
     'FastaCsv': 'System:AppData/Bio/samples/sample_FASTA.csv',
     'MsaComplex': 'System:AppData/Bio/samples/sample_MSA.csv',
     'IdCsv': 'System:AppData/Bio/samples/id.csv',
+    'SarSmallCsv': 'System:AppData/Bio/samples/sar-small.csv',
+    'HelmCsv': 'System:AppData/Bio/samples/sample_HELM.csv',
   };
   const _samplesDfs: { [key: string]: Promise<DG.DataFrame> } = {};
@@ -189,20 +192,32 @@ MWRSWY-CKHP
   test('samplesIdCsvNegativeID', async () => {
     await _testNeg(readSamplesCsv(Samples.idCsv), 'ID');
   });
+  test('samplesSarSmallCsvNegativeSmiles', async () => {
+    await _testNeg(readSamplesCsv(Samples.sarSmallCsv), 'smiles');
+  });
+  test('samplesHelmCsvHELM', async () => {
+    await _testPos(readSamplesCsv(Samples.HelmCsv), 'HELM', 'HELM', null);
+  });
+  test('samplesHelmCsvNegativeActivity', async () => {
+    await _testNeg(readSamplesCsv(Samples.HelmCsv), 'Activity');
+  });
 });
 export async function _testNeg(readDf: DfReaderFunc, colName: string) {
   const df: DG.DataFrame = await readDf();
   const col: DG.Column = df.col(colName)!;
-  expect(col.semType === mmSemType, false);
+  expect(col.semType === DG.SEMTYPE.MACROMOLECULE, false);
 }
-export async function _testPos(readDf: DfReaderFunc, colName: string, units: string, separator: string) {
+export async function _testPos(readDf: DfReaderFunc, colName: string, units: string, separator: string | null = null) {
   const df: DG.DataFrame = await readDf();
   const col: DG.Column = df.col(colName)!;
-  expect(col.semType === mmSemType, true);
+  expect(col.semType === DG.SEMTYPE.MACROMOLECULE, true);
   expect(col.getTag(DG.TAGS.UNITS), units);
   if (separator)
     expect(col.getTag('separator'), separator);
@@ -213,7 +228,7 @@ export async function _testN1(csvDfN1: string) {
   await grok.data.detectSemanticTypes(dfN1);
   const col: DG.Column = dfN1.col('seq')!;
-  expect(col.semType, mmSemType);
+  expect(col.semType, DG.SEMTYPE.MACROMOLECULE);
   expect(col.getTag(DG.TAGS.UNITS), 'fasta:SEQ:NT');
 }
@@ -222,7 +237,7 @@ export async function _testAA1(csvDfAA1: string) {
   await grok.data.detectSemanticTypes(dfAA1);
   const col: DG.Column = dfAA1.col('seq')!;
-  expect(col.semType, mmSemType);
+  expect(col.semType, DG.SEMTYPE.MACROMOLECULE);
   expect(col.getTag(DG.TAGS.UNITS), 'fasta:SEQ:PT');
 }
@@ -231,7 +246,7 @@ export async function _testMsaN1(csvDfMsaN1: string) {
   await grok.data.detectSemanticTypes(dfMsaN1);
   const col: DG.Column = dfMsaN1.col('seq')!;
-  expect(col.semType, mmSemType);
+  expect(col.semType, DG.SEMTYPE.MACROMOLECULE);
   expect(col.getTag(DG.TAGS.UNITS), 'fasta:SEQ.MSA:NT');
 }
@@ -240,7 +255,7 @@ export async function _testMsaAA1(csvDfMsaAA1: string) {
   await grok.data.detectSemanticTypes(dfMsaAA1);
   const col: DG.Column = dfMsaAA1.col('seq')!;
-  expect(col.semType, mmSemType);
+  expect(col.semType, DG.SEMTYPE.MACROMOLECULE);
   expect(col.getTag(DG.TAGS.UNITS), 'fasta:SEQ.MSA:PT');
 }
@@ -249,7 +264,7 @@ export async function _testSepNt(csv: string, separator: string) {
   await grok.data.detectSemanticTypes(df);
   const col: DG.Column = df.col('seq')!;
-  expect(col.semType, mmSemType);
+  expect(col.semType, DG.SEMTYPE.MACROMOLECULE);
   expect(col.getTag(DG.TAGS.UNITS), 'separator:SEQ:NT');
   expect(col.getTag('separator'), separator);
 }
@@ -259,7 +274,7 @@ export async function _testSepPt(csv: string, separator: string) {
   await grok.data.detectSemanticTypes(df);
   const col: DG.Column = df.col('seq')!;
-  expect(col.semType, mmSemType);
+  expect(col.semType, DG.SEMTYPE.MACROMOLECULE);
   expect(col.getTag(DG.TAGS.UNITS), 'separator:SEQ:PT');
   expect(col.getTag('separator'), separator);
 }
@@ -269,7 +284,7 @@ export async function _testSepUn(csv: string, separator: string) {
   await grok.data.detectSemanticTypes(df);
   const col: DG.Column = df.col('seq')!;
-  expect(col.semType, mmSemType);
+  expect(col.semType, DG.SEMTYPE.MACROMOLECULE);
   expect(col.getTag(DG.TAGS.UNITS), 'separator:SEQ:UN');
   expect(col.getTag('separator'), separator);
 }
@@ -279,7 +294,7 @@ export async function _testSepMsaN1(csvDfSepMsaN1: string) {
   await grok.data.detectSemanticTypes(dfSepMsaN1);
   const col: DG.Column = dfSepMsaN1.col('seq')!;
-  expect(col.semType, mmSemType);
+  expect(col.semType, DG.SEMTYPE.MACROMOLECULE);
   expect(col.getTag(DG.TAGS.UNITS), 'separator:SEQ.MSA:NT');
 }
@@ -289,7 +304,7 @@ export async function _testSamplesFastaCsvPt() {
   await grok.data.detectSemanticTypes(df);
   const col: DG.Column = df.col('sequence')!;
-  expect(col.semType, mmSemType);
+  expect(col.semType, DG.SEMTYPE.MACROMOLECULE);
   expect(col.getTag(DG.TAGS.UNITS), 'fasta:SEQ:PT');
   expect(col.getTag('separator'), null);
 }
@@ -299,7 +314,7 @@ export async function _testSamplesFastaFastaPt() {
   const df: DG.DataFrame = importFasta(fasta)[0];
   const col: DG.Column = df.col('sequence')!;
-  expect(col.semType, mmSemType);
+  expect(col.semType, DG.SEMTYPE.MACROMOLECULE);
   expect(col.getTag(DG.TAGS.UNITS), 'fasta:SEQ:PT');
   expect(col.getTag('separator'), null);
 }
@@ -310,7 +325,7 @@ export async function _testSamplesPeptidesComplexUn() {
   await grok.data.detectSemanticTypes(df);
   const col: DG.Column = df.col('AlignedSequence')!;
-  expect(col.semType, mmSemType);
+  expect(col.semType, DG.SEMTYPE.MACROMOLECULE);
   expect(col.getTag(DG.TAGS.UNITS), 'separator:SEQ.MSA:UN');
   expect(col.getTag('separator'), '-');
 }