npm - @platforma-open/milaboratories.immune-assay-data.workflow - Versions diffs - 1.0.2 → 1.1.0 - Mend

@platforma-open/milaboratories.immune-assay-data.workflow 1.0.2 → 1.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (10) hide show

package/.turbo/turbo-build.log +3 -1
package/CHANGELOG.md +6 -0
package/dist/index.cjs +1 -0
package/dist/index.d.ts +1 -1
package/dist/index.js +1 -0
package/dist/tengo/tpl/main.plj.gz +0 -0
package/dist/tengo/tpl/run-alignment.plj.gz +0 -0
package/package.json +3 -2
package/src/main.tpl.tengo +297 -221
package/src/run-alignment.tpl.tengo +47 -0

package/.turbo/turbo-build.log CHANGED Viewed

@@ -1,11 +1,13 @@
  WARN  Issue while reading "/home/runner/work/immune-assay-data/immune-assay-data/.npmrc". Failed to replace env in config: ${NPMJS_TOKEN}
-> @platforma-open/milaboratories.immune-assay-data.workflow@1.0.2 build /home/runner/work/immune-assay-data/immune-assay-data/workflow
+> @platforma-open/milaboratories.immune-assay-data.workflow@1.1.0 build /home/runner/work/immune-assay-data/immune-assay-data/workflow
 > rm -rf dist && pl-tengo check && pl-tengo build
 Processing "src/main.tpl.tengo"...
+Processing "src/run-alignment.tpl.tengo"...
 No syntax errors found.
   info: Compiling 'dist'...
+  info:   - writing /home/runner/work/immune-assay-data/immune-assay-data/workflow/dist/tengo/tpl/run-alignment.plj.gz
   info:   - writing /home/runner/work/immune-assay-data/immune-assay-data/workflow/dist/tengo/tpl/main.plj.gz
   info: Template Pack build done.
   info: Template Pack build done.

package/CHANGELOG.md CHANGED Viewed

@@ -1,5 +1,11 @@
 # @platforma-open/milaboratories.immune-assay-data.workflow
+## 1.1.0
+### Minor Changes
+- 40fd1d2: Updated matching parameters. Handle empty results (no matching clonotypes). Fixed logic for assay sequence column detection. Allow for assay column selection.
 ## 1.0.2
 ### Patch Changes

package/dist/index.cjs CHANGED Viewed

@@ -1,3 +1,4 @@
 module.exports = { Templates: {
+  'run-alignment': { type: 'from-file', path: require.resolve('./tengo/tpl/run-alignment.plj.gz') },
   'main': { type: 'from-file', path: require.resolve('./tengo/tpl/main.plj.gz') }
 }};

package/dist/index.d.ts CHANGED Viewed

@@ -1,4 +1,4 @@
 declare type TemplateFromFile = { readonly type: "from-file"; readonly path: string; };
-declare type TplName = "main";
+declare type TplName = "run-alignment" | "main";
 declare const Templates: Record<TplName, TemplateFromFile>;
 export { Templates };

package/dist/index.js CHANGED Viewed

@@ -1,4 +1,5 @@
 import { resolve } from 'node:path';
 export const Templates = {
+  'run-alignment': { type: 'from-file', path: resolve(import.meta.dirname, './tengo/tpl/run-alignment.plj.gz') },
   'main': { type: 'from-file', path: resolve(import.meta.dirname, './tengo/tpl/main.plj.gz') }
 };

package/dist/tengo/tpl/main.plj.gz CHANGED Viewed

Binary file

package/dist/tengo/tpl/run-alignment.plj.gz ADDED Viewed

Binary file

package/package.json CHANGED Viewed

@@ -1,13 +1,14 @@
 {
   "name": "@platforma-open/milaboratories.immune-assay-data.workflow",
-  "version": "1.0.2",
+  "version": "1.1.0",
   "type": "module",
   "description": "Block Workflow",
   "dependencies": {
     "@platforma-sdk/workflow-tengo": "^4.7.1",
     "@platforma-open/soedinglab.software-mmseqs2": "^1.0.0",
     "@platforma-open/milaboratories.immune-assay-data.prepare-fasta": "1.0.3",
-    "@platforma-open/milaboratories.immune-assay-data.add-header": "1.0.2"
+    "@platforma-open/milaboratories.immune-assay-data.add-header": "1.0.2",
+    "@platforma-open/milaboratories.immune-assay-data.coverage-mode-calc": "1.0.0"
   },
   "devDependencies": {
     "@platforma-sdk/tengo-builder": "^2.1.7",

package/src/main.tpl.tengo CHANGED Viewed

@@ -1,4 +1,3 @@
-// light block with no workflow
 wf := import("@platforma-sdk/workflow-tengo:workflow")
 ll := import("@platforma-sdk/workflow-tengo:ll")
 file := import("@platforma-sdk/workflow-tengo:file")
@@ -10,10 +9,17 @@ pframes := import("@platforma-sdk/workflow-tengo:pframes")
 pSpec := import("@platforma-sdk/workflow-tengo:pframes.spec")
 slices := import("@platforma-sdk/workflow-tengo:slices")
 pt := import("@platforma-sdk/workflow-tengo:pt")
+path := import("@platforma-sdk/workflow-tengo:path")
+json := import("json")
+strings := import("@platforma-sdk/workflow-tengo:strings")
+text := import("text")
+render := import("@platforma-sdk/workflow-tengo:render")
+runAlignmentTpl := assets.importTemplate(":run-alignment")
 prepareFastaSw := assets.importSoftware("@platforma-open/milaboratories.immune-assay-data.prepare-fasta:main")
 mmseqsSw := assets.importSoftware("@platforma-open/soedinglab.software-mmseqs2:main")
 addHeaderSw := assets.importSoftware("@platforma-open/milaboratories.immune-assay-data.add-header:main")
+covModeCalcSw := assets.importSoftware("@platforma-open/milaboratories.immune-assay-data.coverage-mode-calc:main")
 wf.prepare(func(args){
 	bundleBuilder := wf.createPBundleBuilder()
@@ -24,12 +30,12 @@ wf.prepare(func(args){
 	}
 })
-prepareAssayTsv := func(args, file) {
+prepareAssayFile := func(args, file, xsvType) {
 	// assign ids to assay sequences
 	ptw := pt.workflow()
 	df := ptw.frame({
 		file: file,
-		xsvType: "tsv" // @TODO (!!!)
+		xsvType: xsvType
 	})
 	//////// calculate sequence id ////////
@@ -81,9 +87,9 @@ prepareClonesTsv := func(args) {
 /**
  * Convert tsv file to fasta file
  * @param fileTsv - tsv file
- * @return fasta file
+ * @return fasta file run result
  */
-tsv2Fasta := func(fileTsv) {
+runTsvToFasta := func(fileTsv) {
 	e := exec.builder().
 		software(prepareFastaSw).
 		addFile("input.tsv", fileTsv).
@@ -93,7 +99,7 @@ tsv2Fasta := func(fileTsv) {
 		arg("--id_col").arg("seqId").
 		saveFile("output.fasta")
-	return e.run().getFile("output.fasta")
+	return e.run()
 }
 wf.body(func(args) {
@@ -122,13 +128,47 @@ wf.body(func(args) {
 		ll.panic("Assay sequence type is undefined")
 	}
-	assayTsv := prepareAssayTsv(args, importFile.file)
+	handleUrl := ll.parseUrl(args.fileHandle)
+	jsonPayload := handleUrl.Path[1:]
+	fileInfo := json.decode(jsonPayload)
+	fileName := ""
+	if fileInfo.localPath != undefined {
+		fileName = fileInfo.localPath
+	} else if fileInfo.path != undefined {
+		fileName = fileInfo.path
+	} else {
+		ll.panic("Could not determine filename from file handle: ", args.fileHandle)
+	}
+	fileNameParts := path.split(fileName, ".")
+	xsvType := "tsv"
+	if len(fileNameParts) > 1 {
+		xsvType = fileNameParts[len(fileNameParts)-1]
+	}
+	assayTsv := prepareAssayFile(args, importFile.file, xsvType)
 	clonesTsv := prepareClonesTsv(args)
 	// prepare fasta
-	clonesFasta := tsv2Fasta(clonesTsv)
-	assayFasta := tsv2Fasta(assayTsv)
+	clonesFastaRun := runTsvToFasta(clonesTsv)
+	assayFastaRun := runTsvToFasta(assayTsv)
+	clonesFasta := clonesFastaRun.getFile("output.fasta")
+	assayFasta := assayFastaRun.getFile("output.fasta")
+	// Dynamically determine coverage mode by comparing average sequence lengths
+	coverageMode := exec.builder().
+		software(covModeCalcSw).
+		addFile("clones.fasta", clonesFasta).
+		addFile("assay.fasta", assayFasta).
+		arg("--clones-fasta").arg("clones.fasta").
+		arg("--assay-fasta").arg("assay.fasta").
+		arg("--output").arg("coverage_mode.txt").
+		saveFileContent("coverage_mode.txt").
+		run()
+	covMode := coverageMode.getFileContent("coverage_mode.txt")
 	mmseqsSearchType := "0"
 	if targetSequenceType == "aminoacid" && assaySequenceType == "aminoacid" {
 		//1: amino acid
@@ -143,266 +183,302 @@ wf.body(func(args) {
 		// 2: nucleotide
 		mmseqsSearchType = "2"
 	}
-	// run search
-	mmseqs := exec.builder().
-		software(mmseqsSw).
-		dontSaveStdoutOrStderr(). // important to avoid CID conflict problems coming from different stdout output on same datasets
-		arg("easy-search").
-		arg("clones.fasta").
-		arg("assay.fasta").
-		arg("results.tsv").
-		arg("tmp").
-		arg("--search-type").arg(mmseqsSearchType).
-		arg("--cov-mode").arg(string(args.settings.coverageMode)).
-		arg("-c").arg(string(args.settings.coverageThreshold)).
-		addFile("clones.fasta", clonesFasta).
-		addFile("assay.fasta", assayFasta).
-		saveFile("results.tsv").
-		run()
-	mmseqsOutput := mmseqs.getFile("results.tsv")
+	runMmseqs := render.create(runAlignmentTpl, {
+		covMode: covMode,
+		mmseqsSearchType: mmseqsSearchType,
+		coverageThreshold: args.settings.coverageThreshold,
+		identityThreshold: args.settings.identity,
+		similarityType: args.settings.similarityType,
+		clonesFasta: clonesFasta,
+		assayFasta: assayFasta
+	})
+	mmseqsOutput := runMmseqs.output("mmseqsOutput")
 	// @TODO remove header stuff and replace with pt when available (!)
-	mmseqsResultTsv := exec.builder().
+	addHeaderRunResult := exec.builder().
 		software(addHeaderSw).
 		arg("-i").arg("results.tsv").
 		arg("-o").arg("results_with_header.tsv").
 		addFile("results.tsv", mmseqsOutput).
 		saveFile("results_with_header.tsv").
-		run().
-		getFile("results_with_header.tsv")
+		run()
+	mmseqsResultTsv := addHeaderRunResult.getFile("results_with_header.tsv")
+	mmseqsResultTsvContent := addHeaderRunResult.getFileContent("results_with_header.tsv")
-	//////// Process tables ////////
+	emptyResults := len(text.trim_space(string(mmseqsResultTsvContent))) == 0
+	blockId := wf.blockId().getDataAsJson()
-	ptw := pt.workflow()
-	df := ptw.frame({
-		file: mmseqsResultTsv,
-		xsvType: "tsv"
-	})
+	assayPframe := undefined
+	epf := undefined
-	cols := []
-	for _, col in ["bits", "evalue", "target", "pident", "alnlen", "mismatch", "gapopen", "qstart", "qend", "tstart", "tend"] {
-		cols = append(cols,
-					  pt.col(col).maxBy(
-							pt.col("evalue").multiply(-1),
-							pt.col("bits")
-					  	).alias(col)
-					  )
-	}
-	df = df.groupBy("query").agg(cols...)
-	df.save("results.tsv")
+	if emptyResults {
+		assayPframe = pframes.emptyPFrame()
+		epf = pframes.emptyPFrame()
+	} else {
+		//////// Process tables ////////
+		ptw := pt.workflow()
+		df := ptw.frame({
+			file: mmseqsResultTsv,
+			xsvType: "tsv"
+		})
-	// assay data import summary
-	assayDf := ptw.frame({
-		file: assayTsv,
-		xsvType: "tsv"
-	})
-	// import how many matches per assay sequence found
-	assayDf = assayDf.join(
-		df.groupBy("target").agg(
-			pt.col("query").count().alias("queryCount")
-		),
-		{
-			how: "left",
-			leftOn: "seqId",
-			rightOn: "target"
+		// Cast columns to ensure correct types for aggregation
+		df = df.withColumns(
+			pt.col("evalue").cast("Float64").alias("evalue"),
+			pt.col("bits").cast("Float64").alias("bits")
+		)
+		cols := []
+		for _, col in ["bits", "evalue", "target", "pident", "alnlen", "mismatch", "gapopen", "qstart", "qend", "tstart", "tend"] {
+			cols = append(cols,
+						pt.col(col).maxBy(
+								pt.col("evalue").multiply(-1),
+								pt.col("bits")
+							).alias(col)
+						)
 		}
-	)
-	assayDf.save("assayData.tsv")
+		df = df.groupBy("query").agg(cols...)
+		df.save("results.tsv")
-	// clones
-	clonesDf := df.join(assayDf,
-		{
-			how: "left",
-			leftOn: "target",
-			rightOn: "seqId"
+		// assay data import summary
+		assayDf := ptw.frame({
+			file: assayTsv,
+			xsvType: "tsv"
+		})
+		// import how many matches per assay sequence found
+		assayDf = assayDf.join(
+			df.groupBy("target").agg(
+				pt.col("query").count().alias("queryCount")
+			),
+			{
+				how: "left",
+				leftOn: "seqId",
+				rightOn: "target"
+			}
+		)
+		assayDf.save("assayData.tsv")
+		// clones
+		clonesDf := df.join(assayDf,
+			{
+				how: "left",
+				leftOn: "target",
+				rightOn: "seqId"
+			}
+		)
+		clonesDf.save("clonesData.tsv")
+		ptw = ptw.run()
+		//////// Building outputs & exports ////////
+		assayColumns := [
+			{
+				column: "seqIdLabel",
+				spec: {
+					name: "pl7.app/label",
+					valueType: "String",
+					annotations: {
+						"pl7.app/label": "Sequence Id",
+						"pl7.app/table/fontFamily": "monospace"
+					}
+				}
+			},
+			{
+				column: "queryCount",
+				spec: {
+					name: "pl7.app/vdj/assay/queryCount",
+					valueType: "Int",
+					annotations: {
+						"pl7.app/label": "Matched Clones",
+						"pl7.app/table/orderPriority": "9000"
+					}
+				}
+			},
+			{
+				column: sequenceColumnInfo.header,
+				spec: {
+					name: "pl7.app/vdj/sequence",
+					valueType: "String",
+					domain: {
+						"pl7.app/alphabet": assaySequenceType
+					},
+					annotations: {
+						"pl7.app/label": sequenceColumnInfo.header,
+						"pl7.app/table/fontFamily": "monospace",
+						"pl7.app/table/orderPriority": "10000"
+					}
+				}
+			}
+		]
+		columnsToImport := args.importColumns
+		if args.selectedColumns != undefined && len(args.selectedColumns) > 0 {
+			selectedHeaders := {}
+			for header in args.selectedColumns {
+				selectedHeaders[header] = true
+			}
+			filteredColumns := []
+			for col in args.importColumns {
+				// Always include the main sequence column
+				if col.header == args.sequenceColumnHeader || selectedHeaders[col.header] {
+					filteredColumns = append(filteredColumns, col)
+				}
+			}
+			columnsToImport = filteredColumns
 		}
-	)
-	clonesDf.save("clonesData.tsv")
-	ptw = ptw.run()
-	//////// Building outputs & exports ////////
-	blockId := wf.blockId().getDataAsJson()
+		for h in columnsToImport {
+			if h.header == args.sequenceColumnHeader {
+				continue
+			}
+			assayColumns = append(assayColumns, {
+				column: h.header,
+				spec: {
+					name: h.header,
+					valueType: h.type,
+					annotations: {
+						"pl7.app/label": h.header,
+						"pl7.app/table/orderPriority": "1000"
+					}
+				}
+			})
+		}
-	assayColumns := [
+		assayImportResults := xsv.importFile(ptw.getFile("assayData.tsv"), "tsv", {
+			axes: [{
+				column: "seqId",
+				spec: {
+					name: "pl7.app/vdj/assay/sequenceId",
+					type: "String",
+					domain: {
+						"pl7.app/blockId": blockId
+					},
+					annotations: {
+						"pl7.app/label": "Sequence Id",
+						"pl7.app/table/fontFamily": "monospace"
+					}
+				}
+			}],
+			columns: assayColumns,
+			annotations: {
+				"pl7.app/isAnchor": "true"
+			}
+		})
+		// "bits", "evalue", "pident"
+		cloneColumns := [
 		{
 			column: "seqIdLabel",
 			spec: {
-				name: "pl7.app/label",
+				name: "pl7.app/vdj/assay/sequenceIdLabel",
 				valueType: "String",
 				annotations: {
-					"pl7.app/label": "Sequence Id",
-					"pl7.app/table/fontFamily": "monospace"
+					"pl7.app/label": "Assay Sequence Id",
+					"pl7.app/table/fontFamily": "monospace",
+					"pl7.app/table/visibility": "optional"
 				}
 			}
-		},
+		},
 		{
-			column: "queryCount",
+			column: "bits",
 			spec: {
-				name: "pl7.app/vdj/assay/queryCount",
-				valueType: "Int",
+				name: "pl7.app/alignment/bitScore",
+				valueType: "Float",
 				annotations: {
-					"pl7.app/label": "Matched Clones",
-					"pl7.app/table/orderPriority": "9000"
+					"pl7.app/label": "Bit Score",
+					"pl7.app/table/visibility": "optional"
 				}
 			}
-		},
+		},
 		{
-			column: sequenceColumnInfo.header,
+			column: "evalue",
 			spec: {
-				name: "pl7.app/vdj/sequence",
-				valueType: "String",
-				domain: {
-					"pl7.app/alphabet": assaySequenceType
-				},
+				name: "pl7.app/alignment/evalue",
+				valueType: "Float",
 				annotations: {
-					"pl7.app/label": sequenceColumnInfo.header,
-					"pl7.app/table/fontFamily": "monospace",
-					"pl7.app/table/orderPriority": "10000"
+					"pl7.app/label": "E-value",
+					"pl7.app/table/visibility": "optional"
 				}
 			}
-		}
-	]
-	for h in args.importColumns {
-		if h.header == args.sequenceColumnHeader {
-			continue
-		}
-		assayColumns = append(assayColumns, {
-			column: h.header,
+		},
+		{
+			column: "pident",
 			spec: {
-				name: h.header,
-				valueType: h.type,
-				annotations: {
-					"pl7.app/label": h.header,
-					"pl7.app/table/orderPriority": "1000"
+				name: "pl7.app/alignment/pident",
+				valueType: "Float",
+				annotations: {
+					"pl7.app/label": "Percentage of identical matches",
+					"pl7.app/table/visibility": "optional"
 				}
 			}
-		})
-	}
+		}]
-	assayImportResults := xsv.importFile(ptw.getFile("assayData.tsv"), "tsv", {
-		axes: [{
-			column: "seqId",
-			spec: {
-				name: "pl7.app/vdj/assay/sequenceId",
-				type: "String",
-				domain: {
-					"pl7.app/blockId": blockId
-				},
-				annotations: {
-					"pl7.app/label": "Sequence Id",
-					"pl7.app/table/fontFamily": "monospace"
+		for h in columnsToImport {
+			cloneColumns = append(cloneColumns, {
+				column: h.header,
+				spec: {
+					name: h.header,
+					valueType: h.type,
+					annotations: {
+						"pl7.app/label": h.header,
+						"pl7.app/table/visibility": h.header == args.sequenceColumnHeader ? "optional" : "default"
+					}
 				}
-			}
-		}],
-		columns: assayColumns,
-		annotations: {
-			"pl7.app/isAnchor": "true"
+			})
 		}
-	})
-    // "bits", "evalue", "pident"
-	cloneColumns := [
-	{
-		column: "target",
-		spec: {
-			name: "pl7.app/vdj/assay/sequenceId",
-			valueType: "String",
-			annotations: {
-				"pl7.app/label": "Assay Sequence Id",
-				"pl7.app/table/defaultVisibility": "optional"
-			}
-		}
-	},
-	{
-		column: "bits",
-		spec: {
-			name: "pl7.app/alignment/bitScore",
-			valueType: "Float",
-			annotations: {
-				"pl7.app/label": "Bit Score",
-				"pl7.app/table/defaultVisibility": "optional"
-			}
-		}
-	},
-	{
-		column: "evalue",
-		spec: {
-			name: "pl7.app/alignment/evalue",
-			valueType: "Float",
-			annotations: {
-				"pl7.app/label": "E-value",
-				"pl7.app/table/defaultVisibility": "optional"
-			}
-		}
-	},
-	{
-		column: "pident",
-		spec: {
-			name: "pl7.app/alignment/pident",
-			valueType: "Float",
-			annotations: {
-				"pl7.app/label": "Percentage of identical matches",
-				"pl7.app/table/defaultVisibility": "optional"
-			}
+		// insert domain
+		for col in cloneColumns {
+			col.spec.domain = maps.deepMerge(col.spec.domain, {
+				"pl7.app/blockId": blockId
+			})
 		}
-	}]
-	for h in args.importColumns {
-		cloneColumns = append(cloneColumns, {
-			column: h.header,
-			spec: {
-				name: h.header,
-				valueType: h.type,
-				annotations: {
-					"pl7.app/label": h.header,
-					"pl7.app/table/defaultVisibility": h.header == args.sequenceColumnHeader ? "optional" : "default"
-				}
-			}
-		})
-	}
-	// insert domain
-	for col in cloneColumns {
-		col.spec.domain = maps.deepMerge(col.spec.domain, {
-			"pl7.app/blockId": blockId
-		})
-	}
-    cloneImportResults := xsv.importFile(
-		ptw.getFile("clonesData.tsv"), "tsv", {
-			axes: [{
-				column: "query",
-				spec: datasetSpec.axesSpec[1]
-			}],
-			columns: cloneColumns
-		},
-		{ splitDataAndSpec: true }
-	)
+		cloneImportResults := xsv.importFile(
+			ptw.getFile("clonesData.tsv"), "tsv", {
+				axes: [{
+					column: "query",
+					spec: datasetSpec.axesSpec[1]
+				}],
+				columns: cloneColumns
+			},
+			{ splitDataAndSpec: true }
+		)
-	trace := pSpec.makeTrace(datasetSpec,
-        {
-            type: "milaboratories.immune-assay-data",
-            importance: 30,
-            label: "Assay Data"
-        })
+		trace := pSpec.makeTrace(datasetSpec,
+			{
+				type: "milaboratories.immune-assay-data",
+				importance: 30,
+				label: "Assay Data"
+			})
-	epf := pframes.pFrameBuilder()
-	for k, v in cloneImportResults {
-		epf.add(k, trace.inject(v.spec), v.data)
+		epfB := pframes.pFrameBuilder()
+		for k, v in cloneImportResults {
+			epfB.add(k, trace.inject(v.spec), v.data)
+		}
+		epf = epfB.build()
+		assayPframe = pframes.exportFrame(assayImportResults)
 	}
-	epf = epf.build()
-	return {
+	result := {
 		outputs: {
 			dataImportHandle: importFile.handle,
-			table: pframes.exportFrame(assayImportResults),
-			mmseqsOutput: mmseqsOutput // @TODO tmp fix to resolve CID conflicts
-		},
-		exports: {
+			table: assayPframe,
+			mmseqsOutput: mmseqsOutput, // @TODO tmp fix to resolve CID conflicts
+			emptyResults: emptyResults
+		}
+	}
+	if !emptyResults {
+		result.exports = {
 			epf: epf
 		}
 	}
+	return result
 })

package/src/run-alignment.tpl.tengo ADDED Viewed

@@ -0,0 +1,47 @@
+self := import("@platforma-sdk/workflow-tengo:tpl")
+ll := import("@platforma-sdk/workflow-tengo:ll")
+exec := import("@platforma-sdk/workflow-tengo:exec")
+assets:= import("@platforma-sdk/workflow-tengo:assets")
+mmseqsSw := assets.importSoftware("@platforma-open/soedinglab.software-mmseqs2:main")
+self.defineOutputs("mmseqsOutput")
+self.body(func(args) {
+    covMode := args.covMode.getDataAsJson()
+    mmseqsSearchType := args.mmseqsSearchType
+    coverageThreshold := args.coverageThreshold
+    identityThreshold := args.identityThreshold
+    similarityType := string(args.similarityType)
+    clonesFasta := args.clonesFasta
+    assayFasta := args.assayFasta
+	mmseqs := exec.builder().
+		software(mmseqsSw).
+		dontSaveStdoutOrStderr(). // important to avoid CID conflict problems coming from different stdout output on same datasets
+		arg("easy-search").
+		arg("clones.fasta").
+		arg("assay.fasta").
+		arg("results.tsv").
+		arg("tmp").
+		arg("--search-type").arg(mmseqsSearchType).
+		arg("--cov-mode").arg(string(covMode)).
+		arg("-c").arg(string(coverageThreshold)).
+		arg("--min-seq-id").arg(string(identityThreshold))
+	if similarityType == "sequence-identity" {
+		mmseqs = mmseqs.arg("--alignment-mode").arg("3")
+	}
+	mmseqs = mmseqs.
+		addFile("clones.fasta", clonesFasta).
+		addFile("assay.fasta", assayFasta).
+		saveFile("results.tsv").
+		run()
+    mmseqsOutput := mmseqs.getFile("results.tsv")
+    return {
+        mmseqsOutput: mmseqsOutput
+    }
+})