npm - @eagleoutice/flowr - Versions diffs - 2.2.15 → 2.3.0 - Mend

@eagleoutice/flowr 2.2.15 → 2.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (255) hide show

package/README.md +226 -6
package/abstract-interpretation/data-frame/absint-info.d.ts +109 -0
package/abstract-interpretation/data-frame/absint-info.js +31 -0
package/abstract-interpretation/data-frame/absint-visitor.d.ts +59 -0
package/abstract-interpretation/data-frame/absint-visitor.js +173 -0
package/abstract-interpretation/data-frame/domain.d.ts +107 -0
package/abstract-interpretation/data-frame/domain.js +315 -0
package/abstract-interpretation/data-frame/mappers/access-mapper.d.ts +17 -0
package/abstract-interpretation/data-frame/mappers/access-mapper.js +166 -0
package/abstract-interpretation/data-frame/mappers/arguments.d.ts +117 -0
package/abstract-interpretation/data-frame/mappers/arguments.js +188 -0
package/abstract-interpretation/data-frame/mappers/assignment-mapper.d.ts +20 -0
package/abstract-interpretation/data-frame/mappers/assignment-mapper.js +34 -0
package/abstract-interpretation/data-frame/mappers/function-mapper.d.ts +261 -0
package/abstract-interpretation/data-frame/mappers/function-mapper.js +1219 -0
package/abstract-interpretation/data-frame/mappers/replacement-mapper.d.ts +12 -0
package/abstract-interpretation/data-frame/mappers/replacement-mapper.js +206 -0
package/abstract-interpretation/data-frame/resolve-args.d.ts +42 -0
package/abstract-interpretation/data-frame/resolve-args.js +118 -0
package/abstract-interpretation/data-frame/semantics.d.ts +213 -0
package/abstract-interpretation/data-frame/semantics.js +366 -0
package/abstract-interpretation/data-frame/shape-inference.d.ts +38 -0
package/abstract-interpretation/data-frame/shape-inference.js +117 -0
package/benchmark/slicer.d.ts +18 -2
package/benchmark/slicer.js +143 -5
package/benchmark/stats/print.js +123 -45
package/benchmark/stats/size-of.d.ts +7 -0
package/benchmark/stats/size-of.js +1 -0
package/benchmark/stats/stats.d.ts +30 -1
package/benchmark/stats/stats.js +4 -2
package/benchmark/summarizer/data.d.ts +33 -2
package/benchmark/summarizer/first-phase/input.js +5 -1
package/benchmark/summarizer/first-phase/process.d.ts +2 -1
package/benchmark/summarizer/first-phase/process.js +49 -3
package/benchmark/summarizer/second-phase/process.js +101 -3
package/cli/benchmark-app.d.ts +2 -0
package/cli/benchmark-app.js +5 -1
package/cli/benchmark-helper-app.d.ts +2 -0
package/cli/benchmark-helper-app.js +13 -8
package/cli/common/options.js +4 -0
package/cli/export-quads-app.js +2 -1
package/cli/flowr.js +58 -57
package/cli/repl/commands/repl-cfg.js +13 -13
package/cli/repl/commands/repl-commands.js +2 -2
package/cli/repl/commands/repl-dataflow.js +10 -10
package/cli/repl/commands/repl-execute.d.ts +2 -3
package/cli/repl/commands/repl-execute.js +4 -4
package/cli/repl/commands/repl-lineage.js +4 -4
package/cli/repl/commands/repl-main.d.ts +12 -1
package/cli/repl/commands/repl-normalize.js +6 -6
package/cli/repl/commands/repl-parse.js +2 -2
package/cli/repl/commands/repl-query.js +9 -9
package/cli/repl/commands/repl-version.js +1 -1
package/cli/repl/core.d.ts +5 -2
package/cli/repl/core.js +10 -8
package/cli/repl/server/connection.d.ts +3 -1
package/cli/repl/server/connection.js +7 -5
package/cli/repl/server/server.d.ts +3 -2
package/cli/repl/server/server.js +4 -2
package/cli/script-core/statistics-core.d.ts +2 -1
package/cli/script-core/statistics-core.js +2 -2
package/cli/script-core/statistics-helper-core.d.ts +2 -1
package/cli/script-core/statistics-helper-core.js +5 -4
package/cli/slicer-app.js +4 -2
package/cli/statistics-app.js +2 -1
package/cli/statistics-helper-app.js +2 -1
package/config.d.ts +43 -10
package/config.js +47 -43
package/control-flow/cfg-dead-code.js +45 -2
package/control-flow/cfg-simplification.d.ts +2 -0
package/control-flow/control-flow-graph.d.ts +2 -0
package/control-flow/control-flow-graph.js +8 -0
package/control-flow/dfg-cfg-guided-visitor.d.ts +5 -3
package/control-flow/dfg-cfg-guided-visitor.js +15 -4
package/control-flow/extract-cfg.d.ts +4 -2
package/control-flow/extract-cfg.js +4 -3
package/control-flow/semantic-cfg-guided-visitor.d.ts +20 -2
package/control-flow/semantic-cfg-guided-visitor.js +24 -4
package/core/pipeline-executor.d.ts +4 -1
package/core/pipeline-executor.js +6 -5
package/core/steps/all/core/10-normalize.d.ts +2 -0
package/core/steps/all/core/10-normalize.js +1 -1
package/core/steps/all/core/11-normalize-tree-sitter.d.ts +2 -1
package/core/steps/all/core/11-normalize-tree-sitter.js +2 -2
package/core/steps/all/core/20-dataflow.d.ts +2 -1
package/core/steps/all/core/20-dataflow.js +2 -2
package/core/steps/all/static-slicing/00-slice.d.ts +2 -1
package/core/steps/all/static-slicing/00-slice.js +2 -2
package/core/steps/pipeline/default-pipelines.d.ts +32 -31
package/core/steps/pipeline/default-pipelines.js +8 -8
package/core/steps/pipeline-step.d.ts +2 -1
package/dataflow/environments/built-in-config.d.ts +3 -3
package/dataflow/environments/built-in.d.ts +11 -3
package/dataflow/environments/built-in.js +5 -3
package/dataflow/environments/default-builtin-config.js +4 -2
package/dataflow/environments/define.d.ts +2 -1
package/dataflow/environments/define.js +4 -5
package/dataflow/environments/remove.d.ts +6 -0
package/dataflow/environments/remove.js +29 -0
package/dataflow/eval/resolve/alias-tracking.d.ts +7 -2
package/dataflow/eval/resolve/alias-tracking.js +11 -8
package/dataflow/eval/resolve/resolve-argument.d.ts +8 -0
package/dataflow/eval/resolve/resolve-argument.js +118 -0
package/dataflow/eval/resolve/resolve.d.ts +65 -18
package/dataflow/eval/resolve/resolve.js +144 -48
package/dataflow/eval/values/string/string-constants.d.ts +1 -1
package/dataflow/eval/values/string/string-constants.js +7 -2
package/dataflow/extractor.d.ts +2 -1
package/dataflow/extractor.js +2 -1
package/dataflow/internal/process/functions/call/built-in/built-in-access.js +5 -6
package/dataflow/internal/process/functions/call/built-in/built-in-apply.js +1 -1
package/dataflow/internal/process/functions/call/built-in/built-in-assignment.d.ts +4 -2
package/dataflow/internal/process/functions/call/built-in/built-in-assignment.js +11 -11
package/dataflow/internal/process/functions/call/built-in/built-in-eval.js +10 -11
package/dataflow/internal/process/functions/call/built-in/built-in-expression-list.js +7 -2
package/dataflow/internal/process/functions/call/built-in/built-in-for-loop.js +2 -3
package/dataflow/internal/process/functions/call/built-in/built-in-if-then-else.js +1 -1
package/dataflow/internal/process/functions/call/built-in/built-in-list.js +2 -2
package/dataflow/internal/process/functions/call/built-in/built-in-replacement.js +2 -3
package/dataflow/internal/process/functions/call/built-in/built-in-source.d.ts +6 -3
package/dataflow/internal/process/functions/call/built-in/built-in-source.js +19 -15
package/dataflow/internal/process/functions/call/built-in/built-in-vector.js +2 -2
package/dataflow/internal/process/functions/call/built-in/built-in-while-loop.js +1 -1
package/dataflow/internal/process/functions/call/common.js +1 -1
package/dataflow/internal/process/functions/process-parameter.js +1 -1
package/dataflow/origin/dfg-get-symbol-refs.d.ts +21 -0
package/dataflow/origin/dfg-get-symbol-refs.js +50 -0
package/dataflow/processor.d.ts +5 -0
package/documentation/doc-util/doc-cfg.js +4 -3
package/documentation/doc-util/doc-code.d.ts +1 -1
package/documentation/doc-util/doc-dfg.js +3 -2
package/documentation/doc-util/doc-functions.d.ts +24 -0
package/documentation/doc-util/doc-functions.js +65 -0
package/documentation/doc-util/doc-normalized-ast.js +3 -2
package/documentation/doc-util/doc-print.d.ts +5 -0
package/documentation/doc-util/doc-print.js +36 -0
package/documentation/doc-util/doc-query.js +13 -2
package/documentation/doc-util/doc-repl.js +2 -1
package/documentation/doc-util/doc-search.js +3 -2
package/documentation/doc-util/doc-types.d.ts +28 -6
package/documentation/doc-util/doc-types.js +89 -45
package/documentation/print-cfg-wiki.js +6 -7
package/documentation/print-core-wiki.js +5 -5
package/documentation/print-dataflow-graph-wiki.js +10 -10
package/documentation/print-engines-wiki.js +1 -2
package/documentation/print-faq-wiki.js +8 -2
package/documentation/print-interface-wiki.js +12 -2
package/documentation/print-linter-issue.d.ts +1 -0
package/documentation/print-linter-issue.js +71 -0
package/documentation/print-linter-wiki.js +223 -34
package/documentation/print-linting-and-testing-wiki.js +2 -4
package/documentation/print-normalized-ast-wiki.js +3 -3
package/documentation/print-query-wiki.js +18 -2
package/documentation/print-readme.js +24 -1
package/documentation/print-search-wiki.js +1 -2
package/linter/linter-executor.d.ts +3 -1
package/linter/linter-executor.js +3 -2
package/linter/linter-format.d.ts +67 -7
package/linter/linter-format.js +12 -1
package/linter/linter-rules.d.ts +178 -16
package/linter/linter-rules.js +14 -4
package/linter/linter-tags.d.ts +80 -0
package/linter/linter-tags.js +85 -0
package/linter/rules/absolute-path.d.ts +71 -0
package/linter/rules/absolute-path.js +177 -0
package/linter/rules/dataframe-access-validation.d.ts +53 -0
package/linter/rules/dataframe-access-validation.js +116 -0
package/linter/rules/deprecated-functions.d.ts +43 -0
package/linter/rules/deprecated-functions.js +58 -0
package/linter/rules/{2-file-path-validity.d.ts → file-path-validity.d.ts} +16 -6
package/linter/rules/{2-file-path-validity.js → file-path-validity.js} +21 -13
package/linter/rules/naming-convention.d.ts +71 -0
package/linter/rules/naming-convention.js +168 -0
package/linter/rules/seeded-randomness.d.ts +65 -0
package/linter/rules/seeded-randomness.js +122 -0
package/linter/rules/unused-definition.d.ts +41 -0
package/linter/rules/unused-definition.js +105 -0
package/package.json +5 -2
package/queries/base-query-format.d.ts +2 -0
package/queries/catalog/call-context-query/call-context-query-executor.d.ts +1 -1
package/queries/catalog/call-context-query/call-context-query-executor.js +2 -2
package/queries/catalog/cluster-query/cluster-query-format.d.ts +1 -1
package/queries/catalog/config-query/config-query-executor.d.ts +1 -1
package/queries/catalog/config-query/config-query-executor.js +2 -3
package/queries/catalog/control-flow-query/control-flow-query-executor.d.ts +1 -1
package/queries/catalog/control-flow-query/control-flow-query-executor.js +2 -2
package/queries/catalog/control-flow-query/control-flow-query-format.d.ts +1 -1
package/queries/catalog/dataflow-lens-query/dataflow-lens-query-format.d.ts +1 -1
package/queries/catalog/dataflow-query/dataflow-query-format.d.ts +1 -1
package/queries/catalog/dependencies-query/dependencies-query-executor.js +4 -116
package/queries/catalog/dependencies-query/dependencies-query-format.d.ts +1 -1
package/queries/catalog/df-shape-query/df-shape-query-executor.d.ts +3 -0
package/queries/catalog/df-shape-query/df-shape-query-executor.js +46 -0
package/queries/catalog/df-shape-query/df-shape-query-format.d.ts +72 -0
package/queries/catalog/df-shape-query/df-shape-query-format.js +31 -0
package/queries/catalog/happens-before-query/happens-before-query-format.d.ts +1 -1
package/queries/catalog/id-map-query/id-map-query-format.d.ts +1 -1
package/queries/catalog/lineage-query/lineage-query-format.d.ts +1 -1
package/queries/catalog/linter-query/linter-query-executor.d.ts +1 -1
package/queries/catalog/linter-query/linter-query-executor.js +2 -2
package/queries/catalog/linter-query/linter-query-format.d.ts +1 -1
package/queries/catalog/linter-query/linter-query-format.js +16 -12
package/queries/catalog/normalized-ast-query/normalized-ast-query-format.d.ts +1 -1
package/queries/catalog/origin-query/origin-query-format.d.ts +1 -1
package/queries/catalog/project-query/project-query-format.d.ts +1 -1
package/queries/catalog/resolve-value-query/resolve-value-query-executor.d.ts +1 -1
package/queries/catalog/resolve-value-query/resolve-value-query-executor.js +2 -2
package/queries/catalog/resolve-value-query/resolve-value-query-format.d.ts +1 -1
package/queries/catalog/search-query/search-query-executor.d.ts +1 -1
package/queries/catalog/search-query/search-query-executor.js +2 -2
package/queries/catalog/search-query/search-query-format.d.ts +1 -1
package/queries/catalog/static-slice-query/static-slice-query-executor.d.ts +1 -1
package/queries/catalog/static-slice-query/static-slice-query-executor.js +2 -2
package/queries/catalog/static-slice-query/static-slice-query-format.d.ts +1 -1
package/queries/query.d.ts +76 -16
package/queries/query.js +2 -0
package/r-bridge/lang-4.x/ast/parser/json/parser.d.ts +2 -1
package/r-bridge/lang-4.x/ast/parser/json/parser.js +4 -2
package/r-bridge/lang-4.x/convert-values.js +2 -1
package/r-bridge/lang-4.x/tree-sitter/tree-sitter-executor.d.ts +3 -1
package/r-bridge/lang-4.x/tree-sitter/tree-sitter-executor.js +4 -4
package/r-bridge/lang-4.x/tree-sitter/tree-sitter-normalize.d.ts +1 -1
package/r-bridge/lang-4.x/tree-sitter/tree-sitter-normalize.js +7 -5
package/r-bridge/shell.d.ts +3 -2
package/r-bridge/shell.js +4 -5
package/search/flowr-search-builder.d.ts +6 -2
package/search/flowr-search-builder.js +7 -0
package/search/flowr-search-filters.d.ts +32 -8
package/search/flowr-search-filters.js +42 -15
package/search/flowr-search.d.ts +4 -0
package/search/search-executor/search-enrichers.d.ts +7 -3
package/search/search-executor/search-enrichers.js +29 -20
package/search/search-executor/search-generators.js +1 -1
package/search/search-executor/search-transformer.d.ts +2 -0
package/search/search-executor/search-transformer.js +10 -1
package/slicing/static/static-slicer.d.ts +1 -1
package/slicing/static/static-slicer.js +2 -3
package/statistics/statistics.d.ts +3 -1
package/statistics/statistics.js +5 -4
package/util/containers.d.ts +12 -9
package/util/containers.js +12 -9
package/util/files.d.ts +8 -2
package/util/files.js +22 -4
package/util/objects.d.ts +5 -4
package/util/r-value.d.ts +23 -0
package/util/r-value.js +113 -0
package/util/range.d.ts +5 -1
package/util/range.js +11 -3
package/util/text/strings.d.ts +6 -0
package/util/text/strings.js +35 -0
package/util/version.js +1 -1
package/linter/rules/1-deprecated-functions.d.ts +0 -34
package/linter/rules/1-deprecated-functions.js +0 -54
package/util/cfg/cfg.d.ts +0 -0
package/util/cfg/cfg.js +0 -2

package/benchmark/summarizer/first-phase/process.js CHANGED Viewed

@@ -53,6 +53,7 @@ const retriever_1 = require("../../../r-bridge/retriever");
 const visitor_1 = require("../../../r-bridge/lang-4.x/ast/model/processing/visitor");
 const type_1 = require("../../../r-bridge/lang-4.x/ast/model/type");
 const arrays_1 = require("../../../util/collections/arrays");
+const semantics_1 = require("../../../abstract-interpretation/data-frame/semantics");
 const tempfile = (() => {
     let _tempfile = undefined;
     return () => {
@@ -107,10 +108,10 @@ function calculateReductionForSlice(input, dataflow, perSlice, ignoreFluff) {
  * @see Slicer
  */
 async function summarizeSlicerStats(stats, report = () => {
-}) {
+}, engineConf) {
     const collect = new defaultmap_1.DefaultMap(() => []);
     const sizeOfSliceCriteria = [];
-    const reParseShellSession = new shell_1.RShell();
+    const reParseShellSession = new shell_1.RShell(engineConf);
     const sliceTimes = [];
     const reconstructTimes = [];
     const totalTimes = [];
@@ -250,9 +251,54 @@ async function summarizeSlicerStats(stats, report = () => {
                 normalizedTokensNoComments: (0, summarizer_1.summarizeMeasurement)(sliceSize.normalizedTokensNoComments),
                 dataflowNodes: (0, summarizer_1.summarizeMeasurement)(sliceSize.dataflowNodes)
             }
-        }
+        },
+        dataFrameShape: stats.dataFrameShape ? summarizeDfShapeStats(stats.dataFrameShape) : undefined
+    };
+}
+function summarizeDfShapeStats({ perNodeStats, ...stats }) {
+    const nodeStats = perNodeStats.values().toArray();
+    const isTop = (value) => value === 'top';
+    const isInfinite = (value) => value === 'infinite';
+    const isBottom = (value) => value === 'bottom';
+    const isValue = (value) => value !== undefined && !isTop(value) && !isInfinite(value) && !isBottom(value);
+    return {
+        ...stats,
+        numberOfEntriesPerNode: (0, summarizer_1.summarizeMeasurement)(nodeStats.map(s => s.numberOfEntries)),
+        numberOfOperations: (0, arrays_1.arraySum)(nodeStats.map(s => s.mappedOperations?.length).filter(assert_1.isNotUndefined)),
+        numberOfTotalValues: nodeStats.filter(s => isValue(s.inferredColNames) && isValue(s.inferredColCount) && isValue(s.inferredRowCount)).length,
+        numberOfTotalTop: nodeStats.filter(s => isTop(s.inferredColNames) && isTop(s.inferredColCount) && isTop(s.inferredRowCount)).length,
+        numberOfTotalBottom: nodeStats.filter(s => s.inferredColNames === 0 && isBottom(s.inferredColCount) && isBottom(s.inferredRowCount)).length,
+        inferredColNames: (0, summarizer_1.summarizeMeasurement)(nodeStats.map(s => s.inferredColNames).filter(isValue)),
+        numberOfColNamesValues: nodeStats.map(s => s.inferredColNames).filter(isValue).length,
+        numberOfColNamesTop: nodeStats.map(s => s.inferredColNames).filter(isTop).length,
+        numberOfColNamesBottom: nodeStats.map(s => s.inferredColNames).filter(number => number === 0).length,
+        inferredColCount: (0, summarizer_1.summarizeMeasurement)(nodeStats.map(s => s.inferredColCount).filter(isValue)),
+        numberOfColCountExact: nodeStats.map(s => s.approxRangeColCount).filter(range => range === 0).length,
+        numberOfColCountValues: nodeStats.map(s => s.inferredColCount).filter(isValue).length,
+        numberOfColCountTop: nodeStats.map(s => s.inferredColCount).filter(isTop).length,
+        numberOfColCountInfinite: nodeStats.map(s => s.inferredColCount).filter(isInfinite).length,
+        numberOfColCountBottom: nodeStats.map(s => s.inferredColCount).filter(isBottom).length,
+        approxRangeColCount: (0, summarizer_1.summarizeMeasurement)(nodeStats.map(s => s.approxRangeColCount).filter(assert_1.isNotUndefined).filter(isFinite)),
+        inferredRowCount: (0, summarizer_1.summarizeMeasurement)(nodeStats.map(s => s.inferredRowCount).filter(isValue)),
+        numberOfRowCountExact: nodeStats.map(s => s.approxRangeRowCount).filter(range => range === 0).length,
+        numberOfRowCountValues: nodeStats.map(s => s.inferredRowCount).filter(isValue).length,
+        numberOfRowCountTop: nodeStats.map(s => s.inferredRowCount).filter(isTop).length,
+        numberOfRowCountInfinite: nodeStats.map(s => s.inferredRowCount).filter(isInfinite).length,
+        numberOfRowCountBottom: nodeStats.map(s => s.inferredRowCount).filter(isBottom).length,
+        approxRangeRowCount: (0, summarizer_1.summarizeMeasurement)(nodeStats.map(s => s.approxRangeRowCount).filter(assert_1.isNotUndefined).filter(isFinite)),
+        perOperationNumber: summarizePerOperationStats(nodeStats),
     };
 }
+function summarizePerOperationStats(nodeStats) {
+    const perOperationNumber = new Map(semantics_1.DataFrameOperationNames.map(name => [name, 0]));
+    for (const stat of nodeStats) {
+        for (const operation of stat.mappedOperations ?? []) {
+            const value = perOperationNumber.get(operation) ?? 0;
+            perOperationNumber.set(operation, value + 1);
+        }
+    }
+    return perOperationNumber;
+}
 function summarizeSummarizedMeasurement(data) {
     data = data.filter(assert_1.isNotUndefined);
     const min = Math.min(...data.map(d => d.min).filter(assert_1.isNotUndefined));

package/benchmark/summarizer/second-phase/process.js CHANGED Viewed

@@ -9,6 +9,8 @@ const defaultmap_1 = require("../../../util/collections/defaultmap");
 const summarizer_1 = require("../../../util/summarizer");
 const assert_1 = require("../../../util/assert");
 const stats_1 = require("../../stats/stats");
+const semantics_1 = require("../../../abstract-interpretation/data-frame/semantics");
+const arrays_1 = require("../../../util/collections/arrays");
 function summarizeAllSummarizedStats(stats) {
     const commonMeasurements = new defaultmap_1.DefaultMap(() => []);
     const perSliceMeasurements = new defaultmap_1.DefaultMap(() => []);
@@ -19,11 +21,14 @@ function summarizeAllSummarizedStats(stats) {
     const normalizeTimesPerToken = [];
     const dataflowTimesPerToken = [];
     const totalCommonTimesPerToken = [];
+    const controlFlowTimePerToken = [];
+    const dataFrameShapeTimePerToken = [];
     const memory = new defaultmap_1.DefaultMap(() => []);
     const reductions = [];
     const reductionsNoFluff = [];
     const inputs = [];
     const dataflows = [];
+    const dataFrameShapes = [];
     let failedToRepParse = 0;
     let timesHitThreshold = 0;
     let totalSlices = 0;
@@ -41,6 +46,12 @@ function summarizeAllSummarizedStats(stats) {
         normalizeTimesPerToken.push(stat.normalizeTimePerToken);
         dataflowTimesPerToken.push(stat.dataflowTimePerToken);
         totalCommonTimesPerToken.push(stat.totalCommonTimePerToken);
+        if (stat.controlFlowTimePerToken !== undefined) {
+            controlFlowTimePerToken.push(stat.controlFlowTimePerToken);
+        }
+        if (stat.dataFrameShapeTimePerToken !== undefined) {
+            dataFrameShapeTimePerToken.push(stat.dataFrameShapeTimePerToken);
+        }
         for (const [k, v] of stat.memory) {
             memory.get(k).push(v);
         }
@@ -48,6 +59,9 @@ function summarizeAllSummarizedStats(stats) {
         reductionsNoFluff.push(stat.perSliceMeasurements.reductionNoFluff);
         inputs.push(stat.input);
         dataflows.push(stat.dataflow);
+        if (stat.dataFrameShape !== undefined) {
+            dataFrameShapes.push(stat.dataFrameShape);
+        }
         failedToRepParse += stat.perSliceMeasurements.failedToRepParse;
         totalSlices += stat.perSliceMeasurements.numberOfSlices;
         timesHitThreshold += stat.perSliceMeasurements.timesHitThreshold;
@@ -64,6 +78,8 @@ function summarizeAllSummarizedStats(stats) {
         normalizeTimePerToken: (0, process_1.summarizeTimePerToken)(normalizeTimesPerToken),
         dataflowTimePerToken: (0, process_1.summarizeTimePerToken)(dataflowTimesPerToken),
         totalCommonTimePerToken: (0, process_1.summarizeTimePerToken)(totalCommonTimesPerToken),
+        controlFlowTimePerToken: controlFlowTimePerToken.length > 0 ? (0, process_1.summarizeTimePerToken)(controlFlowTimePerToken) : undefined,
+        dataFrameShapeTimePerToken: dataFrameShapeTimePerToken.length > 0 ? (0, process_1.summarizeTimePerToken)(dataFrameShapeTimePerToken) : undefined,
         failedToRepParse,
         timesHitThreshold,
         reduction: (0, process_1.summarizeSummarizedReductions)(reductions),
@@ -89,7 +105,43 @@ function summarizeAllSummarizedStats(stats) {
             storedVertexIndices: (0, summarizer_1.summarizeMeasurement)(dataflows.map(d => d.storedVertexIndices)),
             storedEnvIndices: (0, summarizer_1.summarizeMeasurement)(dataflows.map(d => d.storedEnvIndices)),
             overwrittenIndices: (0, summarizer_1.summarizeMeasurement)(dataflows.map(d => d.overwrittenIndices)),
-        }
+        },
+        dataFrameShape: stats.some(s => s.dataFrameShape !== undefined) ? {
+            numberOfDataFrameFiles: (0, arrays_1.arraySum)(stats.map(s => s.dataFrameShape?.numberOfDataFrameFiles).filter(assert_1.isNotUndefined)),
+            numberOfNonDataFrameFiles: (0, arrays_1.arraySum)(stats.map(s => s.dataFrameShape?.numberOfNonDataFrameFiles).filter(assert_1.isNotUndefined)),
+            numberOfResultConstraints: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfResultConstraints).filter(assert_1.isNotUndefined)),
+            numberOfResultingValues: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfResultingValues).filter(assert_1.isNotUndefined)),
+            numberOfResultingTop: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfResultingTop).filter(assert_1.isNotUndefined)),
+            numberOfResultingBottom: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfResultingBottom).filter(assert_1.isNotUndefined)),
+            numberOfEmptyNodes: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfEmptyNodes).filter(assert_1.isNotUndefined)),
+            numberOfOperationNodes: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfOperationNodes).filter(assert_1.isNotUndefined)),
+            numberOfValueNodes: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfValueNodes).filter(assert_1.isNotUndefined)),
+            sizeOfInfo: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.sizeOfInfo).filter(assert_1.isNotUndefined)),
+            numberOfEntriesPerNode: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfEntriesPerNode).filter(assert_1.isNotUndefined)),
+            numberOfOperations: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfOperations).filter(assert_1.isNotUndefined)),
+            numberOfTotalValues: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfTotalValues).filter(assert_1.isNotUndefined)),
+            numberOfTotalTop: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfTotalTop).filter(assert_1.isNotUndefined)),
+            numberOfTotalBottom: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfTotalBottom).filter(assert_1.isNotUndefined)),
+            inferredColNames: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.inferredColNames).filter(assert_1.isNotUndefined)),
+            numberOfColNamesValues: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColNamesValues).filter(assert_1.isNotUndefined)),
+            numberOfColNamesTop: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColNamesTop).filter(assert_1.isNotUndefined)),
+            numberOfColNamesBottom: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColNamesBottom).filter(assert_1.isNotUndefined)),
+            inferredColCount: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.inferredColCount).filter(assert_1.isNotUndefined)),
+            numberOfColCountExact: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColCountExact).filter(assert_1.isNotUndefined)),
+            numberOfColCountValues: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColCountValues).filter(assert_1.isNotUndefined)),
+            numberOfColCountTop: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColCountTop).filter(assert_1.isNotUndefined)),
+            numberOfColCountInfinite: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColCountInfinite).filter(assert_1.isNotUndefined)),
+            numberOfColCountBottom: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColCountBottom).filter(assert_1.isNotUndefined)),
+            approxRangeColCount: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.approxRangeColCount).filter(assert_1.isNotUndefined)),
+            inferredRowCount: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.inferredRowCount).filter(assert_1.isNotUndefined)),
+            numberOfRowCountExact: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfRowCountExact).filter(assert_1.isNotUndefined)),
+            numberOfRowCountValues: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfRowCountValues).filter(assert_1.isNotUndefined)),
+            numberOfRowCountTop: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfRowCountTop).filter(assert_1.isNotUndefined)),
+            numberOfRowCountInfinite: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfRowCountInfinite).filter(assert_1.isNotUndefined)),
+            numberOfRowCountBottom: (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.numberOfRowCountBottom).filter(assert_1.isNotUndefined)),
+            approxRangeRowCount: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.approxRangeRowCount).filter(assert_1.isNotUndefined)),
+            perOperationNumber: new Map(semantics_1.DataFrameOperationNames.map(n => [n, (0, summarizer_1.summarizeMeasurement)(stats.map(s => s.dataFrameShape?.perOperationNumber.get(n) ?? 0))]))
+        } : undefined
     };
 }
 function summarizeAllUltimateStats(stats) {
@@ -109,6 +161,8 @@ function summarizeAllUltimateStats(stats) {
         normalizeTimePerToken: (0, process_1.summarizeSummarizedTimePerToken)(stats.map(s => s.normalizeTimePerToken)),
         dataflowTimePerToken: (0, process_1.summarizeSummarizedTimePerToken)(stats.map(s => s.dataflowTimePerToken)),
         totalCommonTimePerToken: (0, process_1.summarizeSummarizedTimePerToken)(stats.map(s => s.totalCommonTimePerToken)),
+        controlFlowTimePerToken: stats.some(s => s.controlFlowTimePerToken !== undefined) ? (0, process_1.summarizeSummarizedTimePerToken)(stats.map(s => s.controlFlowTimePerToken).filter(assert_1.isNotUndefined)) : undefined,
+        dataFrameShapeTimePerToken: stats.some(s => s.dataFrameShapeTimePerToken !== undefined) ? (0, process_1.summarizeSummarizedTimePerToken)(stats.map(s => s.dataFrameShapeTimePerToken).filter(assert_1.isNotUndefined)) : undefined,
         reduction: (0, process_1.summarizeSummarizedReductions)(stats.map(s => s.reduction)),
         reductionNoFluff: (0, process_1.summarizeSummarizedReductions)(stats.map(s => s.reductionNoFluff)),
         input: {
@@ -132,7 +186,43 @@ function summarizeAllUltimateStats(stats) {
             storedVertexIndices: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataflow.storedVertexIndices)),
             storedEnvIndices: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataflow.storedEnvIndices)),
             overwrittenIndices: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataflow.overwrittenIndices)),
-        }
+        },
+        dataFrameShape: stats.some(s => s.dataFrameShape !== undefined) ? {
+            numberOfDataFrameFiles: (0, arrays_1.arraySum)(stats.map(s => s.dataFrameShape?.numberOfDataFrameFiles).filter(assert_1.isNotUndefined)),
+            numberOfNonDataFrameFiles: (0, arrays_1.arraySum)(stats.map(s => s.dataFrameShape?.numberOfNonDataFrameFiles).filter(assert_1.isNotUndefined)),
+            numberOfResultConstraints: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfResultConstraints).filter(assert_1.isNotUndefined)),
+            numberOfResultingValues: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfResultingValues).filter(assert_1.isNotUndefined)),
+            numberOfResultingTop: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfResultingTop).filter(assert_1.isNotUndefined)),
+            numberOfResultingBottom: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfResultingBottom).filter(assert_1.isNotUndefined)),
+            numberOfEmptyNodes: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfEmptyNodes).filter(assert_1.isNotUndefined)),
+            numberOfOperationNodes: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfOperationNodes).filter(assert_1.isNotUndefined)),
+            numberOfValueNodes: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfValueNodes).filter(assert_1.isNotUndefined)),
+            sizeOfInfo: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.sizeOfInfo).filter(assert_1.isNotUndefined)),
+            numberOfEntriesPerNode: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfEntriesPerNode).filter(assert_1.isNotUndefined)),
+            numberOfOperations: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfOperations).filter(assert_1.isNotUndefined)),
+            numberOfTotalValues: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfTotalValues).filter(assert_1.isNotUndefined)),
+            numberOfTotalTop: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfTotalTop).filter(assert_1.isNotUndefined)),
+            numberOfTotalBottom: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfTotalBottom).filter(assert_1.isNotUndefined)),
+            inferredColNames: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.inferredColNames).filter(assert_1.isNotUndefined)),
+            numberOfColNamesValues: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColNamesValues).filter(assert_1.isNotUndefined)),
+            numberOfColNamesTop: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColNamesTop).filter(assert_1.isNotUndefined)),
+            numberOfColNamesBottom: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColNamesBottom).filter(assert_1.isNotUndefined)),
+            inferredColCount: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.inferredColCount).filter(assert_1.isNotUndefined)),
+            numberOfColCountExact: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColCountExact).filter(assert_1.isNotUndefined)),
+            numberOfColCountValues: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColCountValues).filter(assert_1.isNotUndefined)),
+            numberOfColCountTop: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColCountTop).filter(assert_1.isNotUndefined)),
+            numberOfColCountInfinite: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColCountInfinite).filter(assert_1.isNotUndefined)),
+            numberOfColCountBottom: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfColCountBottom).filter(assert_1.isNotUndefined)),
+            approxRangeColCount: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.approxRangeColCount).filter(assert_1.isNotUndefined)),
+            inferredRowCount: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.inferredRowCount).filter(assert_1.isNotUndefined)),
+            numberOfRowCountExact: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfRowCountExact).filter(assert_1.isNotUndefined)),
+            numberOfRowCountValues: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfRowCountValues).filter(assert_1.isNotUndefined)),
+            numberOfRowCountTop: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfRowCountTop).filter(assert_1.isNotUndefined)),
+            numberOfRowCountInfinite: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfRowCountInfinite).filter(assert_1.isNotUndefined)),
+            numberOfRowCountBottom: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.numberOfRowCountBottom).filter(assert_1.isNotUndefined)),
+            approxRangeRowCount: (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.approxRangeRowCount).filter(assert_1.isNotUndefined)),
+            perOperationNumber: new Map(semantics_1.DataFrameOperationNames.map(n => [n, (0, process_1.summarizeSummarizedMeasurement)(stats.map(s => s.dataFrameShape?.perOperationNumber.get(n)).filter(assert_1.isNotUndefined))]))
+        } : undefined
     };
 }
 function processNextSummary(line, allSummarized) {
@@ -152,7 +242,11 @@ function processNextSummary(line, allSummarized) {
                 ...got.summarize.perSliceMeasurements,
                 // restore maps
                 measurements: new Map(got.summarize.perSliceMeasurements.measurements),
-            }
+            },
+            dataFrameShape: got.summarize.dataFrameShape !== undefined ? {
+                ...got.summarize.dataFrameShape,
+                perOperationNumber: new Map(got.summarize.dataFrameShape.perOperationNumber)
+            } : undefined
         }
     };
     allSummarized.push(got.summarize);
@@ -164,6 +258,10 @@ function processNextUltimateSummary(line, allSummarized) {
         // restore maps
         commonMeasurements: new Map(got.commonMeasurements),
         perSliceMeasurements: new Map(got.perSliceMeasurements),
+        dataFrameShape: got.dataFrameShape !== undefined ? {
+            ...got.dataFrameShape,
+            perOperationNumber: new Map(got.dataFrameShape.perOperationNumber)
+        } : undefined
     };
     allSummarized.push(got);
 }

package/cli/benchmark-app.d.ts CHANGED Viewed

@@ -8,7 +8,9 @@ export interface BenchmarkCliOptions {
     parallel: number;
     limit?: number;
     runs?: number;
+    seed?: string;
     parser: KnownParserName;
+    'dataframe-shape-inference': boolean;
     'enable-pointer-tracking': boolean;
     'max-file-slices': number;
     threshold?: number;

package/cli/benchmark-app.js CHANGED Viewed

@@ -5,6 +5,7 @@ var __importDefault = (this && this.__importDefault) || function (mod) {
 Object.defineProperty(exports, "__esModule", { value: true });
 const fs_1 = __importDefault(require("fs"));
 const path_1 = __importDefault(require("path"));
+const seedrandom_1 = __importDefault(require("seedrandom"));
 const assert_1 = require("../util/assert");
 const files_1 = require("../util/files");
 const log_1 = require("../util/log");
@@ -56,8 +57,9 @@ async function benchmark() {
     }
     if (options.limit) {
         log_1.log.info(`limiting to ${options.limit} files`);
+        const random = options.seed ? (0, seedrandom_1.default)(options.seed) : Math.random;
         // shuffle and limit
-        files.sort(() => Math.random() - 0.5);
+        files.sort(() => random() - 0.5);
     }
     const limit = options.limit ?? files.length;
     const verboseAdd = options.verbose ? ['--verbose'] : [];
@@ -67,10 +69,12 @@ async function benchmark() {
         '--output', path_1.default.join(options.output, path_1.default.relative(f.baseDir, `${f.request.content}.json`)),
         '--slice', options.slice, ...verboseAdd,
         '--parser', options.parser,
+        ...(options['dataframe-shape-inference'] ? ['--dataframe-shape-inference'] : []),
         ...(options['enable-pointer-tracking'] ? ['--enable-pointer-tracking'] : []),
         '--max-slices', `${options['max-file-slices']}`,
         ...(options.threshold ? ['--threshold', `${options.threshold}`] : []),
         '--sampling-strategy', options['sampling-strategy'],
+        ...(options.seed ? ['--seed', options.seed] : []),
     ]);
     const runs = options.runs ?? 1;
     for (let i = 1; i <= runs; i++) {

package/cli/benchmark-helper-app.d.ts CHANGED Viewed

@@ -8,8 +8,10 @@ export interface SingleBenchmarkCliOptions {
     slice: string;
     output?: string;
     parser: KnownParserName;
+    'dataframe-shape-inference': boolean;
     'enable-pointer-tracking': boolean;
     'max-slices': number;
     threshold?: number;
     'sampling-strategy': string;
+    seed?: string;
 }

package/cli/benchmark-helper-app.js CHANGED Viewed

@@ -39,12 +39,10 @@ async function benchmark() {
         fs_1.default.mkdirSync(directory, { recursive: true });
     }
     // Enable pointer analysis if requested, otherwise disable it
-    if (options['enable-pointer-tracking']) {
-        (0, config_1.amendConfig)({ solver: { ...(0, config_1.getConfig)().solver, pointerTracking: true, } });
-    }
-    else {
-        (0, config_1.amendConfig)({ solver: { ...(0, config_1.getConfig)().solver, pointerTracking: false, } });
-    }
+    const config = (0, config_1.amendConfig)((0, config_1.getConfig)(), c => {
+        c.solver.pointerTracking = options['enable-pointer-tracking'];
+        return c;
+    });
     // ensure the file exists
     const fileStat = fs_1.default.statSync(options.input);
     (0, assert_1.guard)(fileStat.isFile(), `File ${options.input} does not exist or is no file`);
@@ -52,7 +50,7 @@ async function benchmark() {
     const maxSlices = options['max-slices'] ?? -1;
     const slicer = new slicer_1.BenchmarkSlicer(options.parser);
     try {
-        await slicer.init(request, undefined, options.threshold);
+        await slicer.init(request, config, undefined, options.threshold);
         // ${escape}1F${escape}1G${escape}2K for line reset
         if (options.slice === 'all') {
             const count = await slicer.sliceForAll(all_variables_1.DefaultAllVariablesFilter, (i, total, arr) => console.log(`${prefix} Slicing ${i + 1}/${total} [${JSON.stringify(arr[i])}]`), { maxSliceCount: maxSlices });
@@ -66,11 +64,18 @@ async function benchmark() {
         else {
             const limit = parseInt(options.slice);
             console.log(`${prefix} Slicing up to ${limit} possible slices`);
-            const count = await slicer.sliceForAll(all_variables_1.DefaultAllVariablesFilter, (i, total, arr) => console.log(`${prefix} Slicing ${i + 1}/${total} [${JSON.stringify(arr[i])}]`), { sampleCount: limit, maxSliceCount: maxSlices, sampleStrategy: options['sampling-strategy'] });
+            const count = await slicer.sliceForAll(all_variables_1.DefaultAllVariablesFilter, (i, total, arr) => console.log(`${prefix} Slicing ${i + 1}/${total} [${JSON.stringify(arr[i])}]`), { sampleCount: limit, maxSliceCount: maxSlices, sampleStrategy: options['sampling-strategy'], seed: options.seed });
             console.log(`${prefix} Completed Slicing`);
             (0, assert_1.guard)(count >= 0, `Number of slices exceeded limit of ${maxSlices} with ${-count} slices, skipping in count`);
             (0, assert_1.guard)(count > 0, `No possible slices found for ${options.input}, skipping in count`);
         }
+        if (options['dataframe-shape-inference']) {
+            console.log(`${prefix} Extracting control flow graph for data frame shape inference`);
+            slicer.extractCFG();
+            console.log(`${prefix} Performing shape inference for data frames`);
+            slicer.inferDataFrameShapes();
+            console.log(`${prefix} Completed data frame shape inference`);
+        }
         const { stats } = slicer.finish();
         const output = {
             filename: options.input,

package/cli/common/options.js CHANGED Viewed

@@ -16,11 +16,13 @@ exports.benchmarkOptions = [
     { name: 'help', alias: 'h', type: Boolean, description: 'Print this usage guide' },
     { name: 'limit', alias: 'l', type: Number, description: 'Limit the number of files to process (if given, this will choose these files randomly and add the chosen names to the output' },
     { name: 'runs', alias: 'r', type: Number, description: 'The amount of benchmark runs that should be done, out of which an average will be calculated' },
+    { name: 'seed', type: String, description: 'The random seed for sampling the files if a limit is set, and for sampling the slicing criteria if a maximum is set' },
     { name: 'input', alias: 'i', type: String, description: 'Pass a folder or file as src to read from. Alternatively, pass a single JSON file that contains a list of paths.', multiple: true, defaultOption: true, defaultValue: [], typeLabel: '{underline files/folders}' },
     { name: 'parallel', alias: 'p', type: String, description: 'Number of parallel executors (defaults to {italic max(cpu.count-1, 1)})', defaultValue: Math.max(os_1.default.cpus().length - 1, 1), typeLabel: '{underline number}' },
     { name: 'slice', alias: 's', type: String, description: 'Automatically slice for *all* variables (default) or *no* slicing and only parsing/dataflow construction. Numbers will indicate: sample X random slices from all.', defaultValue: 'all', typeLabel: '{underline all/no}' },
     { name: 'output', alias: 'o', type: String, description: `Folder to write all the measurements to in a per-file-basis (defaults to {italic benchmark-${StartTimeString}})`, defaultValue: `benchmark-${StartTimeString}`, typeLabel: '{underline folder}' },
     { name: 'parser', type: String, description: 'The parser to use for the benchmark', defaultValue: 'r-shell', typeLabel: '{underline parser}' },
+    { name: 'dataframe-shape-inference', type: Boolean, description: 'Infer the shape of data frames using abstract interpretation (includes control flow graph extraction)', defaultValue: false },
     { name: 'enable-pointer-tracking', type: Boolean, description: 'Run dataflow analysis with pointer tracking', defaultValue: false },
     { name: 'max-file-slices', type: Number, description: 'If file has more than passed number of slices, the file is not processed', defaultValue: -1, typeLabel: '{underline number}' },
     { name: 'threshold', alias: 't', type: Number, description: 'How many re-visits of the same node are ok?', defaultValue: undefined, typeLabel: '{underline number}' },
@@ -36,10 +38,12 @@ exports.benchmarkHelperOptions = [
     { name: 'slice', alias: 's', type: String, description: 'Automatically slice for *all* variables (default) or *no* slicing and only parsing/dataflow construction. Numbers will indicate: sample X random slices from all.', defaultValue: 'all', typeLabel: '{underline all/no}' },
     { name: 'output', alias: 'o', type: String, description: 'File to write the measurements to (appends a single line in JSON format)', typeLabel: '{underline file}' },
     { name: 'parser', type: String, description: 'The parser to use for the benchmark', defaultValue: 'r-shell', typeLabel: '{underline parser}' },
+    { name: 'dataframe-shape-inference', type: Boolean, description: 'Infer the shape of data frames using abstract interpretation (includes control flow graph extraction)', defaultValue: false },
     { name: 'enable-pointer-tracking', type: Boolean, description: 'Run dataflow analysis with pointer tracking', defaultValue: false },
     { name: 'max-slices', type: Number, description: 'If file has more than passed number of slices, the file is not processed', defaultValue: -1, typeLabel: '{underline number}' },
     { name: 'threshold', alias: 't', type: Number, description: 'How many re-visits of the same node are ok?', defaultValue: undefined, typeLabel: '{underline number}' },
     { name: 'sampling-strategy', type: String, description: 'Which strategy to use, when sampling is enabled', defaultValue: 'random', typeLabel: '{underline random/equidistant}' },
+    { name: 'seed', type: String, description: 'The random seed for sampling the slicing criteria if a maximum is set' },
 ];
 exports.exportQuadsOptions = [
     { name: 'verbose', alias: 'v', type: Boolean, description: 'Run with verbose logging' },

package/cli/export-quads-app.js CHANGED Viewed

@@ -10,6 +10,7 @@ const files_1 = require("../util/files");
 const script_1 = require("./common/script");
 const shell_1 = require("../r-bridge/shell");
 const retriever_1 = require("../r-bridge/retriever");
+const config_1 = require("../config");
 const options = (0, script_1.processCommandLineArgs)('export-quads', [], {
     subtitle: 'Generate RDF N-Quads from the AST of a given R script',
     examples: [
@@ -17,7 +18,7 @@ const options = (0, script_1.processCommandLineArgs)('export-quads', [], {
         '{bold --help}'
     ]
 });
-const shell = new shell_1.RShell();
+const shell = new shell_1.RShell((0, config_1.getEngineConfig)((0, config_1.getConfig)(), 'r-shell'));
 async function writeQuadForSingleFile(request, output) {
     const normalized = await (0, retriever_1.retrieveNormalizedAstFromRCode)(request, shell);
     const serialized = (0, quads_1.serialize2quads)(normalized.ast, { context: request.content });

package/cli/flowr.js CHANGED Viewed

@@ -52,45 +52,51 @@ if (options['no-ansi']) {
     log_1.log.info('disabling ansi colors');
     (0, ansi_1.setFormatter)(ansi_1.voidFormatter);
 }
-let usedConfig = false;
-if (options['config-json']) {
-    const config = (0, config_1.parseConfig)(options['config-json']);
-    if (config) {
-        log_1.log.info(`Using passed config ${JSON.stringify(config)}`);
-        (0, config_1.setConfig)(config);
-        usedConfig = true;
+function createConfig() {
+    let config;
+    if (options['config-json']) {
+        const passedConfig = (0, config_1.parseConfig)(options['config-json']);
+        if (passedConfig) {
+            log_1.log.info(`Using passed config ${JSON.stringify(passedConfig)}`);
+            config = passedConfig;
+        }
     }
-}
-if (!usedConfig) {
-    if (options['config-file']) {
-        // validate it exists
-        if (!fs_1.default.existsSync(path_1.default.resolve(options['config-file']))) {
-            log_1.log.error(`Config file '${options['config-file']}' does not exist`);
-            process.exit(1);
+    if (config == undefined) {
+        if (options['config-file']) {
+            // validate it exists
+            if (!fs_1.default.existsSync(path_1.default.resolve(options['config-file']))) {
+                log_1.log.error(`Config file '${options['config-file']}' does not exist`);
+                process.exit(1);
+            }
         }
+        config = (0, config_1.getConfig)(options['config-file'] ?? flowr_main_options_1.defaultConfigFile);
     }
-    (0, config_1.setConfigFile)(options['config-file'] ?? flowr_main_options_1.defaultConfigFile, undefined, true);
-}
-// for all options that we manually supply that have a config equivalent, set them in the config
-if (!options['engine.r-shell.disabled']) {
-    (0, config_1.amendConfig)({ engines: [{ type: 'r-shell', rPath: options['r-path'] || options['engine.r-shell.r-path'] }] });
-}
-if (!options['engine.tree-sitter.disabled']) {
-    (0, config_1.amendConfig)({ engines: [{
+    // for all options that we manually supply that have a config equivalent, set them in the config
+    config = (0, config_1.amendConfig)(config, c => {
+        c.engines ??= [];
+        if (!options['engine.r-shell.disabled']) {
+            c.engines.push({ type: 'r-shell', rPath: options['r-path'] || options['engine.r-shell.r-path'] });
+        }
+        if (!options['engine.tree-sitter.disabled']) {
+            c.engines.push({
                 type: 'tree-sitter',
                 wasmPath: options['engine.tree-sitter.wasm-path'],
                 treeSitterWasmPath: options['engine.tree-sitter.tree-sitter-wasm-path'],
                 lax: options['engine.tree-sitter.lax']
-            }] });
-}
-if (options['default-engine']) {
-    (0, config_1.amendConfig)({ defaultEngine: options['default-engine'] });
+            });
+        }
+        if (options['default-engine']) {
+            c.defaultEngine = options['default-engine'];
+        }
+        return c;
+    });
+    return config;
 }
-async function retrieveEngineInstances() {
+async function retrieveEngineInstances(config) {
     const engines = {};
-    if ((0, config_1.getEngineConfig)('r-shell')) {
+    if ((0, config_1.getEngineConfig)(config, 'r-shell')) {
         // we keep an active shell session to allow other parse investigations :)
-        engines['r-shell'] = new shell_1.RShell({
+        engines['r-shell'] = new shell_1.RShell((0, config_1.getEngineConfig)(config, 'r-shell'), {
             revive: 2 /* RShellReviveOptions.Always */,
             onRevive: (code, signal) => {
                 const signalText = signal == null ? '' : ` and signal ${signal}`;
@@ -99,11 +105,11 @@ async function retrieveEngineInstances() {
             }
         });
     }
-    if ((0, config_1.getEngineConfig)('tree-sitter')) {
-        await tree_sitter_executor_1.TreeSitterExecutor.initTreeSitter();
+    if ((0, config_1.getEngineConfig)(config, 'tree-sitter')) {
+        await tree_sitter_executor_1.TreeSitterExecutor.initTreeSitter((0, config_1.getEngineConfig)(config, 'tree-sitter'));
         engines['tree-sitter'] = new tree_sitter_executor_1.TreeSitterExecutor();
     }
-    let defaultEngine = (0, config_1.getConfig)().defaultEngine;
+    let defaultEngine = config.defaultEngine;
     if (!defaultEngine || !engines[defaultEngine]) {
         // if a default engine isn't specified, we just take the first one we have
         defaultEngine = Object.keys(engines)[0];
@@ -111,7 +117,19 @@ async function retrieveEngineInstances() {
     log_1.log.info(`Using engines ${Object.keys(engines).join(', ')} with default ${defaultEngine}`);
     return { engines, default: defaultEngine };
 }
+function hookSignalHandlers(engines) {
+    const end = () => {
+        if (options.execute === undefined) {
+            console.log(`\n${(0, ansi_1.italic)('Exiting...')}`);
+        }
+        Object.values(engines.engines).forEach(e => e?.close());
+        process.exit(0);
+    };
+    process.on('SIGINT', end);
+    process.on('SIGTERM', end);
+}
 async function mainRepl() {
+    const config = createConfig();
     if (options.script) {
         const target = scripts_info_1.scripts[options.script].target;
         (0, assert_1.guard)(target !== undefined, `Unknown script ${options.script}, pick one of ${(0, flowr_main_options_1.getScriptsText)()}.`);
@@ -124,7 +142,7 @@ async function mainRepl() {
         console.log((0, command_line_usage_1.default)(exports.optionHelp));
         process.exit(0);
     }
-    const engines = await retrieveEngineInstances();
+    const engines = await retrieveEngineInstances(config);
     const defaultEngine = engines.engines[engines.default];
     if (options.version) {
         for (const engine of Object.values(engines.engines)) {
@@ -133,39 +151,22 @@ async function mainRepl() {
         }
         process.exit(0);
     }
-    const end = () => {
-        if (options.execute === undefined) {
-            console.log(`\n${(0, ansi_1.italic)('Exiting...')}`);
-        }
-        Object.values(engines.engines).forEach(e => e?.close());
-        process.exit(0);
-    };
-    // hook some handlers
-    process.on('SIGINT', end);
-    process.on('SIGTERM', end);
+    hookSignalHandlers(engines);
     const allowRSessionAccess = options['r-session-access'] ?? false;
     if (options.execute) {
-        await (0, core_1.replProcessAnswer)(repl_main_1.standardReplOutput, options.execute, defaultEngine, allowRSessionAccess);
+        await (0, core_1.replProcessAnswer)(config, repl_main_1.standardReplOutput, options.execute, defaultEngine, allowRSessionAccess);
     }
     else {
         await (0, print_version_1.printVersionRepl)(defaultEngine);
-        await (0, core_1.repl)({ parser: defaultEngine, allowRSessionAccess });
+        await (0, core_1.repl)(config, { parser: defaultEngine, allowRSessionAccess });
     }
     process.exit(0);
 }
 async function mainServer(backend = new net_1.NetServer()) {
-    const engines = await retrieveEngineInstances();
-    const end = () => {
-        if (options.execute === undefined) {
-            console.log(`\n${(0, ansi_1.italic)('Exiting...')}`);
-        }
-        Object.values(engines.engines).forEach(e => e?.close());
-        process.exit(0);
-    };
-    // hook some handlers
-    process.on('SIGINT', end);
-    process.on('SIGTERM', end);
-    await new server_1.FlowRServer(engines.engines, engines.default, options['r-session-access'], backend).start(options.port);
+    const config = createConfig();
+    const engines = await retrieveEngineInstances(config);
+    hookSignalHandlers(engines);
+    await new server_1.FlowRServer(engines.engines, engines.default, options['r-session-access'], config, backend).start(options.port);
 }
 if (options.server) {
     void mainServer(options.ws ? new net_1.WebSocketServerWrapper() : new net_1.NetServer());