@nahisaho/satori 0.25.5 → 0.26.0
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/README.md +57 -1
- package/bin/satori.js +331 -29
- package/package.json +32 -2
- package/src/.github/skills/scientific-academic-writing/SKILL.md +10 -0
- package/src/.github/skills/scientific-active-learning/SKILL.md +10 -0
- package/src/.github/skills/scientific-adaptive-experiments/SKILL.md +10 -0
- package/src/.github/skills/scientific-advanced-imaging/SKILL.md +10 -0
- package/src/.github/skills/scientific-advanced-visualization/SKILL.md +10 -0
- package/src/.github/skills/scientific-anomaly-detection/SKILL.md +10 -0
- package/src/.github/skills/scientific-automl/SKILL.md +10 -0
- package/src/.github/skills/scientific-bayesian-statistics/SKILL.md +10 -0
- package/src/.github/skills/scientific-biobank-cohort/SKILL.md +10 -0
- package/src/.github/skills/scientific-biosignal-processing/SKILL.md +10 -0
- package/src/.github/skills/scientific-causal-inference/SKILL.md +10 -0
- package/src/.github/skills/scientific-causal-ml/SKILL.md +10 -0
- package/src/.github/skills/scientific-clinical-nlp/SKILL.md +10 -0
- package/src/.github/skills/scientific-clinical-pharmacology/SKILL.md +10 -0
- package/src/.github/skills/scientific-clinical-standards/SKILL.md +11 -0
- package/src/.github/skills/scientific-crispr-design/SKILL.md +10 -0
- package/src/.github/skills/scientific-critical-review/SKILL.md +10 -1
- package/src/.github/skills/scientific-data-preprocessing/SKILL.md +10 -0
- package/src/.github/skills/scientific-data-profiling/SKILL.md +10 -0
- package/src/.github/skills/scientific-data-simulation/SKILL.md +10 -0
- package/src/.github/skills/scientific-data-submission/SKILL.md +10 -0
- package/src/.github/skills/scientific-deep-chemistry/SKILL.md +10 -0
- package/src/.github/skills/scientific-deep-learning/SKILL.md +10 -0
- package/src/.github/skills/scientific-doe/SKILL.md +10 -0
- package/src/.github/skills/scientific-eda-correlation/SKILL.md +10 -0
- package/src/.github/skills/scientific-ensemble-methods/SKILL.md +10 -0
- package/src/.github/skills/scientific-explainable-ai/SKILL.md +10 -0
- package/src/.github/skills/scientific-feature-importance/SKILL.md +10 -0
- package/src/.github/skills/scientific-federated-learning/SKILL.md +10 -0
- package/src/.github/skills/scientific-geospatial-analysis/SKILL.md +10 -0
- package/src/.github/skills/scientific-glycomics/SKILL.md +10 -0
- package/src/.github/skills/scientific-gpu-singlecell/SKILL.md +10 -0
- package/src/.github/skills/scientific-hgnc-nomenclature/SKILL.md +10 -0
- package/src/.github/skills/scientific-hypothesis-pipeline/SKILL.md +10 -1
- package/src/.github/skills/scientific-image-analysis/SKILL.md +10 -0
- package/src/.github/skills/scientific-interactive-dashboard/SKILL.md +10 -0
- package/src/.github/skills/scientific-lab-automation/SKILL.md +10 -0
- package/src/.github/skills/scientific-latex-formatter/SKILL.md +10 -0
- package/src/.github/skills/scientific-lipidomics/SKILL.md +10 -0
- package/src/.github/skills/scientific-materials-characterization/SKILL.md +10 -0
- package/src/.github/skills/scientific-md-simulation/SKILL.md +10 -0
- package/src/.github/skills/scientific-medical-imaging/SKILL.md +10 -0
- package/src/.github/skills/scientific-metabolic-atlas/SKILL.md +11 -0
- package/src/.github/skills/scientific-metabolic-flux/SKILL.md +10 -0
- package/src/.github/skills/scientific-metabolomics-network/SKILL.md +10 -0
- package/src/.github/skills/scientific-metagenome-assembled-genomes/SKILL.md +10 -0
- package/src/.github/skills/scientific-missing-data-analysis/SKILL.md +10 -0
- package/src/.github/skills/scientific-ml-classification/SKILL.md +10 -0
- package/src/.github/skills/scientific-ml-regression/SKILL.md +10 -0
- package/src/.github/skills/scientific-model-monitoring/SKILL.md +10 -0
- package/src/.github/skills/scientific-multi-task-learning/SKILL.md +10 -0
- package/src/.github/skills/scientific-nci60-screening/SKILL.md +10 -0
- package/src/.github/skills/scientific-network-visualization/SKILL.md +10 -0
- package/src/.github/skills/scientific-neural-architecture-search/SKILL.md +10 -0
- package/src/.github/skills/scientific-neuroscience-electrophysiology/SKILL.md +10 -0
- package/src/.github/skills/scientific-paper-quality/SKILL.md +10 -0
- package/src/.github/skills/scientific-pca-tsne/SKILL.md +10 -0
- package/src/.github/skills/scientific-peer-review-response/SKILL.md +10 -0
- package/src/.github/skills/scientific-perturbation-analysis/SKILL.md +10 -0
- package/src/.github/skills/scientific-phylogenetics/SKILL.md +10 -0
- package/src/.github/skills/scientific-pipeline-scaffold/SKILL.md +10 -0
- package/src/.github/skills/scientific-plant-biology/SKILL.md +10 -0
- package/src/.github/skills/scientific-presentation-design/SKILL.md +10 -0
- package/src/.github/skills/scientific-process-optimization/SKILL.md +10 -0
- package/src/.github/skills/scientific-publication-figures/SKILL.md +10 -0
- package/src/.github/skills/scientific-quantum-computing/SKILL.md +10 -0
- package/src/.github/skills/scientific-radiology-ai/SKILL.md +10 -0
- package/src/.github/skills/scientific-reinforcement-learning/SKILL.md +10 -0
- package/src/.github/skills/scientific-reproducible-reporting/SKILL.md +10 -0
- package/src/.github/skills/scientific-research-methodology/SKILL.md +10 -0
- package/src/.github/skills/scientific-revision-tracker/SKILL.md +10 -0
- package/src/.github/skills/scientific-scatac-signac/SKILL.md +10 -0
- package/src/.github/skills/scientific-scvi-integration/SKILL.md +10 -0
- package/src/.github/skills/scientific-semi-supervised-learning/SKILL.md +10 -0
- package/src/.github/skills/scientific-spatial-multiomics/SKILL.md +10 -0
- package/src/.github/skills/scientific-spectral-signal/SKILL.md +10 -0
- package/src/.github/skills/scientific-squidpy-advanced/SKILL.md +11 -0
- package/src/.github/skills/scientific-statistical-simulation/SKILL.md +10 -0
- package/src/.github/skills/scientific-statistical-testing/SKILL.md +10 -0
- package/src/.github/skills/scientific-streaming-analytics/SKILL.md +10 -0
- package/src/.github/skills/scientific-supplementary-generator/SKILL.md +10 -0
- package/src/.github/skills/scientific-symbolic-mathematics/SKILL.md +10 -0
- package/src/.github/skills/scientific-time-series/SKILL.md +10 -0
- package/src/.github/skills/scientific-time-series-forecasting/SKILL.md +10 -0
- package/src/.github/skills/scientific-toxicology-env/SKILL.md +10 -0
- package/src/.github/skills/scientific-transfer-learning/SKILL.md +10 -0
- package/src/.github/skills/scientific-uncertainty-quantification/SKILL.md +10 -0
|
@@ -4,6 +4,10 @@ description: |
|
|
|
4
4
|
異常検知・外れ値検出スキル。Isolation Forest・LOF・
|
|
5
5
|
One-Class SVM・Autoencoder 異常検知・統計的工程管理 (SPC)・
|
|
6
6
|
多変量異常検知・異常スコアリング・閾値最適化。
|
|
7
|
+
tu_tools:
|
|
8
|
+
- key: openml
|
|
9
|
+
name: OpenML
|
|
10
|
+
description: 異常検知ベンチマーク・データセット
|
|
7
11
|
---
|
|
8
12
|
|
|
9
13
|
# Scientific Anomaly Detection
|
|
@@ -294,3 +298,9 @@ eda-correlation → anomaly-detection → ml-classification
|
|
|
294
298
|
| `anomaly_ensemble.csv` | アンサンブル異常検知結果 | → EDA |
|
|
295
299
|
| `autoencoder_anomaly.json` | AE 異常スコア | → reporting |
|
|
296
300
|
| `spc_control_chart.png` | SPC 管理図 | → process-optimization |
|
|
301
|
+
|
|
302
|
+
## ToolUniverse 連携
|
|
303
|
+
|
|
304
|
+
| TU Key | ツール名 | 連携内容 |
|
|
305
|
+
|--------|---------|--------|
|
|
306
|
+
| `openml` | OpenML | 異常検知ベンチマーク・データセット |
|
|
@@ -5,6 +5,10 @@ description: |
|
|
|
5
5
|
FLAML 高速 AutoML・Auto-sklearn モデル選択・
|
|
6
6
|
NAS (Neural Architecture Search)・
|
|
7
7
|
特徴量エンジニアリング自動化・モデル比較パイプライン。
|
|
8
|
+
tu_tools:
|
|
9
|
+
- key: openml
|
|
10
|
+
name: OpenML
|
|
11
|
+
description: AutoML ベンチマーク・タスク参照
|
|
8
12
|
---
|
|
9
13
|
|
|
10
14
|
# Scientific AutoML
|
|
@@ -262,3 +266,9 @@ eda-correlation → automl → ensemble-methods
|
|
|
262
266
|
| `optuna_trials.csv` | 試行履歴 | → 可視化 |
|
|
263
267
|
| `param_importance.png` | パラメータ重要度 | → レポート |
|
|
264
268
|
| `model_comparison.csv` | モデル比較 | → ensemble-methods |
|
|
269
|
+
|
|
270
|
+
## ToolUniverse 連携
|
|
271
|
+
|
|
272
|
+
| TU Key | ツール名 | 連携内容 |
|
|
273
|
+
|--------|---------|--------|
|
|
274
|
+
| `openml` | OpenML | AutoML ベンチマーク・タスク参照 |
|
|
@@ -4,6 +4,10 @@ description: |
|
|
|
4
4
|
ベイズ統計スキル。PyMC・Stan・ArviZ を活用し、ベイズ回帰・階層モデル・
|
|
5
5
|
MCMC サンプリング・ベイズ最適化・事後予測チェック・モデル比較を支援。
|
|
6
6
|
「ベイズ回帰して」「MCMC で推定して」「事後分布を求めて」で発火。
|
|
7
|
+
tu_tools:
|
|
8
|
+
- key: biotools
|
|
9
|
+
name: bio.tools
|
|
10
|
+
description: ベイズ統計ツールレジストリ検索
|
|
7
11
|
---
|
|
8
12
|
|
|
9
13
|
# Scientific Bayesian Statistics
|
|
@@ -354,6 +358,12 @@ model {
|
|
|
354
358
|
- [ ] モデル比較 (LOO-CV / WAIC)
|
|
355
359
|
- [ ] 結果レポート・プロット生成
|
|
356
360
|
|
|
361
|
+
## ToolUniverse 連携
|
|
362
|
+
|
|
363
|
+
| TU Key | ツール名 | 連携内容 |
|
|
364
|
+
|--------|---------|--------|
|
|
365
|
+
| `biotools` | bio.tools | ベイズ統計ツールレジストリ検索 |
|
|
366
|
+
|
|
357
367
|
## References
|
|
358
368
|
|
|
359
369
|
### Output Files
|
|
@@ -4,6 +4,10 @@ description: |
|
|
|
4
4
|
バイオバンク・大規模コホートデータ解析スキル。UK Biobank /
|
|
5
5
|
BBJ / All of Us 等の大規模コホートデータに対するフェノタイプ
|
|
6
6
|
辞書検索・GWAS サマリー統計処理・PheWAS パイプライン。
|
|
7
|
+
tu_tools:
|
|
8
|
+
- key: clinvar
|
|
9
|
+
name: ClinVar
|
|
10
|
+
description: バリアント臨床的意義データ検索
|
|
7
11
|
---
|
|
8
12
|
|
|
9
13
|
# Scientific Biobank Cohort
|
|
@@ -266,3 +270,9 @@ epidemiology-public-health → biobank-cohort → population-genetics
|
|
|
266
270
|
| `results/gwas_significant.csv` | Genome-wide significant SNP | → population-genetics |
|
|
267
271
|
| `results/manhattan_data.csv` | Manhattan プロットデータ | → GWAS 可視化 |
|
|
268
272
|
| `results/phenotype_dict.csv` | フェノタイプ辞書 | → PheWAS |
|
|
273
|
+
|
|
274
|
+
## ToolUniverse 連携
|
|
275
|
+
|
|
276
|
+
| TU Key | ツール名 | 連携内容 |
|
|
277
|
+
|--------|---------|--------|
|
|
278
|
+
| `clinvar` | ClinVar | バリアント臨床的意義データ検索 |
|
|
@@ -5,6 +5,10 @@ description: |
|
|
|
5
5
|
EEG(マルチチャネル・バンドパワーδ/θ/α/β/γ・スペクトログラム・ERP)、
|
|
6
6
|
EMG(バースト検出・包絡線)、呼吸信号(RSA)の解析パイプライン。
|
|
7
7
|
Scientific Skills Exp-08 で確立したパターン。
|
|
8
|
+
tu_tools:
|
|
9
|
+
- key: biotools
|
|
10
|
+
name: bio.tools
|
|
11
|
+
description: 生体信号処理ツール検索
|
|
8
12
|
---
|
|
9
13
|
|
|
10
14
|
# Scientific Biosignal Processing
|
|
@@ -352,6 +356,12 @@ def detect_muscle_bursts(envelope, fs, threshold_factor=2.0,
|
|
|
352
356
|
return bursts
|
|
353
357
|
```
|
|
354
358
|
|
|
359
|
+
## ToolUniverse 連携
|
|
360
|
+
|
|
361
|
+
| TU Key | ツール名 | 連携内容 |
|
|
362
|
+
|--------|---------|--------|
|
|
363
|
+
| `biotools` | bio.tools | 生体信号処理ツール検索 |
|
|
364
|
+
|
|
355
365
|
## References
|
|
356
366
|
|
|
357
367
|
- **Exp-08**: ECG R波検出・HRV・Poincaré、EEG バンドパワー・スペクトログラム・ERP、EMG バースト
|
|
@@ -4,6 +4,10 @@ description: |
|
|
|
4
4
|
因果推論スキル。傾向スコアマッチング(PSM)、逆確率重み付け(IPW / IPTW)、
|
|
5
5
|
操作変数法(2SLS)、差分の差分法(DID)、回帰不連続デザイン(RDD)、
|
|
6
6
|
DAG ベースの共変量選択(backdoor criterion)、感度分析テンプレートを提供。
|
|
7
|
+
tu_tools:
|
|
8
|
+
- key: open_alex
|
|
9
|
+
name: OpenAlex
|
|
10
|
+
description: 因果推論関連文献検索
|
|
7
11
|
---
|
|
8
12
|
|
|
9
13
|
# Scientific Causal Inference
|
|
@@ -325,6 +329,12 @@ def rosenbaum_sensitivity(matched_outcomes_treated, matched_outcomes_control,
|
|
|
325
329
|
return pd.DataFrame(results)
|
|
326
330
|
```
|
|
327
331
|
|
|
332
|
+
## ToolUniverse 連携
|
|
333
|
+
|
|
334
|
+
| TU Key | ツール名 | 連携内容 |
|
|
335
|
+
|--------|---------|--------|
|
|
336
|
+
| `open_alex` | OpenAlex | 因果推論関連文献検索 |
|
|
337
|
+
|
|
328
338
|
## References
|
|
329
339
|
|
|
330
340
|
### Output Files
|
|
@@ -4,6 +4,10 @@ description: |
|
|
|
4
4
|
因果機械学習スキル。DoWhy 因果モデル・EconML CATE 推定・
|
|
5
5
|
Double/Debiased ML・Causal Forest・メタラーナー (S/T/X)・
|
|
6
6
|
異質的処置効果 (HTE)・因果特徴量選択。
|
|
7
|
+
tu_tools:
|
|
8
|
+
- key: openml
|
|
9
|
+
name: OpenML
|
|
10
|
+
description: 因果推論 ML データセット参照
|
|
7
11
|
---
|
|
8
12
|
|
|
9
13
|
# Scientific Causal ML
|
|
@@ -238,3 +242,9 @@ causal-inference → causal-ml → feature-importance
|
|
|
238
242
|
| `dowhy_causal_model.json` | DoWhy 因果モデル | → reporting |
|
|
239
243
|
| `cate_estimates.csv` | CATE 推定値 | → precision-medicine |
|
|
240
244
|
| `causal_feature_importance.csv` | 因果特徴量重要度 | → explainable-ai |
|
|
245
|
+
|
|
246
|
+
## ToolUniverse 連携
|
|
247
|
+
|
|
248
|
+
| TU Key | ツール名 | 連携内容 |
|
|
249
|
+
|--------|---------|--------|
|
|
250
|
+
| `openml` | OpenML | 因果推論 ML データセット参照 |
|
|
@@ -6,6 +6,10 @@ description: |
|
|
|
6
6
|
ICD-10/SNOMED-CT エンティティリンキング、
|
|
7
7
|
匿名化 (De-identification) パイプライン。
|
|
8
8
|
TU 外スキル (直接 Python ライブラリ)。
|
|
9
|
+
tu_tools:
|
|
10
|
+
- key: umls
|
|
11
|
+
name: UMLS
|
|
12
|
+
description: 医学用語統一システム検索
|
|
9
13
|
---
|
|
10
14
|
|
|
11
15
|
# Scientific Clinical NLP
|
|
@@ -248,3 +252,9 @@ text-mining-nlp → clinical-nlp → clinical-reporting
|
|
|
248
252
|
| `results/clinical_ner.csv` | 臨床エンティティ+否定 | → phenotype-hpo |
|
|
249
253
|
| `results/clinical_sections.csv` | セクション分類 | → clinical-reporting |
|
|
250
254
|
| `results/entity_linking.csv` | UMLS/SNOMED リンキング | → disease-research |
|
|
255
|
+
|
|
256
|
+
## ToolUniverse 連携
|
|
257
|
+
|
|
258
|
+
| TU Key | ツール名 | 連携内容 |
|
|
259
|
+
|--------|---------|--------|
|
|
260
|
+
| `umls` | UMLS | 医学用語統一システム検索 |
|
|
@@ -6,6 +6,10 @@ description: |
|
|
|
6
6
|
Emax/Sigmoid PD モデリング・薬物間相互作用予測・
|
|
7
7
|
臨床薬理パイプライン。
|
|
8
8
|
TU 外スキル (Python + nlmixr2/mrgsolve ラッパー)。
|
|
9
|
+
tu_tools:
|
|
10
|
+
- key: drugbank
|
|
11
|
+
name: DrugBank
|
|
12
|
+
description: 薬物動態・相互作用データ検索
|
|
9
13
|
---
|
|
10
14
|
|
|
11
15
|
# Scientific Clinical Pharmacology
|
|
@@ -359,3 +363,9 @@ admet-pharmacokinetics → clinical-pharmacology → pharmacogenomics
|
|
|
359
363
|
| `pk_simulation.csv` | PK シミュレーション | → dose-response |
|
|
360
364
|
| `popk_estimates.json` | PopPK パラメータ | → pharmacogenomics |
|
|
361
365
|
| `tdm_recommendation.json` | TDM 推奨用量 | → clinical-decision |
|
|
366
|
+
|
|
367
|
+
## ToolUniverse 連携
|
|
368
|
+
|
|
369
|
+
| TU Key | ツール名 | 連携内容 |
|
|
370
|
+
|--------|---------|--------|
|
|
371
|
+
| `drugbank` | DrugBank | 薬物動態・相互作用データ検索 |
|
|
@@ -4,6 +4,7 @@ description: |
|
|
|
4
4
|
臨床標準用語・コードマッピングスキル。LOINC 臨床検査コード・
|
|
5
5
|
ICD-10/ICD-11 疾病分類・FHIR R4 リソースマッピング・
|
|
6
6
|
SNOMED CT 用語変換・臨床用語相互運用パイプライン。
|
|
7
|
+
ToolUniverse 連携: loinc。
|
|
7
8
|
tu_tools:
|
|
8
9
|
- key: loinc
|
|
9
10
|
name: LOINC
|
|
@@ -11,6 +12,10 @@ tu_tools:
|
|
|
11
12
|
- key: icd
|
|
12
13
|
name: ICD
|
|
13
14
|
description: WHO 国際疾病分類 ICD-10/ICD-11
|
|
15
|
+
tu_tools:
|
|
16
|
+
- key: loinc
|
|
17
|
+
name: LOINC
|
|
18
|
+
description: 臨床検査コード標準検索
|
|
14
19
|
---
|
|
15
20
|
|
|
16
21
|
# Scientific Clinical Standards
|
|
@@ -442,3 +447,9 @@ clinical-reporting → clinical-standards → clinical-decision-support
|
|
|
442
447
|
| `loinc_mappings.csv` | LOINC コードマッピング | → clinical-decision |
|
|
443
448
|
| `icd_mappings.csv` | ICD コードマッピング | → epidemiology |
|
|
444
449
|
| `fhir_bundle.json` | FHIR R4 バンドル | → EHR 統合 |
|
|
450
|
+
|
|
451
|
+
## ToolUniverse 連携
|
|
452
|
+
|
|
453
|
+
| TU Key | ツール名 | 連携内容 |
|
|
454
|
+
|--------|---------|--------|
|
|
455
|
+
| `loinc` | LOINC | 臨床検査コード標準検索 |
|
|
@@ -6,6 +6,10 @@ description: |
|
|
|
6
6
|
CRISPRscan/Rule Set 2 活性予測・検証プライマー設計・
|
|
7
7
|
sgRNA スクリーニングライブラリ構築パイプライン。
|
|
8
8
|
TU 外スキル (Python ライブラリ + ローカル解析)。
|
|
9
|
+
tu_tools:
|
|
10
|
+
- key: ensembl
|
|
11
|
+
name: Ensembl
|
|
12
|
+
description: gRNA 設計用ゲノム配列参照
|
|
9
13
|
---
|
|
10
14
|
|
|
11
15
|
# Scientific CRISPR Design
|
|
@@ -367,3 +371,9 @@ genome-sequence-tools → crispr-design → perturbation-analysis
|
|
|
367
371
|
| `grna_candidates.csv` | gRNA 候補リスト | → ランキング |
|
|
368
372
|
| `off_target_report.csv` | オフターゲット評価 | → 安全性確認 |
|
|
369
373
|
| `sgrna_library.csv` | sgRNA ライブラリ | → perturbation-analysis |
|
|
374
|
+
|
|
375
|
+
## ToolUniverse 連携
|
|
376
|
+
|
|
377
|
+
| TU Key | ツール名 | 連携内容 |
|
|
378
|
+
|--------|---------|--------|
|
|
379
|
+
| `ensembl` | Ensembl | gRNA 設計用ゲノム配列参照 |
|
|
@@ -1,4 +1,3 @@
|
|
|
1
|
-
```skill
|
|
2
1
|
---
|
|
3
2
|
name: scientific-critical-review
|
|
4
3
|
description: |
|
|
@@ -6,6 +5,10 @@ description: |
|
|
|
6
5
|
データ解釈の妥当性、先行研究との整合性、統計的主張の正確性を多角的に検証し、
|
|
7
6
|
具体的な修正案を生成する。「論文をレビューして」「考察を深めて」「草稿を改善して」で発火。
|
|
8
7
|
scientific-academic-writing で草稿を作成した後のセルフレビューに使用。
|
|
8
|
+
tu_tools:
|
|
9
|
+
- key: crossref
|
|
10
|
+
name: Crossref
|
|
11
|
+
description: 論文検証・引用メタデータ参照
|
|
9
12
|
---
|
|
10
13
|
|
|
11
14
|
# Scientific Critical Review & Revision
|
|
@@ -739,6 +742,12 @@ def run_review_pipeline(manuscript_path):
|
|
|
739
742
|
**修正理由:** [理由の説明]
|
|
740
743
|
```
|
|
741
744
|
|
|
745
|
+
## ToolUniverse 連携
|
|
746
|
+
|
|
747
|
+
| TU Key | ツール名 | 連携内容 |
|
|
748
|
+
|--------|---------|--------|
|
|
749
|
+
| `crossref` | Crossref | 論文検証・引用メタデータ参照 |
|
|
750
|
+
|
|
742
751
|
## References
|
|
743
752
|
|
|
744
753
|
### Output Files
|
|
@@ -4,6 +4,10 @@ description: |
|
|
|
4
4
|
科学データの前処理パイプラインスキル。欠損値補完(KNNImputer/SimpleImputer)、
|
|
5
5
|
エンコーディング(LabelEncoder/OneHot/ダミー変数)、スケーリング(Standard/MinMax/Robust/Pareto)、
|
|
6
6
|
対数変換、外れ値処理のテンプレートを提供。全 Exp-01〜13 に横断的に適用される基盤スキル。
|
|
7
|
+
tu_tools:
|
|
8
|
+
- key: biotools
|
|
9
|
+
name: bio.tools
|
|
10
|
+
description: データ前処理ツールレジストリ検索
|
|
7
11
|
---
|
|
8
12
|
|
|
9
13
|
# Scientific Data Preprocessing
|
|
@@ -424,6 +428,12 @@ def preprocessing_pipeline(df, target_col=None, config=None):
|
|
|
424
428
|
return df, {"encoders": encoders, "scaler": scaler}
|
|
425
429
|
```
|
|
426
430
|
|
|
431
|
+
## ToolUniverse 連携
|
|
432
|
+
|
|
433
|
+
| TU Key | ツール名 | 連携内容 |
|
|
434
|
+
|--------|---------|--------|
|
|
435
|
+
| `biotools` | bio.tools | データ前処理ツールレジストリ検索 |
|
|
436
|
+
|
|
427
437
|
## References
|
|
428
438
|
|
|
429
439
|
- **Exp-01**: `sc.pp.normalize_total()`, `sc.pp.log1p()` — scRNA-seq 固有の正規化
|
|
@@ -4,6 +4,10 @@ description: |
|
|
|
4
4
|
データプロファイリング・品質スキル。ydata-profiling 自動 EDA ・
|
|
5
5
|
Great Expectations データバリデーション・データ品質スコア・
|
|
6
6
|
型推論・相関検出・外れ値フラグ・データカタログ生成。
|
|
7
|
+
tu_tools:
|
|
8
|
+
- key: biotools
|
|
9
|
+
name: bio.tools
|
|
10
|
+
description: データプロファイリングツール検索
|
|
7
11
|
---
|
|
8
12
|
|
|
9
13
|
# Scientific Data Profiling
|
|
@@ -245,3 +249,9 @@ def _auto_generate_expectations(df):
|
|
|
245
249
|
| `profile_report.html` | ydata-profiling レポート | → EDA |
|
|
246
250
|
| `quality_score.json` | データ品質スコア | → 品質管理 |
|
|
247
251
|
| `validation_results.csv` | バリデーション結果 | → データ修正 |
|
|
252
|
+
|
|
253
|
+
## ToolUniverse 連携
|
|
254
|
+
|
|
255
|
+
| TU Key | ツール名 | 連携内容 |
|
|
256
|
+
|--------|---------|--------|
|
|
257
|
+
| `biotools` | bio.tools | データプロファイリングツール検索 |
|
|
@@ -4,6 +4,10 @@ description: |
|
|
|
4
4
|
物理・化学・生物学に基づく合成データ生成のスキル。実験データが不足する場合に、
|
|
5
5
|
ドメイン知識を反映したシミュレーションデータを生成する際に使用。
|
|
6
6
|
Scientific Skills Exp-06, 07, 08, 09, 12, 13 で確立したパターン。
|
|
7
|
+
tu_tools:
|
|
8
|
+
- key: biotools
|
|
9
|
+
name: bio.tools
|
|
10
|
+
description: シミュレーションツールレジストリ検索
|
|
7
11
|
---
|
|
8
12
|
|
|
9
13
|
# Scientific Data Simulation & Generation
|
|
@@ -226,6 +230,12 @@ def generate_ecg_beat(t, hr=72):
|
|
|
226
230
|
- [ ] 変数間の相関構造が既知の物理法則と一致するか
|
|
227
231
|
- [ ] 群間差が効果量として検出可能な水準か
|
|
228
232
|
|
|
233
|
+
## ToolUniverse 連携
|
|
234
|
+
|
|
235
|
+
| TU Key | ツール名 | 連携内容 |
|
|
236
|
+
|--------|---------|--------|
|
|
237
|
+
| `biotools` | bio.tools | シミュレーションツールレジストリ検索 |
|
|
238
|
+
|
|
229
239
|
## References
|
|
230
240
|
|
|
231
241
|
### Output Files
|
|
@@ -4,6 +4,10 @@ description: |
|
|
|
4
4
|
科学データ登録・アーカイブスキル。GenBank/SRA 配列登録・
|
|
5
5
|
ENA 配列アーカイブ・GEO 発現データ登録・BioProject/BioSample
|
|
6
6
|
メタデータ管理・FAIR 原則準拠データ共有。
|
|
7
|
+
tu_tools:
|
|
8
|
+
- key: ena
|
|
9
|
+
name: ENA
|
|
10
|
+
description: データ登録・アクセッション管理
|
|
7
11
|
---
|
|
8
12
|
|
|
9
13
|
# Scientific Data Submission
|
|
@@ -355,3 +359,9 @@ lab-data-management ───┘ academic-writing
|
|
|
355
359
|
| `submission/sra_metadata.tsv` | SRA メタデータ | → ebi-databases |
|
|
356
360
|
| `geo_submission/submission.soft` | GEO SOFT テンプレート | → gene-expression |
|
|
357
361
|
| `submission/fair_report.json` | FAIR チェックリスト結果 | → academic-writing |
|
|
362
|
+
|
|
363
|
+
## ToolUniverse 連携
|
|
364
|
+
|
|
365
|
+
| TU Key | ツール名 | 連携内容 |
|
|
366
|
+
|--------|---------|--------|
|
|
367
|
+
| `ena` | ENA | データ登録・アクセッション管理 |
|
|
@@ -4,6 +4,10 @@ description: |
|
|
|
4
4
|
深層学習分子特性予測スキル。DeepChem による GCN/MPNN/AttentiveFP
|
|
5
5
|
分子特性予測・MoleculeNet ベンチマーク・ChemBERTa/GROVER
|
|
6
6
|
事前学習モデル・分子フィンガープリントフィーチャライザ。
|
|
7
|
+
tu_tools:
|
|
8
|
+
- key: chembl
|
|
9
|
+
name: ChEMBL
|
|
10
|
+
description: 化学的活性・化合物データ検索
|
|
7
11
|
---
|
|
8
12
|
|
|
9
13
|
# Scientific Deep Chemistry
|
|
@@ -348,3 +352,9 @@ molecular-docking ───────┘ admet-pharmacokinetics
|
|
|
348
352
|
| `results/benchmark.json` | モデルベンチマーク結果 | — |
|
|
349
353
|
| `results/embeddings.npy` | ChemBERTa 埋込み | → cheminformatics |
|
|
350
354
|
| `results/model/` | 訓練済みモデル | → admet-pharmacokinetics |
|
|
355
|
+
|
|
356
|
+
## ToolUniverse 連携
|
|
357
|
+
|
|
358
|
+
| TU Key | ツール名 | 連携内容 |
|
|
359
|
+
|--------|---------|--------|
|
|
360
|
+
| `chembl` | ChEMBL | 化学的活性・化合物データ検索 |
|
|
@@ -5,6 +5,10 @@ description: |
|
|
|
5
5
|
NN アーキテクチャ設計・転移学習・分散トレーニング・ハイパーパラメータ最適化・
|
|
6
6
|
モデルデプロイを支援。
|
|
7
7
|
「ニューラルネットで学習して」「Transformer を Fine-tune して」「深層学習モデルを構築して」で発火。
|
|
8
|
+
tu_tools:
|
|
9
|
+
- key: papers_with_code
|
|
10
|
+
name: Papers with Code
|
|
11
|
+
description: 深層学習モデル・ベンチマーク検索
|
|
8
12
|
---
|
|
9
13
|
|
|
10
14
|
# Scientific Deep Learning
|
|
@@ -351,6 +355,12 @@ def export_model(model, sample_input, export_dir="models"):
|
|
|
351
355
|
- [ ] モデルエクスポート (ONNX)
|
|
352
356
|
- [ ] モデルカード作成
|
|
353
357
|
|
|
358
|
+
## ToolUniverse 連携
|
|
359
|
+
|
|
360
|
+
| TU Key | ツール名 | 連携内容 |
|
|
361
|
+
|--------|---------|--------|
|
|
362
|
+
| `papers_with_code` | Papers with Code | 深層学習モデル・ベンチマーク検索 |
|
|
363
|
+
|
|
354
364
|
## References
|
|
355
365
|
|
|
356
366
|
### Output Files
|
|
@@ -5,6 +5,10 @@ description: |
|
|
|
5
5
|
Box-Behnken 設計、D-最適計画、応答曲面法(RSM)、交互作用解析、
|
|
6
6
|
ベイズ最適化(Gaussian Process)、効果プロット(主効果/交互作用/pareto)の
|
|
7
7
|
テンプレートを提供。
|
|
8
|
+
tu_tools:
|
|
9
|
+
- key: biotools
|
|
10
|
+
name: bio.tools
|
|
11
|
+
description: 実験計画法ツールレジストリ検索
|
|
8
12
|
---
|
|
9
13
|
|
|
10
14
|
# Scientific Design of Experiments (DOE)
|
|
@@ -339,6 +343,12 @@ def interaction_plot(design_df, response_col, factor1, factor2, figsize=(8, 6)):
|
|
|
339
343
|
plt.close()
|
|
340
344
|
```
|
|
341
345
|
|
|
346
|
+
## ToolUniverse 連携
|
|
347
|
+
|
|
348
|
+
| TU Key | ツール名 | 連携内容 |
|
|
349
|
+
|--------|---------|--------|
|
|
350
|
+
| `biotools` | bio.tools | 実験計画法ツールレジストリ検索 |
|
|
351
|
+
|
|
342
352
|
## References
|
|
343
353
|
|
|
344
354
|
### Output Files
|
|
@@ -3,6 +3,10 @@ name: scientific-eda-correlation
|
|
|
3
3
|
description: |
|
|
4
4
|
探索的データ解析(EDA)と相関分析のスキル。データの分布可視化、相関ヒートマップ、
|
|
5
5
|
散布図行列の作成を行う際に使用。Scientific Skills Exp-02, 12, 13 で確立したパターン。
|
|
6
|
+
tu_tools:
|
|
7
|
+
- key: biotools
|
|
8
|
+
name: bio.tools
|
|
9
|
+
description: 統計解析ツール検索
|
|
6
10
|
---
|
|
7
11
|
|
|
8
12
|
# Scientific EDA & Correlation Analysis
|
|
@@ -123,6 +127,12 @@ def psp_block_correlation(df, process_cols, structure_cols, property_cols):
|
|
|
123
127
|
return ps_corr, sp_corr, pp_corr
|
|
124
128
|
```
|
|
125
129
|
|
|
130
|
+
## ToolUniverse 連携
|
|
131
|
+
|
|
132
|
+
| TU Key | ツール名 | 連携内容 |
|
|
133
|
+
|--------|---------|--------|
|
|
134
|
+
| `biotools` | bio.tools | 統計解析ツール検索 |
|
|
135
|
+
|
|
126
136
|
## References
|
|
127
137
|
|
|
128
138
|
### Output Files
|
|
@@ -5,6 +5,10 @@ description: |
|
|
|
5
5
|
Boosting (XGBoost/LightGBM/CatBoost) 勾配ブースティング・
|
|
6
6
|
Bagging/Random Subspace・Voting 分類器/回帰器・
|
|
7
7
|
アンサンブル多様性評価・モデル統合パイプライン。
|
|
8
|
+
tu_tools:
|
|
9
|
+
- key: openml
|
|
10
|
+
name: OpenML
|
|
11
|
+
description: アンサンブル手法ベンチマーク参照
|
|
8
12
|
---
|
|
9
13
|
|
|
10
14
|
# Scientific Ensemble Methods
|
|
@@ -261,3 +265,9 @@ automl → ensemble-methods → uncertainty-quantification
|
|
|
261
265
|
| `stacking_meta.pkl` | Stacking メタモデル | → 予測 |
|
|
262
266
|
| `boosting_comparison.csv` | ブースティング比較 | → レポート |
|
|
263
267
|
| `ensemble_diversity.json` | 多様性指標 | → モデル改善 |
|
|
268
|
+
|
|
269
|
+
## ToolUniverse 連携
|
|
270
|
+
|
|
271
|
+
| TU Key | ツール名 | 連携内容 |
|
|
272
|
+
|--------|---------|--------|
|
|
273
|
+
| `openml` | OpenML | アンサンブル手法ベンチマーク参照 |
|
|
@@ -4,6 +4,10 @@ description: |
|
|
|
4
4
|
説明可能 AI (XAI) スキル。SHAP・LIME・Captum・InterpretML を活用し、
|
|
5
5
|
モデル予測の根拠説明・特徴量寄与分解・反実仮想説明・公平性監査を支援。
|
|
6
6
|
「モデルの予測を説明して」「SHAP 値を計算して」「LIME で説明して」で発火。
|
|
7
|
+
tu_tools:
|
|
8
|
+
- key: papers_with_code
|
|
9
|
+
name: Papers with Code
|
|
10
|
+
description: XAI 手法・ベンチマーク検索
|
|
7
11
|
---
|
|
8
12
|
|
|
9
13
|
# Scientific Explainable AI
|
|
@@ -334,6 +338,12 @@ def fairness_audit(model, X_test, y_test, sensitive_feature,
|
|
|
334
338
|
- [ ] 公平性監査(機密属性がある場合)
|
|
335
339
|
- [ ] 説明レポート生成
|
|
336
340
|
|
|
341
|
+
## ToolUniverse 連携
|
|
342
|
+
|
|
343
|
+
| TU Key | ツール名 | 連携内容 |
|
|
344
|
+
|--------|---------|--------|
|
|
345
|
+
| `papers_with_code` | Papers with Code | XAI 手法・ベンチマーク検索 |
|
|
346
|
+
|
|
337
347
|
## References
|
|
338
348
|
|
|
339
349
|
### Output Files
|
|
@@ -4,6 +4,10 @@ description: |
|
|
|
4
4
|
特徴量重要度分析のスキル。Tree-based Feature Importance と Permutation Importance を
|
|
5
5
|
用いて予測モデルの説明可能性を向上させる際に使用。
|
|
6
6
|
Scientific Skills Exp-05, 12, 13 で確立したパターン。
|
|
7
|
+
tu_tools:
|
|
8
|
+
- key: openml
|
|
9
|
+
name: OpenML
|
|
10
|
+
description: 特徴量選択ベンチマーク参照
|
|
7
11
|
---
|
|
8
12
|
|
|
9
13
|
# Scientific Feature Importance Analysis
|
|
@@ -189,6 +193,12 @@ def generate_importance_mapping_table(all_fi_df, top_n=3):
|
|
|
189
193
|
return pd.DataFrame(mapping)
|
|
190
194
|
```
|
|
191
195
|
|
|
196
|
+
## ToolUniverse 連携
|
|
197
|
+
|
|
198
|
+
| TU Key | ツール名 | 連携内容 |
|
|
199
|
+
|--------|---------|--------|
|
|
200
|
+
| `openml` | OpenML | 特徴量選択ベンチマーク参照 |
|
|
201
|
+
|
|
192
202
|
## References
|
|
193
203
|
|
|
194
204
|
### Output Files
|
|
@@ -4,6 +4,10 @@ description: |
|
|
|
4
4
|
連合学習スキル。Flower フレームワークによる FL パイプライン・
|
|
5
5
|
FedAvg/FedProx/FedOpt 集約戦略・差分プライバシー (DP-SGD)・
|
|
6
6
|
非 IID データ分割・通信効率化。
|
|
7
|
+
tu_tools:
|
|
8
|
+
- key: papers_with_code
|
|
9
|
+
name: Papers with Code
|
|
10
|
+
description: 連合学習フレームワーク・ベンチマーク
|
|
7
11
|
---
|
|
8
12
|
|
|
9
13
|
# Scientific Federated Learning
|
|
@@ -239,3 +243,9 @@ def create_non_iid_splits(dataset_labels, n_clients=5,
|
|
|
239
243
|
| `fl_strategy_config.json` | FL 集約設定 | → サーバー起動 |
|
|
240
244
|
| `dp_training_history.csv` | DP 学習履歴 | → model-monitoring |
|
|
241
245
|
| `client_splits.json` | 非 IID 分割情報 | → FL クライアント |
|
|
246
|
+
|
|
247
|
+
## ToolUniverse 連携
|
|
248
|
+
|
|
249
|
+
| TU Key | ツール名 | 連携内容 |
|
|
250
|
+
|--------|---------|--------|
|
|
251
|
+
| `papers_with_code` | Papers with Code | 連合学習フレームワーク・ベンチマーク |
|
|
@@ -4,6 +4,10 @@ description: |
|
|
|
4
4
|
地理空間データ解析スキル。GeoPandas ベクターデータ処理・
|
|
5
5
|
Rasterio ラスター解析・Folium/Kepler.gl インタラクティブ地図・
|
|
6
6
|
空間自己相関 (Moran's I)・クリギング補間・CRS 変換。
|
|
7
|
+
tu_tools:
|
|
8
|
+
- key: gbif
|
|
9
|
+
name: GBIF
|
|
10
|
+
description: 地理空間生物多様性データ取得
|
|
7
11
|
---
|
|
8
12
|
|
|
9
13
|
# Scientific Geospatial Analysis
|
|
@@ -272,3 +276,9 @@ environmental-geodata → geospatial-analysis → advanced-visualization
|
|
|
272
276
|
| `spatial_autocorrelation.png` | Moran's I + LISA | → reporting |
|
|
273
277
|
| `kriging_result.png` | クリギング補間 | → visualization |
|
|
274
278
|
| `interactive_map.html` | Folium 地図 | → dashboard |
|
|
279
|
+
|
|
280
|
+
## ToolUniverse 連携
|
|
281
|
+
|
|
282
|
+
| TU Key | ツール名 | 連携内容 |
|
|
283
|
+
|--------|---------|--------|
|
|
284
|
+
| `gbif` | GBIF | 地理空間生物多様性データ取得 |
|
|
@@ -6,6 +6,10 @@ description: |
|
|
|
6
6
|
グリコシル化部位予測・レクチンバインディング・
|
|
7
7
|
糖鎖マスフラグメンテーション解析パイプライン。
|
|
8
8
|
TU 外スキル (直接 REST API + Python ライブラリ)。
|
|
9
|
+
tu_tools:
|
|
10
|
+
- key: glygen
|
|
11
|
+
name: GlyGen
|
|
12
|
+
description: 糖鎖構造・機能データベース検索
|
|
9
13
|
---
|
|
10
14
|
|
|
11
15
|
# Scientific Glycomics
|
|
@@ -272,3 +276,9 @@ proteomics-mass-spectrometry → glycomics → pathway-enrichment
|
|
|
272
276
|
|---------|------|---------|
|
|
273
277
|
| `results/glycosites.csv` | グリコシル化部位 | → protein-structure-analysis |
|
|
274
278
|
| `results/glycan_details.csv` | 糖鎖詳細 | → pathway-enrichment |
|
|
279
|
+
|
|
280
|
+
## ToolUniverse 連携
|
|
281
|
+
|
|
282
|
+
| TU Key | ツール名 | 連携内容 |
|
|
283
|
+
|--------|---------|--------|
|
|
284
|
+
| `glygen` | GlyGen | 糖鎖構造・機能データベース検索 |
|
|
@@ -5,6 +5,10 @@ description: |
|
|
|
5
5
|
rapids-singlecell / cuML / cuGraph による GPU 並列処理。
|
|
6
6
|
大規模 (>1M cells) データの高速前処理・クラスタリング・
|
|
7
7
|
次元削減。K-Dense: rapids-singlecell。
|
|
8
|
+
tu_tools:
|
|
9
|
+
- key: cellxgene
|
|
10
|
+
name: CellxGene
|
|
11
|
+
description: シングルセルデータセット検索
|
|
8
12
|
---
|
|
9
13
|
|
|
10
14
|
# Scientific GPU Single-Cell
|
|
@@ -294,3 +298,9 @@ single-cell-genomics → gpu-singlecell → scvi-integration
|
|
|
294
298
|
| `results/gpu_singlecell.h5ad` | GPU 処理済み AnnData | → scvi-integration |
|
|
295
299
|
| `results/markers.csv` | マーカー遺伝子 | → cell-type-annotation |
|
|
296
300
|
| `results/benchmark.json` | CPU/GPU 比較結果 | → atlas-construction |
|
|
301
|
+
|
|
302
|
+
## ToolUniverse 連携
|
|
303
|
+
|
|
304
|
+
| TU Key | ツール名 | 連携内容 |
|
|
305
|
+
|--------|---------|--------|
|
|
306
|
+
| `cellxgene` | CellxGene | シングルセルデータセット検索 |
|
|
@@ -6,6 +6,10 @@ description: |
|
|
|
6
6
|
遺伝子ファミリー/グループクエリ・ID クロスリファレンス
|
|
7
7
|
パイプライン。
|
|
8
8
|
TU 外スキル (直接 REST API)。
|
|
9
|
+
tu_tools:
|
|
10
|
+
- key: hgnc
|
|
11
|
+
name: HGNC
|
|
12
|
+
description: 遺伝子命名法・シンボル検索
|
|
9
13
|
---
|
|
10
14
|
|
|
11
15
|
# Scientific HGNC Nomenclature
|
|
@@ -280,3 +284,9 @@ biothings-idmapping → hgnc-nomenclature → genome-sequence-tools
|
|
|
280
284
|
| `results/hgnc_details.csv` | 遺伝子詳細 | → gene-expression |
|
|
281
285
|
| `results/hgnc_alias_resolved.csv` | エイリアス解決 | → biothings-idmapping |
|
|
282
286
|
| `results/hgnc_xref.csv` | ID 相互参照 | → genome-sequence-tools |
|
|
287
|
+
|
|
288
|
+
## ToolUniverse 連携
|
|
289
|
+
|
|
290
|
+
| TU Key | ツール名 | 連携内容 |
|
|
291
|
+
|--------|---------|--------|
|
|
292
|
+
| `hgnc` | HGNC | 遺伝子命名法・シンボル検索 |
|