@nahisaho/satori 0.18.0 → 0.20.0
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/README.md +79 -39
- package/package.json +1 -1
- package/src/.github/skills/scientific-admet-pharmacokinetics/SKILL.md +4 -0
- package/src/.github/skills/scientific-biobank-cohort/SKILL.md +268 -0
- package/src/.github/skills/scientific-cancer-genomics/SKILL.md +7 -0
- package/src/.github/skills/scientific-cell-line-resources/SKILL.md +4 -0
- package/src/.github/skills/scientific-chembl-assay-mining/SKILL.md +4 -0
- package/src/.github/skills/scientific-civic-evidence/SKILL.md +292 -0
- package/src/.github/skills/scientific-compound-screening/SKILL.md +4 -0
- package/src/.github/skills/scientific-depmap-dependencies/SKILL.md +239 -0
- package/src/.github/skills/scientific-disease-research/SKILL.md +4 -0
- package/src/.github/skills/scientific-drug-target-profiling/SKILL.md +4 -0
- package/src/.github/skills/scientific-drugbank-resources/SKILL.md +269 -0
- package/src/.github/skills/scientific-gdc-portal/SKILL.md +280 -0
- package/src/.github/skills/scientific-gnomad-variants/SKILL.md +356 -0
- package/src/.github/skills/scientific-immunoinformatics/SKILL.md +4 -0
- package/src/.github/skills/scientific-metabolic-flux/SKILL.md +306 -0
- package/src/.github/skills/scientific-metabolic-modeling/SKILL.md +4 -0
- package/src/.github/skills/scientific-metabolomics/SKILL.md +4 -0
- package/src/.github/skills/scientific-metabolomics-databases/SKILL.md +4 -0
- package/src/.github/skills/scientific-microbiome-metagenomics/SKILL.md +4 -0
- package/src/.github/skills/scientific-monarch-ontology/SKILL.md +260 -0
- package/src/.github/skills/scientific-opentargets-genetics/SKILL.md +299 -0
- package/src/.github/skills/scientific-pharmacology-targets/SKILL.md +10 -0
- package/src/.github/skills/scientific-precision-oncology/SKILL.md +4 -0
- package/src/.github/skills/scientific-protein-interaction-network/SKILL.md +4 -0
- package/src/.github/skills/scientific-rare-disease-genetics/SKILL.md +4 -0
- package/src/.github/skills/scientific-rcsb-pdb-search/SKILL.md +280 -0
- package/src/.github/skills/scientific-reactome-pathways/SKILL.md +242 -0
- package/src/.github/skills/scientific-spatial-multiomics/SKILL.md +293 -0
- package/src/.github/skills/scientific-stitch-chemical-network/SKILL.md +318 -0
- package/src/.github/skills/scientific-string-network-api/SKILL.md +4 -0
- package/src/.github/skills/scientific-uniprot-proteome/SKILL.md +273 -0
- package/src/.github/skills/scientific-variant-interpretation/SKILL.md +4 -0
package/README.md
CHANGED
|
@@ -7,7 +7,7 @@
|
|
|
7
7
|
|
|
8
8
|
## Overview
|
|
9
9
|
|
|
10
|
-
このディレクトリには、Exp-01〜13 で蓄積した科学データ解析技法を Agent Skills として体系化した **
|
|
10
|
+
このディレクトリには、Exp-01〜13 で蓄積した科学データ解析技法を Agent Skills として体系化した **154 個**のスキルを格納しています。Copilot がプロンプトの文脈に応じて適切なスキルを自動ロードし、各実験で確立した解析パターンを再利用します。114 のスキルは [ToolUniverse](https://github.com/mims-harvard/ToolUniverse) SMCP 経由で 1,200 以上の外部科学データベースツールとも連携可能です。
|
|
11
11
|
|
|
12
12
|
### パイプラインフロー
|
|
13
13
|
|
|
@@ -208,7 +208,7 @@ symbolic-mathematics ──→ systems-biology ──→ admet-pharmacokinetics
|
|
|
208
208
|
|
|
209
209
|
### ToolUniverse MCP ツール連携
|
|
210
210
|
|
|
211
|
-
|
|
211
|
+
114 のスキル(HIGH 13 + MEDIUM 9 + Phase 3: 20 + Phase 4: 8 + Phase 5: 9 + Phase 6: 7 + Phase 7: 4 + Phase 8: 4 + Phase 9: 5 + Phase 10: 6 + Phase 11: 8 new + 6 existing + Phase 12: 3 new + 12 existing key additions)は、[ToolUniverse](https://github.com/mims-harvard/ToolUniverse) SMCP サーバー経由で 1,200 以上の外部科学ツールを利用可能です。各 SKILL.md 内の `### 利用可能ツール` セクションに対応ツールが記載されています。
|
|
212
212
|
|
|
213
213
|
```
|
|
214
214
|
SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・計算)
|
|
@@ -259,7 +259,18 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
|
|
|
259
259
|
│ semantic-scholar │───MCP──│ Semantic Scholar Graph API │
|
|
260
260
|
│ pharmgkb-pgx │───MCP──│ PharmGKB, CPIC Guidelines │
|
|
261
261
|
│ crossref-metadata │───MCP──│ CrossRef DOI/Metadata │
|
|
262
|
-
│
|
|
262
|
+
│ uniprot-proteome │───MCP──│ UniProt REST API │
|
|
263
|
+
│ rcsb-pdb-search │───MCP──│ RCSB PDB Search/Data API │
|
|
264
|
+
│ opentargets-genetics │───MCP──│ Open Targets GraphQL │
|
|
265
|
+
│ reactome-pathways │───MCP──│ Reactome Content Service │
|
|
266
|
+
│ depmap-dependencies │───MCP──│ DepMap Portal, Cell Model │
|
|
267
|
+
│ drugbank-resources │───MCP──│ DrugBank API │
|
|
268
|
+
│ civic-evidence │───MCP──│ CIViC REST API │
|
|
269
|
+
│ gnomad-variants │───MCP──│ gnomAD GraphQL API │
|
|
270
|
+
│ monarch-ontology │───MCP──│ Monarch Initiative API │
|
|
271
|
+
│ gdc-portal │───MCP──│ NCI GDC REST API │
|
|
272
|
+
│ stitch-chemical-net│───MCP──│ STITCH Chemical-Protein │
|
|
273
|
+
│ ... (114 skills total)│ │ ... (1,200+ tools) │
|
|
263
274
|
└──────────────────────┘ └─────────────────────────────┘
|
|
264
275
|
```
|
|
265
276
|
|
|
@@ -272,24 +283,24 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
|
|
|
272
283
|
| C. 機械学習・モデリング | 3 | 回帰・分類・特徴量重要度 |
|
|
273
284
|
| D. 実験計画・プロセス最適化 | 2 | DOE・応答曲面法・ベイズ最適化 |
|
|
274
285
|
| E. 信号・スペクトル・時系列 | 4 | スペクトル解析・生体信号・時系列分解・神経電気生理学 |
|
|
275
|
-
| F. 生命科学・オミクス |
|
|
276
|
-
| G. 化学・材料・イメージング |
|
|
277
|
-
| H. 臨床・疫学・メタ科学 |
|
|
286
|
+
| F. 生命科学・オミクス | 24 | バイオインフォ・メタボロ・ゲノム配列・マルチオミクス・ネットワーク・プロテオミクス・トランスクリプトミクス・パスウェイ濃縮・代謝物 DB・HPA・ゲノム配列ツール・非コード RNA・オントロジー・EBI DB 群・Ensembl ゲノミクス・STRING/BioGRID PPI・発現比較・モデル生物 DB・GEO 発現プロファイル・寄生虫ゲノミクス・ArrayExpress 発現アーカイブ・GTEx 組織発現・UniProt プロテオーム・Reactome パスウェイ |
|
|
287
|
+
| G. 化学・材料・イメージング | 9 | ケモインフォ・材料特性評価・画像形態解析・計算材料科学・ChEMBL アッセイマイニング・MD シミュレーション・高度イメージング・深層化学・STITCH 化学-タンパク質ネットワーク |
|
|
288
|
+
| H. 臨床・疫学・メタ科学 | 6 | 生存解析・因果推論・メタアナリシス・臨床試験解析・臨床レポート・バイオバンク大規模コホート |
|
|
278
289
|
| I. Deep Research・文献検索 | 4 | 科学文献深層リサーチ・エビデンス階層評価・マルチ DB 文献検索・引用ネットワーク・プレプリント横断検索・Semantic Scholar 学術グラフ |
|
|
279
|
-
| J. 創薬・ファーマコロジー |
|
|
280
|
-
| K. 構造生物学・タンパク質工学 |
|
|
281
|
-
| L. 精密医療・臨床意思決定 |
|
|
290
|
+
| J. 創薬・ファーマコロジー | 8 | 標的プロファイリング・ADMET/PK・ドラッグリポジショニング・分子ドッキング・薬理学的ターゲット・化合物スクリーニング・NCI-60 スクリーニング・DrugBank リソース |
|
|
291
|
+
| K. 構造生物学・タンパク質工学 | 7 | PDB/AlphaFold 構造解析・de novo タンパク質設計・PPI ネットワーク・ドメイン/ファミリー・構造プロテオミクス・AlphaFold DB 構造予測・RCSB PDB 構造検索 |
|
|
292
|
+
| L. 精密医療・臨床意思決定 | 5 | 変異解釈 (ACMG/AMP)・エビデンスベース臨床意思決定・バリアント効果予測・CIViC 臨床エビデンス・gnomAD バリアント |
|
|
282
293
|
| M. 実験室自動化・データ管理 | 2 | 液体ハンドリング・プロトコル管理・ELN/LIMS 連携・ラボデータ管理 |
|
|
283
294
|
| N. 科学プレゼンテーション・図式 | 2 | 科学スライド・ポスター・ワークフロー図・科学図式 |
|
|
284
295
|
| O. 研究計画・グラント・規制 | 3 | 助成金申請書・研究方法論・倫理審査・規制科学 |
|
|
285
296
|
| P. ファーマコビジランス・薬理ゲノミクス | 3 | FAERS 不均衡分析・MedDRA 階層・安全性シグナル検出・PGx 代謝型・PharmGKB 臨床アノテーション |
|
|
286
|
-
| Q. 腫瘍学・疾患研究 |
|
|
297
|
+
| Q. 腫瘍学・疾患研究 | 10 | 精密腫瘍学 (CIViC/OncoKB)・疾患-遺伝子関連 (GWAS/Orphanet)・がんゲノミクス (COSMIC/DepMap)・希少疾患遺伝学・細胞株リソース・ICGC がんゲノムデータ・Open Targets 遺伝学・DepMap 依存性・Monarch オントロジー・GDC ポータル |
|
|
287
298
|
| R. 量子・先端計算 | 7 | 量子計算・GNN・ベイズ統計・説明可能 AI・深層学習・ヘルスケア AI・強化学習 |
|
|
288
299
|
| S. 医用イメージング | 1 | DICOM/NIfTI・WSI 病理画像・Radiomics・MONAI |
|
|
289
|
-
| T. シングルセル・空間・エピゲノミクス |
|
|
300
|
+
| T. シングルセル・空間・エピゲノミクス | 12 | scRNA-seq・Visium・MERFISH・CELLxGENE・RNA velocity・エピゲノミクス・レギュラトリーゲノミクス・摂動解析・scVI 統合・scATAC-seq/Signac・GPU シングルセル・ENCODE/SCREEN・Human Cell Atlas・高度 Squidpy 空間解析・空間マルチオミクス |
|
|
290
301
|
| U. 免疫・感染症 | 2 | 免疫情報学・MHC 結合予測・病原体ゲノミクス・AMR・IEDB |
|
|
291
302
|
| V. マイクロバイオーム・環境 | 8 | 16S/メタゲノム・α/β 多様性・SDM・OBIS・GBIF・系統解析・rRNA 分類学・植物バイオロジー・海洋生態学・環境地理空間データ・古生物学 |
|
|
292
|
-
| W. システム生物学 |
|
|
303
|
+
| W. システム生物学 | 4 | SBML シミュレーション・FBA・GRN 推定・BioModels・代謝モデリング・Metabolic Atlas・代謝フラックス解析 |
|
|
293
304
|
| X. 疫学・公衆衛生 | 3 | リスク指標 (RR/OR)・年齢標準化・空間疫学・WHO・CDC・公衆衛生データ・環境毒性学 |
|
|
294
305
|
| Y. 集団遺伝学 | 2 | HWE・PCA/ADMIXTURE・Fst・選択スキャン・gnomAD・GWAS・GWAS Catalog |
|
|
295
306
|
| Z. 科学テキストマイニング | 2 | NER・関係抽出・知識グラフ・BERTopic・PubTator バイオアノテーション |
|
|
@@ -363,9 +374,9 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
|
|
|
363
374
|
| 24 | [scientific-time-series](scientific-time-series/SKILL.md) | STL 分解・SARIMA 予測・変化点検出・FFT 周期解析・Granger 因果 | 汎用 |
|
|
364
375
|
| 67 | [scientific-neuroscience-electrophysiology](scientific-neuroscience-electrophysiology/SKILL.md) | SpikeInterface/Kilosort4 スパイクソート・MNE EEG/ERP・NeuroKit2 HRV/EDA・脳機能結合 | 汎用 |
|
|
365
376
|
|
|
366
|
-
### F. 生命科学・オミクス(
|
|
377
|
+
### F. 生命科学・オミクス(24 種)
|
|
367
378
|
|
|
368
|
-
バイオ・オミクス・ネットワーク解析・オントロジー・EBI データベース・ゲノミクス・PPI・発現比較・モデル生物 DB・GEO 発現プロファイル・寄生虫ゲノミクス・ArrayExpress 発現アーカイブ・GTEx
|
|
379
|
+
バイオ・オミクス・ネットワーク解析・オントロジー・EBI データベース・ゲノミクス・PPI・発現比較・モデル生物 DB・GEO 発現プロファイル・寄生虫ゲノミクス・ArrayExpress 発現アーカイブ・GTEx 組織発現・UniProt プロテオーム・Reactome パスウェイを担うスキル群。
|
|
369
380
|
|
|
370
381
|
| # | Skill | 説明 | 参照 Exp |
|
|
371
382
|
|---|---|---|---|
|
|
@@ -391,10 +402,12 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
|
|
|
391
402
|
| 132 | [scientific-parasite-genomics](scientific-parasite-genomics/SKILL.md) | PlasmoDB/VectorBase/ToxoDB 寄生虫ゲノミクス・薬剤標的同定 | 汎用 |
|
|
392
403
|
| 135 | [scientific-arrayexpress-expression](scientific-arrayexpress-expression/SKILL.md) | ArrayExpress/BioStudies REST API 発現実験検索・SDRF メタデータ・データ再解析 | 汎用 |
|
|
393
404
|
| 137 | [scientific-gtex-tissue-expression](scientific-gtex-tissue-expression/SKILL.md) | GTEx Portal REST API v2 組織特異的発現・eQTL・多組織比較 | 汎用 |
|
|
405
|
+
| 141 | [scientific-uniprot-proteome](scientific-uniprot-proteome/SKILL.md) | UniProt REST API プロテオーム検索・ID マッピング・ドメイン/特徴抽出 | 汎用 |
|
|
406
|
+
| 144 | [scientific-reactome-pathways](scientific-reactome-pathways/SKILL.md) | Reactome Content Service パスウェイ検索・UniProt マッピング・参加者取得 | 汎用 |
|
|
394
407
|
|
|
395
|
-
### G. 化学・材料・イメージング(
|
|
408
|
+
### G. 化学・材料・イメージング(9 種)
|
|
396
409
|
|
|
397
|
-
化学構造・材料特性評価・画像形態解析・計算材料科学・ChEMBL アッセイマイニング・MD
|
|
410
|
+
化学構造・材料特性評価・画像形態解析・計算材料科学・ChEMBL アッセイマイニング・MD シミュレーション・高度イメージング・深層化学・STITCH 化学-タンパク質ネットワークを担うスキル群。
|
|
398
411
|
|
|
399
412
|
| # | Skill | 説明 | 参照 Exp |
|
|
400
413
|
|---|---|---|---|
|
|
@@ -406,10 +419,11 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
|
|
|
406
419
|
| 112 | [scientific-md-simulation](scientific-md-simulation/SKILL.md) | MDAnalysis/OpenFF 分子動力学シミュレーション・RMSD/RMSF/SASA/水素結合解析 | 汎用 |
|
|
407
420
|
| 114 | [scientific-advanced-imaging](scientific-advanced-imaging/SKILL.md) | Cellpose セグメンテーション・CellProfiler 形態プロファイリング・napari 3D 可視化 | 汎用 |
|
|
408
421
|
| 115 | [scientific-deep-chemistry](scientific-deep-chemistry/SKILL.md) | DeepChem GCN/MPNN/AttentiveFP 分子特性予測・MoleculeNet・ChemBERTa | 汎用 |
|
|
422
|
+
| 154 | [scientific-stitch-chemical-network](scientific-stitch-chemical-network/SKILL.md) | STITCH 化学物質-タンパク質相互作用ネットワーク・ネットワーク薬理学・ポリファーマコロジー | 汎用 |
|
|
409
423
|
|
|
410
|
-
### H. 臨床・疫学・メタ科学(
|
|
424
|
+
### H. 臨床・疫学・メタ科学(6 種)
|
|
411
425
|
|
|
412
|
-
|
|
426
|
+
臨床試験・因果推論・メタアナリシス・臨床試験解析・バイオバンク大規模コホートを担うスキル群。
|
|
413
427
|
|
|
414
428
|
| # | Skill | 説明 | 参照 Exp |
|
|
415
429
|
|---|---|---|---|
|
|
@@ -418,6 +432,7 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
|
|
|
418
432
|
| 35 | [scientific-meta-analysis](scientific-meta-analysis/SKILL.md) | 固定/ランダム効果モデル・Forest/Funnel プロット・Egger 検定・サブグループ | 汎用 |
|
|
419
433
|
| 71 | [scientific-clinical-trials-analytics](scientific-clinical-trials-analytics/SKILL.md) | ClinicalTrials.gov API v2 検索・競合ランドスケープ・AE/アウトカム抽出 | 汎用 |
|
|
420
434
|
| 85 | [scientific-clinical-reporting](scientific-clinical-reporting/SKILL.md) | SOAP ノート・バイオマーカーレポート・ファーマコゲノミクス・FHIR JSON | 汎用 |
|
|
435
|
+
| 151 | [scientific-biobank-cohort](scientific-biobank-cohort/SKILL.md) | UK Biobank/BBJ/All of Us 大規模コホート・GWAS サマリー統計・PheWAS | 汎用 |
|
|
421
436
|
|
|
422
437
|
### I. Deep Research・文献検索(4 種)
|
|
423
438
|
|
|
@@ -430,9 +445,9 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
|
|
|
430
445
|
| 97 | [scientific-preprint-archive](scientific-preprint-archive/SKILL.md) | bioRxiv/medRxiv/arXiv/PMC/CORE/Zenodo/OpenAIRE/Unpaywall プレプリント・OA 横断検索 | 汎用 |
|
|
431
446
|
| 136 | [scientific-semantic-scholar](scientific-semantic-scholar/SKILL.md) | Semantic Scholar Academic Graph API 論文検索・引用グラフ・著者プロファイル・TLDR | 汎用 |
|
|
432
447
|
|
|
433
|
-
### J. 創薬・ファーマコロジー(
|
|
448
|
+
### J. 創薬・ファーマコロジー(8 種)
|
|
434
449
|
|
|
435
|
-
ドラッグディスカバリーの標的評価・薬物動態・リポジショニング・薬理学的ターゲット・化合物スクリーニング・NCI-60
|
|
450
|
+
ドラッグディスカバリーの標的評価・薬物動態・リポジショニング・薬理学的ターゲット・化合物スクリーニング・NCI-60 スクリーニング・DrugBank リソースを担うスキル群。
|
|
436
451
|
|
|
437
452
|
| # | Skill | 説明 | 参照 Exp |
|
|
438
453
|
|---|---|---|---|
|
|
@@ -443,10 +458,11 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
|
|
|
443
458
|
| 89 | [scientific-pharmacology-targets](scientific-pharmacology-targets/SKILL.md) | BindingDB/GPCRdb/GtoPdb/BRENDA/Pharos 薬理学的ターゲットプロファイリング | 汎用 |
|
|
444
459
|
| 94 | [scientific-compound-screening](scientific-compound-screening/SKILL.md) | ZINC 化合物ライブラリ検索・バーチャルスクリーニング前処理 | 汎用 |
|
|
445
460
|
| 120 | [scientific-nci60-screening](scientific-nci60-screening/SKILL.md) | NCI-60/CellMiner/DepMap がん細胞株薬剤応答スクリーニング | 汎用 |
|
|
461
|
+
| 146 | [scientific-drugbank-resources](scientific-drugbank-resources/SKILL.md) | DrugBank API 薬剤情報・薬理 MOA・標的タンパク質・薬物相互作用 | 汎用 |
|
|
446
462
|
|
|
447
|
-
### K. 構造生物学・タンパク質工学(
|
|
463
|
+
### K. 構造生物学・タンパク質工学(7 種)
|
|
448
464
|
|
|
449
|
-
タンパク質構造解析・設計・PPI ネットワーク・ドメイン解析・構造プロテオミクス・AlphaFold DB
|
|
465
|
+
タンパク質構造解析・設計・PPI ネットワーク・ドメイン解析・構造プロテオミクス・AlphaFold DB 構造予測・RCSB PDB 構造検索を担うスキル群。
|
|
450
466
|
|
|
451
467
|
| # | Skill | 説明 | 参照 Exp |
|
|
452
468
|
|---|---|---|---|
|
|
@@ -456,15 +472,19 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
|
|
|
456
472
|
| 86 | [scientific-protein-domain-family](scientific-protein-domain-family/SKILL.md) | InterPro/InterProScan ドメイン予測・ファミリー分類・アーキテクチャ可視化 | 汎用 |
|
|
457
473
|
| 93 | [scientific-structural-proteomics](scientific-structural-proteomics/SKILL.md) | EMDB/PDBe/Proteins API/Complex Portal/DeepGO/EVE 構造プロテオミクス | 汎用 |
|
|
458
474
|
| 134 | [scientific-alphafold-structures](scientific-alphafold-structures/SKILL.md) | AlphaFold DB REST API 構造予測取得・pLDDT 信頼度・PAE 解析 | 汎用 |
|
|
475
|
+
| 142 | [scientific-rcsb-pdb-search](scientific-rcsb-pdb-search/SKILL.md) | RCSB PDB Search/Data API 構造検索・メタデータ・リガンド情報 | 汎用 |
|
|
459
476
|
|
|
460
|
-
### L. 精密医療・臨床意思決定(
|
|
477
|
+
### L. 精密医療・臨床意思決定(5 種)
|
|
461
478
|
|
|
462
|
-
|
|
479
|
+
バリアント解釈とエビデンスベース臨床判断・CIViC 臨床エビデンス・gnomAD バリアントを担うスキル群。
|
|
463
480
|
|
|
464
481
|
| # | Skill | 説明 | 参照 Exp |
|
|
465
482
|
|---|---|---|---|
|
|
466
483
|
| 42 | [scientific-variant-interpretation](scientific-variant-interpretation/SKILL.md) | ACMG/AMP 28 基準・薬理ゲノミクス (CPIC)・OncoKB 体細胞変異レベル | 汎用 |
|
|
467
484
|
| 43 | [scientific-clinical-decision-support](scientific-clinical-decision-support/SKILL.md) | GRADE エビデンス枠組・精密腫瘍学ワークフロー・臨床試験マッチング | 汎用 || 80 | [scientific-variant-effect-prediction](scientific-variant-effect-prediction/SKILL.md) | AlphaMissense/CADD/SpliceAI バリアント効果予測・コンセンサス病原性判定 | 汎用 |
|
|
485
|
+
| 147 | [scientific-civic-evidence](scientific-civic-evidence/SKILL.md) | CIViC REST API がんバリアント臨床解釈・エビデンス・アサーション | 汎用 |
|
|
486
|
+
| 148 | [scientific-gnomad-variants](scientific-gnomad-variants/SKILL.md) | gnomAD GraphQL 集団アレル頻度・遺伝子制約 (pLI/LOEUF)・リージョンクエリ | 汎用 |
|
|
487
|
+
|
|
468
488
|
### M. 実験室自動化・データ管理(2 種)
|
|
469
489
|
|
|
470
490
|
ラボ実験の自動化とデータ管理を担うスキル群。
|
|
@@ -503,9 +523,9 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
|
|
|
503
523
|
| 75 | [scientific-pharmacogenomics](scientific-pharmacogenomics/SKILL.md) | PharmGKB/CPIC ガイドライン・Star アレル・代謝型・FDA PGx バイオマーカー | 汎用 |
|
|
504
524
|
| 138 | [scientific-pharmgkb-pgx](scientific-pharmgkb-pgx/SKILL.md) | PharmGKB REST API 臨床アノテーション・薬物遺伝子関連・投与量ガイドライン | 汎用 |
|
|
505
525
|
|
|
506
|
-
### Q. 腫瘍学・疾患研究(
|
|
526
|
+
### Q. 腫瘍学・疾患研究(10 種)
|
|
507
527
|
|
|
508
|
-
精密腫瘍学・疾患-遺伝子関連研究・がんゲノミクス・希少疾患遺伝学・細胞株リソース・ICGC
|
|
528
|
+
精密腫瘍学・疾患-遺伝子関連研究・がんゲノミクス・希少疾患遺伝学・細胞株リソース・ICGC がんゲノムデータ・Open Targets 遺伝学・DepMap 依存性・Monarch オントロジー・GDC ポータルを担うスキル群。
|
|
509
529
|
|
|
510
530
|
| # | Skill | 説明 | 参照 Exp |
|
|
511
531
|
|---|---|---|---|
|
|
@@ -515,6 +535,10 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
|
|
|
515
535
|
| 87 | [scientific-rare-disease-genetics](scientific-rare-disease-genetics/SKILL.md) | OMIM/Orphanet/DisGeNET/IMPC 希少疾患遺伝学・統合解析 | 汎用 |
|
|
516
536
|
| 101 | [scientific-cell-line-resources](scientific-cell-line-resources/SKILL.md) | Cellosaurus 細胞株検索・STR プロファイル検証・コンタミネーション検出 | 汎用 |
|
|
517
537
|
| 140 | [scientific-icgc-cancer-data](scientific-icgc-cancer-data/SKILL.md) | ICGC DCC API 国際がんゲノムデータ・体細胞変異・がん種統計 | 汎用 |
|
|
538
|
+
| 143 | [scientific-opentargets-genetics](scientific-opentargets-genetics/SKILL.md) | Open Targets Platform GraphQL 標的-疾患アソシエーション・薬剤エビデンス・L2G | 汎用 |
|
|
539
|
+
| 145 | [scientific-depmap-dependencies](scientific-depmap-dependencies/SKILL.md) | DepMap Portal CRISPR/RNAi 遺伝子依存性・薬剤感受性 | 汎用 |
|
|
540
|
+
| 149 | [scientific-monarch-ontology](scientific-monarch-ontology/SKILL.md) | Monarch Initiative 疾患-遺伝子-表現型オントロジー・HPO・エンティティ検索 | 汎用 |
|
|
541
|
+
| 150 | [scientific-gdc-portal](scientific-gdc-portal/SKILL.md) | NCI Genomic Data Commons REST API・プロジェクト/ケース/SSM 検索 | 汎用 |
|
|
518
542
|
|
|
519
543
|
### R. 量子・先端計算(7 種)
|
|
520
544
|
|
|
@@ -538,9 +562,9 @@ DICOM・WSI 等の医用画像の解析・セグメンテーションを担う
|
|
|
538
562
|
|---|---|---|---|
|
|
539
563
|
| 56 | [scientific-medical-imaging](scientific-medical-imaging/SKILL.md) | DICOM/NIfTI 処理・MONAI U-Net/SwinUNETR・WSI パッチ抽出・Radiomics・3D 可視化 | 汎用 |
|
|
540
564
|
|
|
541
|
-
### T. シングルセル・空間・エピゲノミクス(
|
|
565
|
+
### T. シングルセル・空間・エピゲノミクス(12 種)
|
|
542
566
|
|
|
543
|
-
scRNA-seq・空間トランスクリプトミクス・エピゲノミクス・制御ゲノミクス・摂動解析・scVI 統合・scATAC-seq・GPU シングルセル・ENCODE/SCREEN・Human Cell Atlas・高度 Squidpy
|
|
567
|
+
scRNA-seq・空間トランスクリプトミクス・エピゲノミクス・制御ゲノミクス・摂動解析・scVI 統合・scATAC-seq・GPU シングルセル・ENCODE/SCREEN・Human Cell Atlas・高度 Squidpy 空間解析・空間マルチオミクスの解析パイプラインを担うスキル群。
|
|
544
568
|
|
|
545
569
|
| # | Skill | 説明 | 参照 Exp |
|
|
546
570
|
|---|---|---|---|
|
|
@@ -555,6 +579,7 @@ scRNA-seq・空間トランスクリプトミクス・エピゲノミクス・
|
|
|
555
579
|
| 125 | [scientific-encode-screen](scientific-encode-screen/SKILL.md) | ENCODE REST API 実験/ファイル検索・SCREEN cCRE・ChIP-Atlas エンリッチメント | 汎用 |
|
|
556
580
|
| 126 | [scientific-human-cell-atlas](scientific-human-cell-atlas/SKILL.md) | HCA Data Portal プロジェクト/ファイル・CELLxGENE Census 大規模アトラス | 汎用 |
|
|
557
581
|
| 131 | [scientific-squidpy-advanced](scientific-squidpy-advanced/SKILL.md) | Squidpy 空間自己相関・共起解析・近傍エンリッチメント・ニッチ同定 | 汎用 |
|
|
582
|
+
| 152 | [scientific-spatial-multiomics](scientific-spatial-multiomics/SKILL.md) | MERFISH/CODEX 空間マルチオミクス統合・共検出解析・空間コミュニティ検出 | 汎用 |
|
|
558
583
|
|
|
559
584
|
### U. 免疫・感染症(2 種)
|
|
560
585
|
|
|
@@ -580,15 +605,16 @@ scRNA-seq・空間トランスクリプトミクス・エピゲノミクス・
|
|
|
580
605
|
| 128 | [scientific-environmental-geodata](scientific-environmental-geodata/SKILL.md) | SoilGrids/WorldClim 環境地理空間データ・種分布モデル環境変数 | 汎用 |
|
|
581
606
|
| 129 | [scientific-paleobiology](scientific-paleobiology/SKILL.md) | PBDB 化石産出記録・分類群検索・地質年代多様性曲線 | 汎用 |
|
|
582
607
|
|
|
583
|
-
### W. システム生物学(
|
|
608
|
+
### W. システム生物学(4 種)
|
|
584
609
|
|
|
585
|
-
SBML
|
|
610
|
+
SBML 動的シミュレーション・代謝フラックス解析・遺伝子制御ネットワーク推定・代謝モデリングを担うスキル群。
|
|
586
611
|
|
|
587
612
|
| # | Skill | 説明 | 参照 Exp |
|
|
588
613
|
|---|---|---|---|
|
|
589
614
|
| 63 | [scientific-systems-biology](scientific-systems-biology/SKILL.md) | SBML/RoadRunner シミュレーション・FBA/pFBA (cobrapy)・GRN 推定 (GENIE3)・Sobol 感度解析 | 汎用 |
|
|
590
615
|
| 95 | [scientific-metabolic-modeling](scientific-metabolic-modeling/SKILL.md) | BiGG Models/BioModels ゲノムスケール代謝モデル・反応・代謝物検索 | 汎用 |
|
|
591
616
|
| 130 | [scientific-metabolic-atlas](scientific-metabolic-atlas/SKILL.md) | Metabolic Atlas/Human-GEM 代謝反応・代謝産物検索・ネットワーク解析 | 汎用 |
|
|
617
|
+
| 153 | [scientific-metabolic-flux](scientific-metabolic-flux/SKILL.md) | 13C/15N 安定同位体代謝フラックス解析・EMU モデリング・MID フィッティング | 汎用 |
|
|
592
618
|
|
|
593
619
|
### X. 疫学・公衆衛生(3 種)
|
|
594
620
|
|
|
@@ -725,7 +751,9 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
|
|
|
725
751
|
│ ├── scientific-geo-expression/
|
|
726
752
|
│ ├── scientific-parasite-genomics/
|
|
727
753
|
│ ├── scientific-arrayexpress-expression/
|
|
728
|
-
│
|
|
754
|
+
│ ├── scientific-gtex-tissue-expression/
|
|
755
|
+
│ ├── scientific-uniprot-proteome/
|
|
756
|
+
│ └── scientific-reactome-pathways/
|
|
729
757
|
│
|
|
730
758
|
│── [G] 化学・材料・イメージング
|
|
731
759
|
│ ├── scientific-cheminformatics/
|
|
@@ -735,14 +763,16 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
|
|
|
735
763
|
│ ├── scientific-chembl-assay-mining/
|
|
736
764
|
│ ├── scientific-md-simulation/
|
|
737
765
|
│ ├── scientific-advanced-imaging/
|
|
738
|
-
│
|
|
766
|
+
│ ├── scientific-deep-chemistry/
|
|
767
|
+
│ └── scientific-stitch-chemical-network/
|
|
739
768
|
│
|
|
740
769
|
├── [H] 臨床・疫学・メタ科学
|
|
741
770
|
│ ├── scientific-survival-clinical/
|
|
742
771
|
│ ├── scientific-causal-inference/
|
|
743
772
|
│ ├── scientific-meta-analysis/
|
|
744
773
|
│ ├── scientific-clinical-trials-analytics/
|
|
745
|
-
│
|
|
774
|
+
│ ├── scientific-clinical-reporting/
|
|
775
|
+
│ └── scientific-biobank-cohort/
|
|
746
776
|
│
|
|
747
777
|
├── [I] Deep Research・文献検索
|
|
748
778
|
│ ├── scientific-deep-research/
|
|
@@ -757,7 +787,8 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
|
|
|
757
787
|
│ ├── scientific-molecular-docking/
|
|
758
788
|
│ ├── scientific-pharmacology-targets/
|
|
759
789
|
│ ├── scientific-compound-screening/
|
|
760
|
-
│
|
|
790
|
+
│ ├── scientific-nci60-screening/
|
|
791
|
+
│ └── scientific-drugbank-resources/
|
|
761
792
|
│
|
|
762
793
|
├── [K] 構造生物学・タンパク質工学
|
|
763
794
|
│ ├── scientific-protein-structure-analysis/
|
|
@@ -765,12 +796,15 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
|
|
|
765
796
|
│ ├── scientific-protein-interaction-network/
|
|
766
797
|
│ ├── scientific-protein-domain-family/
|
|
767
798
|
│ ├── scientific-structural-proteomics/
|
|
768
|
-
│
|
|
799
|
+
│ ├── scientific-alphafold-structures/
|
|
800
|
+
│ └── scientific-rcsb-pdb-search/
|
|
769
801
|
│
|
|
770
802
|
├── [L] 精密医療・臨床意思決定
|
|
771
803
|
│ ├── scientific-variant-interpretation/
|
|
772
804
|
│ ├── scientific-clinical-decision-support/
|
|
773
|
-
│
|
|
805
|
+
│ ├── scientific-variant-effect-prediction/
|
|
806
|
+
│ ├── scientific-civic-evidence/
|
|
807
|
+
│ └── scientific-gnomad-variants/
|
|
774
808
|
│
|
|
775
809
|
├── [M] 実験室自動化・データ管理
|
|
776
810
|
│ ├── scientific-lab-automation/
|
|
@@ -796,7 +830,11 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
|
|
|
796
830
|
│ ├── scientific-cancer-genomics/
|
|
797
831
|
│ ├── scientific-rare-disease-genetics/
|
|
798
832
|
│ ├── scientific-cell-line-resources/
|
|
799
|
-
│
|
|
833
|
+
│ ├── scientific-icgc-cancer-data/
|
|
834
|
+
│ ├── scientific-opentargets-genetics/
|
|
835
|
+
│ ├── scientific-depmap-dependencies/
|
|
836
|
+
│ ├── scientific-monarch-ontology/
|
|
837
|
+
│ └── scientific-gdc-portal/
|
|
800
838
|
│
|
|
801
839
|
├── [R] 量子・先端計算
|
|
802
840
|
│ ├── scientific-quantum-computing/
|
|
@@ -821,7 +859,8 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
|
|
|
821
859
|
│ ├── scientific-gpu-singlecell/
|
|
822
860
|
│ ├── scientific-encode-screen/
|
|
823
861
|
│ ├── scientific-human-cell-atlas/
|
|
824
|
-
│
|
|
862
|
+
│ ├── scientific-squidpy-advanced/
|
|
863
|
+
│ └── scientific-spatial-multiomics/
|
|
825
864
|
│
|
|
826
865
|
│── [U] 免疫・感染症
|
|
827
866
|
│ ├── scientific-immunoinformatics/
|
|
@@ -840,7 +879,8 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
|
|
|
840
879
|
│── [W] システム生物学
|
|
841
880
|
│ ├── scientific-systems-biology/
|
|
842
881
|
│ ├── scientific-metabolic-modeling/
|
|
843
|
-
│
|
|
882
|
+
│ ├── scientific-metabolic-atlas/
|
|
883
|
+
│ └── scientific-metabolic-flux/
|
|
844
884
|
│
|
|
845
885
|
│── [X] 疫学・公衆衛生
|
|
846
886
|
│ ├── scientific-epidemiology-public-health/
|
package/package.json
CHANGED
|
@@ -5,6 +5,10 @@ description: |
|
|
|
5
5
|
包括的予測パイプライン。DeepChem/ADMET-AI/PyTDC を活用した分子特性予測、
|
|
6
6
|
PK/PD モデリング、ドラッグライクネス最適化、リード最適化戦略を提供。
|
|
7
7
|
「ADMET 予測して」「薬物動態を評価して」「lead optimization して」で発火。
|
|
8
|
+
tu_tools:
|
|
9
|
+
- key: pubchem
|
|
10
|
+
name: PubChem
|
|
11
|
+
description: 化合物・物質・生理活性アッセイデータベース
|
|
8
12
|
---
|
|
9
13
|
|
|
10
14
|
# Scientific ADMET & Pharmacokinetics
|
|
@@ -0,0 +1,268 @@
|
|
|
1
|
+
---
|
|
2
|
+
name: scientific-biobank-cohort
|
|
3
|
+
description: |
|
|
4
|
+
バイオバンク・大規模コホートデータ解析スキル。UK Biobank /
|
|
5
|
+
BBJ / All of Us 等の大規模コホートデータに対するフェノタイプ
|
|
6
|
+
辞書検索・GWAS サマリー統計処理・PheWAS パイプライン。
|
|
7
|
+
---
|
|
8
|
+
|
|
9
|
+
# Scientific Biobank Cohort
|
|
10
|
+
|
|
11
|
+
UK Biobank・バイオバンクジャパン (BBJ)・All of Us 等の大規模
|
|
12
|
+
コホートデータを活用したフェノタイプ辞書検索・GWAS サマリー
|
|
13
|
+
統計処理・PheWAS 解析パイプラインを提供する。
|
|
14
|
+
|
|
15
|
+
## When to Use
|
|
16
|
+
|
|
17
|
+
- バイオバンクのフェノタイプ辞書を検索するとき
|
|
18
|
+
- GWAS サマリー統計データを処理・可視化するとき
|
|
19
|
+
- PheWAS (Phenome-Wide Association Study) を実施するとき
|
|
20
|
+
- コホートの基本統計・人口統計特性を集計するとき
|
|
21
|
+
- バリアント-フェノタイプ関連を網羅的に検索するとき
|
|
22
|
+
|
|
23
|
+
---
|
|
24
|
+
|
|
25
|
+
## Quick Start
|
|
26
|
+
|
|
27
|
+
## 1. フェノタイプ辞書検索
|
|
28
|
+
|
|
29
|
+
```python
|
|
30
|
+
import pandas as pd
|
|
31
|
+
import numpy as np
|
|
32
|
+
|
|
33
|
+
|
|
34
|
+
def phenotype_dictionary(pheno_file, category=None,
|
|
35
|
+
keyword=None):
|
|
36
|
+
"""
|
|
37
|
+
バイオバンク — フェノタイプ辞書検索。
|
|
38
|
+
|
|
39
|
+
Parameters:
|
|
40
|
+
pheno_file: str — フェノタイプ辞書 CSV パス
|
|
41
|
+
(UK Biobank Data-Field listing 等)
|
|
42
|
+
category: str — カテゴリフィルタ
|
|
43
|
+
keyword: str — キーワードフィルタ
|
|
44
|
+
"""
|
|
45
|
+
df = pd.read_csv(pheno_file)
|
|
46
|
+
|
|
47
|
+
if category:
|
|
48
|
+
df = df[df["Category"].str.contains(
|
|
49
|
+
category, case=False, na=False)]
|
|
50
|
+
if keyword:
|
|
51
|
+
mask = (
|
|
52
|
+
df["Field"].str.contains(
|
|
53
|
+
keyword, case=False, na=False)
|
|
54
|
+
| df["Description"].str.contains(
|
|
55
|
+
keyword, case=False, na=False)
|
|
56
|
+
)
|
|
57
|
+
df = df[mask]
|
|
58
|
+
|
|
59
|
+
print(f"Phenotype dict: {len(df)} fields matched")
|
|
60
|
+
return df
|
|
61
|
+
|
|
62
|
+
|
|
63
|
+
def cohort_demographics(pheno_df, age_col="age",
|
|
64
|
+
sex_col="sex"):
|
|
65
|
+
"""
|
|
66
|
+
バイオバンク — コホート人口統計サマリー。
|
|
67
|
+
|
|
68
|
+
Parameters:
|
|
69
|
+
pheno_df: DataFrame — 参加者フェノタイプデータ
|
|
70
|
+
age_col: str — 年齢列名
|
|
71
|
+
sex_col: str — 性別列名
|
|
72
|
+
"""
|
|
73
|
+
summary = {
|
|
74
|
+
"n_participants": len(pheno_df),
|
|
75
|
+
"age_mean": pheno_df[age_col].mean(),
|
|
76
|
+
"age_std": pheno_df[age_col].std(),
|
|
77
|
+
"sex_distribution": (
|
|
78
|
+
pheno_df[sex_col]
|
|
79
|
+
.value_counts(normalize=True)
|
|
80
|
+
.to_dict()
|
|
81
|
+
),
|
|
82
|
+
}
|
|
83
|
+
print(f"Cohort: n={summary['n_participants']}, "
|
|
84
|
+
f"age={summary['age_mean']:.1f}±"
|
|
85
|
+
f"{summary['age_std']:.1f}")
|
|
86
|
+
return summary
|
|
87
|
+
```
|
|
88
|
+
|
|
89
|
+
## 2. GWAS サマリー統計処理
|
|
90
|
+
|
|
91
|
+
```python
|
|
92
|
+
def load_gwas_summary(sumstat_file, p_threshold=5e-8,
|
|
93
|
+
sep="\t"):
|
|
94
|
+
"""
|
|
95
|
+
GWAS サマリー統計ファイル読み込み・フィルタリング。
|
|
96
|
+
|
|
97
|
+
Parameters:
|
|
98
|
+
sumstat_file: str — サマリー統計ファイルパス
|
|
99
|
+
(TSV: CHR, POS, SNP, A1, A2, BETA, SE, P)
|
|
100
|
+
p_threshold: float — P 値閾値
|
|
101
|
+
sep: str — 区切り文字
|
|
102
|
+
"""
|
|
103
|
+
df = pd.read_csv(sumstat_file, sep=sep)
|
|
104
|
+
|
|
105
|
+
# 標準カラム名正規化
|
|
106
|
+
col_map = {
|
|
107
|
+
"chromosome": "CHR", "chr": "CHR",
|
|
108
|
+
"position": "POS", "pos": "POS", "bp": "POS",
|
|
109
|
+
"rsid": "SNP", "snp": "SNP", "variant_id": "SNP",
|
|
110
|
+
"effect_allele": "A1", "a1": "A1",
|
|
111
|
+
"other_allele": "A2", "a2": "A2",
|
|
112
|
+
"beta": "BETA", "effect_size": "BETA",
|
|
113
|
+
"se": "SE", "standard_error": "SE",
|
|
114
|
+
"pval": "P", "p_value": "P", "pvalue": "P",
|
|
115
|
+
}
|
|
116
|
+
df.columns = [col_map.get(c.lower(), c)
|
|
117
|
+
for c in df.columns]
|
|
118
|
+
|
|
119
|
+
# フィルタ
|
|
120
|
+
sig = df[df["P"] < p_threshold].copy()
|
|
121
|
+
sig.sort_values("P", inplace=True)
|
|
122
|
+
|
|
123
|
+
print(f"GWAS summary: {len(df)} total, "
|
|
124
|
+
f"{len(sig)} significant (P<{p_threshold})")
|
|
125
|
+
return sig
|
|
126
|
+
|
|
127
|
+
|
|
128
|
+
def manhattan_data(gwas_df, chr_col="CHR",
|
|
129
|
+
pos_col="POS", p_col="P"):
|
|
130
|
+
"""
|
|
131
|
+
Manhattan プロット用データ変換。
|
|
132
|
+
|
|
133
|
+
Parameters:
|
|
134
|
+
gwas_df: DataFrame — GWAS サマリー統計
|
|
135
|
+
chr_col: str — 染色体列
|
|
136
|
+
pos_col: str — 位置列
|
|
137
|
+
p_col: str — P 値列
|
|
138
|
+
"""
|
|
139
|
+
df = gwas_df.copy()
|
|
140
|
+
df["-log10P"] = -np.log10(df[p_col])
|
|
141
|
+
|
|
142
|
+
# 累積位置計算
|
|
143
|
+
chr_lengths = (
|
|
144
|
+
df.groupby(chr_col)[pos_col].max()
|
|
145
|
+
.sort_index()
|
|
146
|
+
)
|
|
147
|
+
chr_offsets = chr_lengths.cumsum().shift(1).fillna(0)
|
|
148
|
+
df["cumpos"] = df.apply(
|
|
149
|
+
lambda r: r[pos_col] + chr_offsets.get(
|
|
150
|
+
r[chr_col], 0),
|
|
151
|
+
axis=1)
|
|
152
|
+
|
|
153
|
+
print(f"Manhattan data: {len(df)} variants, "
|
|
154
|
+
f"max -log10P={df['-log10P'].max():.1f}")
|
|
155
|
+
return df
|
|
156
|
+
```
|
|
157
|
+
|
|
158
|
+
## 3. PheWAS (Phenome-Wide Association Study)
|
|
159
|
+
|
|
160
|
+
```python
|
|
161
|
+
def phewas_analysis(genotype_series, pheno_df,
|
|
162
|
+
pheno_cols=None,
|
|
163
|
+
p_threshold=0.05):
|
|
164
|
+
"""
|
|
165
|
+
PheWAS — 1バリアントに対する多表現型アソシエーション。
|
|
166
|
+
|
|
167
|
+
Parameters:
|
|
168
|
+
genotype_series: Series — バリアント遺伝子型
|
|
169
|
+
(0/1/2 コーディング)
|
|
170
|
+
pheno_df: DataFrame — フェノタイプデータ
|
|
171
|
+
pheno_cols: list — テスト対象表現型列
|
|
172
|
+
p_threshold: float — Bonferroni 前閾値
|
|
173
|
+
"""
|
|
174
|
+
from scipy import stats
|
|
175
|
+
|
|
176
|
+
if pheno_cols is None:
|
|
177
|
+
pheno_cols = [c for c in pheno_df.columns
|
|
178
|
+
if pheno_df[c].dtype in
|
|
179
|
+
[np.float64, np.int64]]
|
|
180
|
+
|
|
181
|
+
results = []
|
|
182
|
+
for col in pheno_cols:
|
|
183
|
+
mask = pheno_df[col].notna()
|
|
184
|
+
if mask.sum() < 50:
|
|
185
|
+
continue
|
|
186
|
+
geno = genotype_series[mask]
|
|
187
|
+
pheno = pheno_df.loc[mask, col]
|
|
188
|
+
|
|
189
|
+
# 数値 → 線形回帰 (簡易)
|
|
190
|
+
slope, intercept, r, p, se = stats.linregress(
|
|
191
|
+
geno, pheno)
|
|
192
|
+
results.append({
|
|
193
|
+
"phenotype": col,
|
|
194
|
+
"beta": slope,
|
|
195
|
+
"se": se,
|
|
196
|
+
"p_value": p,
|
|
197
|
+
"n": mask.sum(),
|
|
198
|
+
})
|
|
199
|
+
|
|
200
|
+
df = pd.DataFrame(results)
|
|
201
|
+
n_tests = len(df)
|
|
202
|
+
bonf = p_threshold / n_tests if n_tests > 0 else 0.05
|
|
203
|
+
df["significant"] = df["p_value"] < bonf
|
|
204
|
+
df.sort_values("p_value", inplace=True)
|
|
205
|
+
|
|
206
|
+
n_sig = df["significant"].sum()
|
|
207
|
+
print(f"PheWAS: {n_tests} phenotypes tested, "
|
|
208
|
+
f"{n_sig} significant (Bonferroni)")
|
|
209
|
+
return df
|
|
210
|
+
```
|
|
211
|
+
|
|
212
|
+
## 4. バイオバンク統合パイプライン
|
|
213
|
+
|
|
214
|
+
```python
|
|
215
|
+
def biobank_pipeline(sumstat_file, pheno_file=None,
|
|
216
|
+
output_dir="results"):
|
|
217
|
+
"""
|
|
218
|
+
バイオバンク統合パイプライン。
|
|
219
|
+
|
|
220
|
+
Parameters:
|
|
221
|
+
sumstat_file: str — GWAS サマリー統計ファイル
|
|
222
|
+
pheno_file: str — フェノタイプ辞書ファイル
|
|
223
|
+
output_dir: str — 出力ディレクトリ
|
|
224
|
+
"""
|
|
225
|
+
from pathlib import Path
|
|
226
|
+
output_dir = Path(output_dir)
|
|
227
|
+
output_dir.mkdir(parents=True, exist_ok=True)
|
|
228
|
+
|
|
229
|
+
# 1) GWAS サマリー統計読み込み
|
|
230
|
+
gwas = load_gwas_summary(sumstat_file)
|
|
231
|
+
gwas.to_csv(output_dir / "gwas_significant.csv",
|
|
232
|
+
index=False)
|
|
233
|
+
|
|
234
|
+
# 2) Manhattan プロットデータ
|
|
235
|
+
manhattan = manhattan_data(gwas)
|
|
236
|
+
manhattan.to_csv(
|
|
237
|
+
output_dir / "manhattan_data.csv", index=False)
|
|
238
|
+
|
|
239
|
+
# 3) フェノタイプ辞書検索 (利用可能な場合)
|
|
240
|
+
if pheno_file:
|
|
241
|
+
pheno_dict = phenotype_dictionary(pheno_file)
|
|
242
|
+
pheno_dict.to_csv(
|
|
243
|
+
output_dir / "phenotype_dict.csv",
|
|
244
|
+
index=False)
|
|
245
|
+
|
|
246
|
+
print(f"Biobank pipeline → {output_dir}")
|
|
247
|
+
return {"gwas": gwas, "manhattan": manhattan}
|
|
248
|
+
```
|
|
249
|
+
|
|
250
|
+
---
|
|
251
|
+
|
|
252
|
+
## パイプライン統合
|
|
253
|
+
|
|
254
|
+
```
|
|
255
|
+
epidemiology-public-health → biobank-cohort → population-genetics
|
|
256
|
+
(疫学デザイン) (GWAS/PheWAS) (集団遺伝解析)
|
|
257
|
+
│ │ ↓
|
|
258
|
+
mendelian-randomization ───────┘ rare-disease-genetics
|
|
259
|
+
(因果推論) (Mendelian 解析)
|
|
260
|
+
```
|
|
261
|
+
|
|
262
|
+
## パイプライン出力
|
|
263
|
+
|
|
264
|
+
| ファイル | 説明 | 次スキル |
|
|
265
|
+
|---------|------|---------|
|
|
266
|
+
| `results/gwas_significant.csv` | Genome-wide significant SNP | → population-genetics |
|
|
267
|
+
| `results/manhattan_data.csv` | Manhattan プロットデータ | → GWAS 可視化 |
|
|
268
|
+
| `results/phenotype_dict.csv` | フェノタイプ辞書 | → PheWAS |
|
|
@@ -7,6 +7,13 @@ description: |
|
|
|
7
7
|
変異シグネチャー解析、遺伝子依存性 (essentiality) 評価、
|
|
8
8
|
コピー数変化・がん種横断解析パイプライン。
|
|
9
9
|
13 の ToolUniverse SMCP ツールと連携。
|
|
10
|
+
tu_tools:
|
|
11
|
+
- key: cosmic
|
|
12
|
+
name: COSMIC
|
|
13
|
+
description: がん体細胞変異カタログ
|
|
14
|
+
- key: cbioportal
|
|
15
|
+
name: cBioPortal
|
|
16
|
+
description: がんゲノミクスポータル
|
|
10
17
|
---
|
|
11
18
|
|
|
12
19
|
# Scientific Cancer Genomics
|