@nahisaho/satori 0.17.0 → 0.19.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (24) hide show
  1. package/README.md +85 -38
  2. package/package.json +1 -1
  3. package/src/.github/skills/scientific-alphafold-structures/SKILL.md +256 -0
  4. package/src/.github/skills/scientific-arrayexpress-expression/SKILL.md +264 -0
  5. package/src/.github/skills/scientific-civic-evidence/SKILL.md +292 -0
  6. package/src/.github/skills/scientific-compound-screening/SKILL.md +4 -0
  7. package/src/.github/skills/scientific-crossref-metadata/SKILL.md +313 -0
  8. package/src/.github/skills/scientific-depmap-dependencies/SKILL.md +239 -0
  9. package/src/.github/skills/scientific-disease-research/SKILL.md +4 -0
  10. package/src/.github/skills/scientific-drugbank-resources/SKILL.md +269 -0
  11. package/src/.github/skills/scientific-gnomad-variants/SKILL.md +356 -0
  12. package/src/.github/skills/scientific-gtex-tissue-expression/SKILL.md +271 -0
  13. package/src/.github/skills/scientific-gwas-catalog/SKILL.md +267 -0
  14. package/src/.github/skills/scientific-icgc-cancer-data/SKILL.md +351 -0
  15. package/src/.github/skills/scientific-metabolomics-databases/SKILL.md +4 -0
  16. package/src/.github/skills/scientific-opentargets-genetics/SKILL.md +299 -0
  17. package/src/.github/skills/scientific-pharmgkb-pgx/SKILL.md +306 -0
  18. package/src/.github/skills/scientific-protein-interaction-network/SKILL.md +4 -0
  19. package/src/.github/skills/scientific-rare-disease-genetics/SKILL.md +4 -0
  20. package/src/.github/skills/scientific-rcsb-pdb-search/SKILL.md +280 -0
  21. package/src/.github/skills/scientific-reactome-pathways/SKILL.md +242 -0
  22. package/src/.github/skills/scientific-semantic-scholar/SKILL.md +298 -0
  23. package/src/.github/skills/scientific-uniprot-proteome/SKILL.md +273 -0
  24. package/src/.github/skills/scientific-variant-interpretation/SKILL.md +4 -0
package/README.md CHANGED
@@ -7,7 +7,7 @@
7
7
 
8
8
  ## Overview
9
9
 
10
- このディレクトリには、Exp-01〜13 で蓄積した科学データ解析技法を Agent Skills として体系化した **132 個**のスキルを格納しています。Copilot がプロンプトの文脈に応じて適切なスキルを自動ロードし、各実験で確立した解析パターンを再利用します。79 のスキルは [ToolUniverse](https://github.com/mims-harvard/ToolUniverse) SMCP 経由で 1,200 以上の外部科学データベースツールとも連携可能です。
10
+ このディレクトリには、Exp-01〜13 で蓄積した科学データ解析技法を Agent Skills として体系化した **148 個**のスキルを格納しています。Copilot がプロンプトの文脈に応じて適切なスキルを自動ロードし、各実験で確立した解析パターンを再利用します。99 のスキルは [ToolUniverse](https://github.com/mims-harvard/ToolUniverse) SMCP 経由で 1,200 以上の外部科学データベースツールとも連携可能です。
11
11
 
12
12
  ### パイプラインフロー
13
13
 
@@ -208,7 +208,7 @@ symbolic-mathematics ──→ systems-biology ──→ admet-pharmacokinetics
208
208
 
209
209
  ### ToolUniverse MCP ツール連携
210
210
 
211
- 79 のスキル(HIGH 13 + MEDIUM 9 + Phase 3: 20 + Phase 4: 8 + Phase 5: 9 + Phase 6: 7 + Phase 7: 4 + Phase 8: 4 + Phase 9: 5)は、[ToolUniverse](https://github.com/mims-harvard/ToolUniverse) SMCP サーバー経由で 1,200 以上の外部科学ツールを利用可能です。各 SKILL.md 内の `### 利用可能ツール` セクションに対応ツールが記載されています。
211
+ 99 のスキル(HIGH 13 + MEDIUM 9 + Phase 3: 20 + Phase 4: 8 + Phase 5: 9 + Phase 6: 7 + Phase 7: 4 + Phase 8: 4 + Phase 9: 5 + Phase 10: 6 + Phase 11: 8 new + 6 existing key additions)は、[ToolUniverse](https://github.com/mims-harvard/ToolUniverse) SMCP サーバー経由で 1,200 以上の外部科学ツールを利用可能です。各 SKILL.md 内の `### 利用可能ツール` セクションに対応ツールが記載されています。
212
212
 
213
213
  ```
214
214
  SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・計算)
@@ -253,7 +253,21 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
253
253
  │ human-cell-atlas │───MCP──│ HCA Data Portal, CELLxGENE │
254
254
  │ geo-expression │───MCP──│ GEO (NCBI E-utilities) │
255
255
  │ paleobiology │───MCP──│ Paleobiology Database (PBDB) │
256
- ... (79 skills total) │ │ ... (1,200+ tools) │
256
+ gwas-catalog │───MCP──│ GWAS Catalog (EBI) │
257
+ │ alphafold-structures │───MCP──│ AlphaFold DB API │
258
+ │ arrayexpress-expression│───MCP──│ ArrayExpress, BioStudies │
259
+ │ semantic-scholar │───MCP──│ Semantic Scholar Graph API │
260
+ │ pharmgkb-pgx │───MCP──│ PharmGKB, CPIC Guidelines │
261
+ │ crossref-metadata │───MCP──│ CrossRef DOI/Metadata │
262
+ │ uniprot-proteome │───MCP──│ UniProt REST API │
263
+ │ rcsb-pdb-search │───MCP──│ RCSB PDB Search/Data API │
264
+ │ opentargets-genetics │───MCP──│ Open Targets GraphQL │
265
+ │ reactome-pathways │───MCP──│ Reactome Content Service │
266
+ │ depmap-dependencies │───MCP──│ DepMap Portal, Cell Model │
267
+ │ drugbank-resources │───MCP──│ DrugBank API │
268
+ │ civic-evidence │───MCP──│ CIViC REST API │
269
+ │ gnomad-variants │───MCP──│ gnomAD GraphQL API │
270
+ │ ... (99 skills total) │ │ ... (1,200+ tools) │
257
271
  └──────────────────────┘ └─────────────────────────────┘
258
272
  ```
259
273
 
@@ -261,23 +275,23 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
261
275
 
262
276
  | 中区分 | スキル数 | 概要 |
263
277
  |---|:---:|---|
264
- | A. 基盤・ワークフロー | 16 | パイプライン構築・前処理・データ生成・図表・執筆・仮説立案・批判的レビュー・SI 生成・LaTeX 変換・引用検証・査読対応・改訂追跡・論文品質・系統的レビュー・BioThings ID マッピング・データ投稿 |
278
+ | A. 基盤・ワークフロー | 17 | パイプライン構築・前処理・データ生成・図表・執筆・仮説立案・批判的レビュー・SI 生成・LaTeX 変換・引用検証・査読対応・改訂追跡・論文品質・系統的レビュー・BioThings ID マッピング・データ投稿・CrossRef メタデータ |
265
279
  | B. 統計・探索的解析 | 4 | EDA・仮説検定・次元削減・記号数学 |
266
280
  | C. 機械学習・モデリング | 3 | 回帰・分類・特徴量重要度 |
267
281
  | D. 実験計画・プロセス最適化 | 2 | DOE・応答曲面法・ベイズ最適化 |
268
282
  | E. 信号・スペクトル・時系列 | 4 | スペクトル解析・生体信号・時系列分解・神経電気生理学 |
269
- | F. 生命科学・オミクス | 20 | バイオインフォ・メタボロ・ゲノム配列・マルチオミクス・ネットワーク・プロテオミクス・トランスクリプトミクス・パスウェイ濃縮・代謝物 DB・HPA・ゲノム配列ツール・非コード RNA・オントロジー・EBI DB 群・Ensembl ゲノミクス・STRING/BioGRID PPI・発現比較・モデル生物 DB・GEO 発現プロファイル・寄生虫ゲノミクス |
283
+ | F. 生命科学・オミクス | 24 | バイオインフォ・メタボロ・ゲノム配列・マルチオミクス・ネットワーク・プロテオミクス・トランスクリプトミクス・パスウェイ濃縮・代謝物 DB・HPA・ゲノム配列ツール・非コード RNA・オントロジー・EBI DB 群・Ensembl ゲノミクス・STRING/BioGRID PPI・発現比較・モデル生物 DB・GEO 発現プロファイル・寄生虫ゲノミクス・ArrayExpress 発現アーカイブ・GTEx 組織発現・UniProt プロテオーム・Reactome パスウェイ |
270
284
  | G. 化学・材料・イメージング | 8 | ケモインフォ・材料特性評価・画像形態解析・計算材料科学・ChEMBL アッセイマイニング・MD シミュレーション・高度イメージング・深層化学 |
271
285
  | H. 臨床・疫学・メタ科学 | 5 | 生存解析・因果推論・メタアナリシス・臨床試験解析・臨床レポート |
272
- | I. Deep Research・文献検索 | 3 | 科学文献深層リサーチ・エビデンス階層評価・マルチ DB 文献検索・引用ネットワーク・プレプリント横断検索 |
273
- | J. 創薬・ファーマコロジー | 7 | 標的プロファイリング・ADMET/PK・ドラッグリポジショニング・分子ドッキング・薬理学的ターゲット・化合物スクリーニング・NCI-60 スクリーニング |
274
- | K. 構造生物学・タンパク質工学 | 5 | PDB/AlphaFold 構造解析・de novo タンパク質設計・PPI ネットワーク・ドメイン/ファミリー・構造プロテオミクス |
275
- | L. 精密医療・臨床意思決定 | 3 | 変異解釈 (ACMG/AMP)・エビデンスベース臨床意思決定・バリアント効果予測 |
286
+ | I. Deep Research・文献検索 | 4 | 科学文献深層リサーチ・エビデンス階層評価・マルチ DB 文献検索・引用ネットワーク・プレプリント横断検索・Semantic Scholar 学術グラフ |
287
+ | J. 創薬・ファーマコロジー | 8 | 標的プロファイリング・ADMET/PK・ドラッグリポジショニング・分子ドッキング・薬理学的ターゲット・化合物スクリーニング・NCI-60 スクリーニング・DrugBank リソース |
288
+ | K. 構造生物学・タンパク質工学 | 7 | PDB/AlphaFold 構造解析・de novo タンパク質設計・PPI ネットワーク・ドメイン/ファミリー・構造プロテオミクス・AlphaFold DB 構造予測・RCSB PDB 構造検索 |
289
+ | L. 精密医療・臨床意思決定 | 5 | 変異解釈 (ACMG/AMP)・エビデンスベース臨床意思決定・バリアント効果予測・CIViC 臨床エビデンス・gnomAD バリアント |
276
290
  | M. 実験室自動化・データ管理 | 2 | 液体ハンドリング・プロトコル管理・ELN/LIMS 連携・ラボデータ管理 |
277
291
  | N. 科学プレゼンテーション・図式 | 2 | 科学スライド・ポスター・ワークフロー図・科学図式 |
278
292
  | O. 研究計画・グラント・規制 | 3 | 助成金申請書・研究方法論・倫理審査・規制科学 |
279
- | P. ファーマコビジランス・薬理ゲノミクス | 2 | FAERS 不均衡分析・MedDRA 階層・安全性シグナル検出・PGx 代謝型 |
280
- | Q. 腫瘍学・疾患研究 | 5 | 精密腫瘍学 (CIViC/OncoKB)・疾患-遺伝子関連 (GWAS/Orphanet)・がんゲノミクス (COSMIC/DepMap)・希少疾患遺伝学・細胞株リソース |
293
+ | P. ファーマコビジランス・薬理ゲノミクス | 3 | FAERS 不均衡分析・MedDRA 階層・安全性シグナル検出・PGx 代謝型・PharmGKB 臨床アノテーション |
294
+ | Q. 腫瘍学・疾患研究 | 8 | 精密腫瘍学 (CIViC/OncoKB)・疾患-遺伝子関連 (GWAS/Orphanet)・がんゲノミクス (COSMIC/DepMap)・希少疾患遺伝学・細胞株リソース・ICGC がんゲノムデータ・Open Targets 遺伝学・DepMap 依存性 |
281
295
  | R. 量子・先端計算 | 7 | 量子計算・GNN・ベイズ統計・説明可能 AI・深層学習・ヘルスケア AI・強化学習 |
282
296
  | S. 医用イメージング | 1 | DICOM/NIfTI・WSI 病理画像・Radiomics・MONAI |
283
297
  | T. シングルセル・空間・エピゲノミクス | 11 | scRNA-seq・Visium・MERFISH・CELLxGENE・RNA velocity・エピゲノミクス・レギュラトリーゲノミクス・摂動解析・scVI 統合・scATAC-seq/Signac・GPU シングルセル・ENCODE/SCREEN・Human Cell Atlas・高度 Squidpy 空間解析 |
@@ -285,14 +299,14 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
285
299
  | V. マイクロバイオーム・環境 | 8 | 16S/メタゲノム・α/β 多様性・SDM・OBIS・GBIF・系統解析・rRNA 分類学・植物バイオロジー・海洋生態学・環境地理空間データ・古生物学 |
286
300
  | W. システム生物学 | 3 | SBML シミュレーション・FBA・GRN 推定・BioModels・代謝モデリング・Metabolic Atlas |
287
301
  | X. 疫学・公衆衛生 | 3 | リスク指標 (RR/OR)・年齢標準化・空間疫学・WHO・CDC・公衆衛生データ・環境毒性学 |
288
- | Y. 集団遺伝学 | 1 | HWE・PCA/ADMIXTURE・Fst・選択スキャン・gnomAD・GWAS |
302
+ | Y. 集団遺伝学 | 2 | HWE・PCA/ADMIXTURE・Fst・選択スキャン・gnomAD・GWAS・GWAS Catalog |
289
303
  | Z. 科学テキストマイニング | 2 | NER・関係抽出・知識グラフ・BERTopic・PubTator バイオアノテーション |
290
304
 
291
305
  ---
292
306
 
293
307
  ## Skills 一覧
294
308
 
295
- ### A. 基盤・ワークフロー(16 種)
309
+ ### A. 基盤・ワークフロー(17 種)
296
310
 
297
311
  全 Exp に共通する横断的な基盤スキル。
298
312
 
@@ -314,6 +328,7 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
314
328
  | 84 | [scientific-systematic-review](scientific-systematic-review/SKILL.md) | PRISMA 2020 系統的レビュー・マルチ DB 検索戦略・スクリーニング・バイアスリスク評価 | 汎用 |
315
329
  | 91 | [scientific-biothings-idmapping](scientific-biothings-idmapping/SKILL.md) | BioThings API (MyGene/MyVariant/MyChem) 横断的 ID マッピング・アノテーション | 汎用 |
316
330
  | 119 | [scientific-data-submission](scientific-data-submission/SKILL.md) | GenBank/SRA/GEO/BioProject/BioSample データ投稿・FAIR 原則準拠 | 汎用 |
331
+ | 139 | [scientific-crossref-metadata](scientific-crossref-metadata/SKILL.md) | CrossRef REST API DOI 解決・論文メタデータ・引用数・ジャーナル情報 | 汎用 |
317
332
 
318
333
  ### B. 統計・探索的解析(4 種)
319
334
 
@@ -356,9 +371,9 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
356
371
  | 24 | [scientific-time-series](scientific-time-series/SKILL.md) | STL 分解・SARIMA 予測・変化点検出・FFT 周期解析・Granger 因果 | 汎用 |
357
372
  | 67 | [scientific-neuroscience-electrophysiology](scientific-neuroscience-electrophysiology/SKILL.md) | SpikeInterface/Kilosort4 スパイクソート・MNE EEG/ERP・NeuroKit2 HRV/EDA・脳機能結合 | 汎用 |
358
373
 
359
- ### F. 生命科学・オミクス(20 種)
374
+ ### F. 生命科学・オミクス(24 種)
360
375
 
361
- バイオ・オミクス・ネットワーク解析・オントロジー・EBI データベース・ゲノミクス・PPI・発現比較・モデル生物 DB・GEO 発現プロファイル・寄生虫ゲノミクスを担うスキル群。
376
+ バイオ・オミクス・ネットワーク解析・オントロジー・EBI データベース・ゲノミクス・PPI・発現比較・モデル生物 DB・GEO 発現プロファイル・寄生虫ゲノミクス・ArrayExpress 発現アーカイブ・GTEx 組織発現・UniProt プロテオーム・Reactome パスウェイを担うスキル群。
362
377
 
363
378
  | # | Skill | 説明 | 参照 Exp |
364
379
  |---|---|---|---|
@@ -382,6 +397,10 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
382
397
  | 111 | [scientific-model-organism-db](scientific-model-organism-db/SKILL.md) | FlyBase/WormBase/ZFIN/RGD/MGI モデル生物データベース・種間オーソログ検索 | 汎用 |
383
398
  | 127 | [scientific-geo-expression](scientific-geo-expression/SKILL.md) | GEO REST API 発現プロファイル・マトリクス取得・差次的発現解析 | 汎用 |
384
399
  | 132 | [scientific-parasite-genomics](scientific-parasite-genomics/SKILL.md) | PlasmoDB/VectorBase/ToxoDB 寄生虫ゲノミクス・薬剤標的同定 | 汎用 |
400
+ | 135 | [scientific-arrayexpress-expression](scientific-arrayexpress-expression/SKILL.md) | ArrayExpress/BioStudies REST API 発現実験検索・SDRF メタデータ・データ再解析 | 汎用 |
401
+ | 137 | [scientific-gtex-tissue-expression](scientific-gtex-tissue-expression/SKILL.md) | GTEx Portal REST API v2 組織特異的発現・eQTL・多組織比較 | 汎用 |
402
+ | 141 | [scientific-uniprot-proteome](scientific-uniprot-proteome/SKILL.md) | UniProt REST API プロテオーム検索・ID マッピング・ドメイン/特徴抽出 | 汎用 |
403
+ | 144 | [scientific-reactome-pathways](scientific-reactome-pathways/SKILL.md) | Reactome Content Service パスウェイ検索・UniProt マッピング・参加者取得 | 汎用 |
385
404
 
386
405
  ### G. 化学・材料・イメージング(8 種)
387
406
 
@@ -410,19 +429,20 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
410
429
  | 71 | [scientific-clinical-trials-analytics](scientific-clinical-trials-analytics/SKILL.md) | ClinicalTrials.gov API v2 検索・競合ランドスケープ・AE/アウトカム抽出 | 汎用 |
411
430
  | 85 | [scientific-clinical-reporting](scientific-clinical-reporting/SKILL.md) | SOAP ノート・バイオマーカーレポート・ファーマコゲノミクス・FHIR JSON | 汎用 |
412
431
 
413
- ### I. Deep Research・文献検索(3 種)
432
+ ### I. Deep Research・文献検索(4 種)
414
433
 
415
- 科学文献の反復的深層リサーチとマルチ DB 文献検索・プレプリント横断検索を担うスキル群。
434
+ 科学文献の反復的深層リサーチとマルチ DB 文献検索・プレプリント横断検索・Semantic Scholar 学術グラフを担うスキル群。
416
435
 
417
436
  | # | Skill | 説明 | 参照 Exp |
418
437
  |---|---|---|---|
419
438
  | 36 | [scientific-deep-research](scientific-deep-research/SKILL.md) | SHIKIGAMI 準拠 Think→Search→Evaluate→Synthesize 反復サイクル・学術 DB 検索・エビデンス階層評価・ソース追跡・交差検証・ハルシネーション防止 | 汎用 |
420
439
  | 78 | [scientific-literature-search](scientific-literature-search/SKILL.md) | PubMed/Semantic Scholar/OpenAlex/EuropePMC/CrossRef マルチ DB 検索・引用ネットワーク | 汎用 |
421
440
  | 97 | [scientific-preprint-archive](scientific-preprint-archive/SKILL.md) | bioRxiv/medRxiv/arXiv/PMC/CORE/Zenodo/OpenAIRE/Unpaywall プレプリント・OA 横断検索 | 汎用 |
441
+ | 136 | [scientific-semantic-scholar](scientific-semantic-scholar/SKILL.md) | Semantic Scholar Academic Graph API 論文検索・引用グラフ・著者プロファイル・TLDR | 汎用 |
422
442
 
423
- ### J. 創薬・ファーマコロジー(7 種)
443
+ ### J. 創薬・ファーマコロジー(8 種)
424
444
 
425
- ドラッグディスカバリーの標的評価・薬物動態・リポジショニング・薬理学的ターゲット・化合物スクリーニング・NCI-60 スクリーニングを担うスキル群。
445
+ ドラッグディスカバリーの標的評価・薬物動態・リポジショニング・薬理学的ターゲット・化合物スクリーニング・NCI-60 スクリーニング・DrugBank リソースを担うスキル群。
426
446
 
427
447
  | # | Skill | 説明 | 参照 Exp |
428
448
  |---|---|---|---|
@@ -433,10 +453,11 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
433
453
  | 89 | [scientific-pharmacology-targets](scientific-pharmacology-targets/SKILL.md) | BindingDB/GPCRdb/GtoPdb/BRENDA/Pharos 薬理学的ターゲットプロファイリング | 汎用 |
434
454
  | 94 | [scientific-compound-screening](scientific-compound-screening/SKILL.md) | ZINC 化合物ライブラリ検索・バーチャルスクリーニング前処理 | 汎用 |
435
455
  | 120 | [scientific-nci60-screening](scientific-nci60-screening/SKILL.md) | NCI-60/CellMiner/DepMap がん細胞株薬剤応答スクリーニング | 汎用 |
456
+ | 146 | [scientific-drugbank-resources](scientific-drugbank-resources/SKILL.md) | DrugBank API 薬剤情報・薬理 MOA・標的タンパク質・薬物相互作用 | 汎用 |
436
457
 
437
- ### K. 構造生物学・タンパク質工学(5 種)
458
+ ### K. 構造生物学・タンパク質工学(7 種)
438
459
 
439
- タンパク質構造解析・設計・PPI ネットワーク・ドメイン解析・構造プロテオミクスを担うスキル群。
460
+ タンパク質構造解析・設計・PPI ネットワーク・ドメイン解析・構造プロテオミクス・AlphaFold DB 構造予測・RCSB PDB 構造検索を担うスキル群。
440
461
 
441
462
  | # | Skill | 説明 | 参照 Exp |
442
463
  |---|---|---|---|
@@ -445,15 +466,20 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
445
466
  | 79 | [scientific-protein-interaction-network](scientific-protein-interaction-network/SKILL.md) | STRING/IntAct/STITCH PPI ネットワーク・トポロジー解析・コミュニティ検出 | 汎用 |
446
467
  | 86 | [scientific-protein-domain-family](scientific-protein-domain-family/SKILL.md) | InterPro/InterProScan ドメイン予測・ファミリー分類・アーキテクチャ可視化 | 汎用 |
447
468
  | 93 | [scientific-structural-proteomics](scientific-structural-proteomics/SKILL.md) | EMDB/PDBe/Proteins API/Complex Portal/DeepGO/EVE 構造プロテオミクス | 汎用 |
469
+ | 134 | [scientific-alphafold-structures](scientific-alphafold-structures/SKILL.md) | AlphaFold DB REST API 構造予測取得・pLDDT 信頼度・PAE 解析 | 汎用 |
470
+ | 142 | [scientific-rcsb-pdb-search](scientific-rcsb-pdb-search/SKILL.md) | RCSB PDB Search/Data API 構造検索・メタデータ・リガンド情報 | 汎用 |
448
471
 
449
- ### L. 精密医療・臨床意思決定(3 種)
472
+ ### L. 精密医療・臨床意思決定(5 種)
450
473
 
451
- バリアント解釈とエビデンスベース臨床判断を担うスキル群。
474
+ バリアント解釈とエビデンスベース臨床判断・CIViC 臨床エビデンス・gnomAD バリアントを担うスキル群。
452
475
 
453
476
  | # | Skill | 説明 | 参照 Exp |
454
477
  |---|---|---|---|
455
478
  | 42 | [scientific-variant-interpretation](scientific-variant-interpretation/SKILL.md) | ACMG/AMP 28 基準・薬理ゲノミクス (CPIC)・OncoKB 体細胞変異レベル | 汎用 |
456
479
  | 43 | [scientific-clinical-decision-support](scientific-clinical-decision-support/SKILL.md) | GRADE エビデンス枠組・精密腫瘍学ワークフロー・臨床試験マッチング | 汎用 || 80 | [scientific-variant-effect-prediction](scientific-variant-effect-prediction/SKILL.md) | AlphaMissense/CADD/SpliceAI バリアント効果予測・コンセンサス病原性判定 | 汎用 |
480
+ | 147 | [scientific-civic-evidence](scientific-civic-evidence/SKILL.md) | CIViC REST API がんバリアント臨床解釈・エビデンス・アサーション | 汎用 |
481
+ | 148 | [scientific-gnomad-variants](scientific-gnomad-variants/SKILL.md) | gnomAD GraphQL 集団アレル頻度・遺伝子制約 (pLI/LOEUF)・リージョンクエリ | 汎用 |
482
+
457
483
  ### M. 実験室自動化・データ管理(2 種)
458
484
 
459
485
  ラボ実験の自動化とデータ管理を担うスキル群。
@@ -482,18 +508,19 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
482
508
  | 47 | [scientific-research-methodology](scientific-research-methodology/SKILL.md) | SCAMPER/TRIZ ブレインストーミング・研究デザインマトリクス・FINER 基準・IRB 倫理チェック | 汎用 |
483
509
  | 74 | [scientific-regulatory-science](scientific-regulatory-science/SKILL.md) | FDA Orange Book/医療機器 510(k)/ISO 13485 QMS/CAPA/USPTO 特許検索 | 汎用 |
484
510
 
485
- ### P. ファーマコビジランス・薬理ゲノミクス(2 種)
511
+ ### P. ファーマコビジランス・薬理ゲノミクス(3 種)
486
512
 
487
- 市販後医薬品安全性監視と薬理ゲノミクスのためのシグナル検出・定量評価を担うスキル群。
513
+ 市販後医薬品安全性監視と薬理ゲノミクス・PharmGKB 臨床アノテーションのためのシグナル検出・定量評価を担うスキル群。
488
514
 
489
515
  | # | Skill | 説明 | 参照 Exp |
490
516
  |---|---|---|---|
491
517
  | 48 | [scientific-pharmacovigilance](scientific-pharmacovigilance/SKILL.md) | FAERS 不均衡分析 (PRR/ROR/IC/EBGM)・MedDRA 階層・時系列トレンド・Naranjo 因果評価 | 汎用 |
492
518
  | 75 | [scientific-pharmacogenomics](scientific-pharmacogenomics/SKILL.md) | PharmGKB/CPIC ガイドライン・Star アレル・代謝型・FDA PGx バイオマーカー | 汎用 |
519
+ | 138 | [scientific-pharmgkb-pgx](scientific-pharmgkb-pgx/SKILL.md) | PharmGKB REST API 臨床アノテーション・薬物遺伝子関連・投与量ガイドライン | 汎用 |
493
520
 
494
- ### Q. 腫瘍学・疾患研究(5 種)
521
+ ### Q. 腫瘍学・疾患研究(8 種)
495
522
 
496
- 精密腫瘍学・疾患-遺伝子関連研究・がんゲノミクス・希少疾患遺伝学・細胞株リソースを担うスキル群。
523
+ 精密腫瘍学・疾患-遺伝子関連研究・がんゲノミクス・希少疾患遺伝学・細胞株リソース・ICGC がんゲノムデータ・Open Targets 遺伝学・DepMap 依存性を担うスキル群。
497
524
 
498
525
  | # | Skill | 説明 | 参照 Exp |
499
526
  |---|---|---|---|
@@ -502,6 +529,9 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
502
529
  | 81 | [scientific-cancer-genomics](scientific-cancer-genomics/SKILL.md) | COSMIC/cBioPortal/DepMap がんゲノミクス・変異シグネチャー解析 | 汎用 |
503
530
  | 87 | [scientific-rare-disease-genetics](scientific-rare-disease-genetics/SKILL.md) | OMIM/Orphanet/DisGeNET/IMPC 希少疾患遺伝学・統合解析 | 汎用 |
504
531
  | 101 | [scientific-cell-line-resources](scientific-cell-line-resources/SKILL.md) | Cellosaurus 細胞株検索・STR プロファイル検証・コンタミネーション検出 | 汎用 |
532
+ | 140 | [scientific-icgc-cancer-data](scientific-icgc-cancer-data/SKILL.md) | ICGC DCC API 国際がんゲノムデータ・体細胞変異・がん種統計 | 汎用 |
533
+ | 143 | [scientific-opentargets-genetics](scientific-opentargets-genetics/SKILL.md) | Open Targets Platform GraphQL 標的-疾患アソシエーション・薬剤エビデンス・L2G | 汎用 |
534
+ | 145 | [scientific-depmap-dependencies](scientific-depmap-dependencies/SKILL.md) | DepMap Portal CRISPR/RNAi 遺伝子依存性・薬剤感受性 | 汎用 |
505
535
 
506
536
  ### R. 量子・先端計算(7 種)
507
537
 
@@ -587,13 +617,14 @@ SBML 動的シミュレーション・代謝フラックス・遺伝子制御ネ
587
617
  | 98 | [scientific-public-health-data](scientific-public-health-data/SKILL.md) | NHANES/MedlinePlus/RxNorm/ODPHP 公衆衛生データアクセス・健康格差API | 汎用 |
588
618
  | 117 | [scientific-toxicology-env](scientific-toxicology-env/SKILL.md) | CTD/Tox21/ToxCast/T3DB/EPA IRIS 環境毒性学・化学物質健康影響解析 | 汎用 |
589
619
 
590
- ### Y. 集団遺伝学(1 種)
620
+ ### Y. 集団遺伝学(2 種)
591
621
 
592
- 集団構造推定・分化指標・自然選択検出を担うスキル。
622
+ 集団構造推定・分化指標・自然選択検出・GWAS Catalog を担うスキル群。
593
623
 
594
624
  | # | Skill | 説明 | 参照 Exp |
595
625
  |---|---|---|---|
596
626
  | 65 | [scientific-population-genetics](scientific-population-genetics/SKILL.md) | PLINK2 QC・HWE 検定・PCA/ADMIXTURE・Weir-Cockerham Fst・iHS/Tajima's D 選択スキャン | 汎用 |
627
+ | 133 | [scientific-gwas-catalog](scientific-gwas-catalog/SKILL.md) | NHGRI-EBI GWAS Catalog REST API 関連解析・研究検索・PheWAS | 汎用 |
597
628
 
598
629
  ### Z. 科学テキストマイニング(2 種)
599
630
 
@@ -665,7 +696,8 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
665
696
  │ ├── scientific-paper-quality/
666
697
  │ ├── scientific-systematic-review/
667
698
  │ ├── scientific-biothings-idmapping/
668
- └── scientific-data-submission/
699
+ ├── scientific-data-submission/
700
+ │ └── scientific-crossref-metadata/
669
701
 
670
702
  │── [B] 統計・探索的解析
671
703
  │ ├── scientific-eda-correlation/
@@ -708,7 +740,11 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
708
740
  │ ├── scientific-expression-comparison/
709
741
  │ ├── scientific-model-organism-db/
710
742
  │ ├── scientific-geo-expression/
711
- └── scientific-parasite-genomics/
743
+ ├── scientific-parasite-genomics/
744
+ │ ├── scientific-arrayexpress-expression/
745
+ │ ├── scientific-gtex-tissue-expression/
746
+ │ ├── scientific-uniprot-proteome/
747
+ │ └── scientific-reactome-pathways/
712
748
 
713
749
  │── [G] 化学・材料・イメージング
714
750
  │ ├── scientific-cheminformatics/
@@ -730,7 +766,8 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
730
766
  ├── [I] Deep Research・文献検索
731
767
  │ ├── scientific-deep-research/
732
768
  │ ├── scientific-literature-search/
733
- └── scientific-preprint-archive/
769
+ ├── scientific-preprint-archive/
770
+ │ └── scientific-semantic-scholar/
734
771
 
735
772
  ├── [J] 創薬・ファーマコロジー
736
773
  │ ├── scientific-drug-target-profiling/
@@ -739,19 +776,24 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
739
776
  │ ├── scientific-molecular-docking/
740
777
  │ ├── scientific-pharmacology-targets/
741
778
  │ ├── scientific-compound-screening/
742
- └── scientific-nci60-screening/
779
+ ├── scientific-nci60-screening/
780
+ │ └── scientific-drugbank-resources/
743
781
 
744
782
  ├── [K] 構造生物学・タンパク質工学
745
783
  │ ├── scientific-protein-structure-analysis/
746
784
  │ ├── scientific-protein-design/
747
785
  │ ├── scientific-protein-interaction-network/
748
786
  │ ├── scientific-protein-domain-family/
749
- └── scientific-structural-proteomics/
787
+ ├── scientific-structural-proteomics/
788
+ │ ├── scientific-alphafold-structures/
789
+ │ └── scientific-rcsb-pdb-search/
750
790
 
751
791
  ├── [L] 精密医療・臨床意思決定
752
792
  │ ├── scientific-variant-interpretation/
753
793
  │ ├── scientific-clinical-decision-support/
754
- └── scientific-variant-effect-prediction/
794
+ ├── scientific-variant-effect-prediction/
795
+ │ ├── scientific-civic-evidence/
796
+ │ └── scientific-gnomad-variants/
755
797
 
756
798
  ├── [M] 実験室自動化・データ管理
757
799
  │ ├── scientific-lab-automation/
@@ -768,14 +810,18 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
768
810
 
769
811
  ├── [P] ファーマコビジランス・薬理ゲノミクス
770
812
  │ ├── scientific-pharmacovigilance/
771
- └── scientific-pharmacogenomics/
813
+ ├── scientific-pharmacogenomics/
814
+ │ └── scientific-pharmgkb-pgx/
772
815
 
773
816
  ├── [Q] 腫瘍学・疾患研究
774
817
  │ ├── scientific-precision-oncology/
775
818
  │ ├── scientific-disease-research/
776
819
  │ ├── scientific-cancer-genomics/
777
820
  │ ├── scientific-rare-disease-genetics/
778
- └── scientific-cell-line-resources/
821
+ ├── scientific-cell-line-resources/
822
+ │ ├── scientific-icgc-cancer-data/
823
+ │ ├── scientific-opentargets-genetics/
824
+ │ └── scientific-depmap-dependencies/
779
825
 
780
826
  ├── [R] 量子・先端計算
781
827
  │ ├── scientific-quantum-computing/
@@ -827,7 +873,8 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
827
873
  │ └── scientific-toxicology-env/
828
874
 
829
875
  │── [Y] 集団遺伝学
830
- └── scientific-population-genetics/
876
+ ├── scientific-population-genetics/
877
+ │ └── scientific-gwas-catalog/
831
878
 
832
879
  └── [Z] 科学テキストマイニング
833
880
  ├── scientific-text-mining-nlp/
package/package.json CHANGED
@@ -1,6 +1,6 @@
1
1
  {
2
2
  "name": "@nahisaho/satori",
3
- "version": "0.17.0",
3
+ "version": "0.19.0",
4
4
  "description": "SATORI — Agent Skills for Science. GitHub Copilot Agent Skills collection for scientific data analysis.",
5
5
  "main": "index.js",
6
6
  "bin": {
@@ -0,0 +1,256 @@
1
+ ---
2
+ name: scientific-alphafold-structures
3
+ description: |
4
+ AlphaFold 構造予測スキル。AlphaFold Protein Structure Database
5
+ REST API による予測構造取得・pLDDT 信頼度解析・PAE 残基間
6
+ 距離予測・構造カバレッジ分析。ToolUniverse 連携: alphafold。
7
+ tu_tools:
8
+ - key: alphafold
9
+ name: AlphaFold Database
10
+ description: AlphaFold 予測構造・コンフィデンス・PAE 取得
11
+ ---
12
+
13
+ # Scientific AlphaFold Structures
14
+
15
+ AlphaFold Protein Structure Database REST API を活用した
16
+ 構造予測取得・信頼度解析パイプラインを提供する。
17
+
18
+ ## When to Use
19
+
20
+ - UniProt ID から AlphaFold 予測構造を取得するとき
21
+ - pLDDT スコアで構造信頼度を評価するとき
22
+ - PAE (Predicted Aligned Error) で残基間予測精度を分析するとき
23
+ - 構造カバレッジ (モデル化割合) を確認するとき
24
+ - AlphaFold 構造を実験構造と比較するとき
25
+ - 大規模プロテオーム構造データをバッチ取得するとき
26
+
27
+ ---
28
+
29
+ ## Quick Start
30
+
31
+ ## 1. AlphaFold 予測構造取得
32
+
33
+ ```python
34
+ import requests
35
+ import pandas as pd
36
+ import numpy as np
37
+ from io import StringIO
38
+
39
+ AFDB_BASE = "https://alphafold.ebi.ac.uk/api"
40
+
41
+
42
+ def alphafold_get_prediction(uniprot_id, version=4):
43
+ """
44
+ AlphaFold DB — 予測構造取得。
45
+
46
+ Parameters:
47
+ uniprot_id: str — UniProt アクセッション (例: "P00533")
48
+ version: int — AlphaFold モデルバージョン
49
+ """
50
+ url = f"{AFDB_BASE}/prediction/{uniprot_id}"
51
+ resp = requests.get(url, timeout=30)
52
+ resp.raise_for_status()
53
+ entries = resp.json()
54
+
55
+ if not entries:
56
+ print(f"No AlphaFold prediction for {uniprot_id}")
57
+ return None
58
+
59
+ entry = entries[0] if isinstance(entries, list) else entries
60
+ result = {
61
+ "uniprot_id": uniprot_id,
62
+ "entry_id": entry.get("entryId", ""),
63
+ "gene": entry.get("gene", ""),
64
+ "organism": entry.get("organismScientificName", ""),
65
+ "tax_id": entry.get("taxId", ""),
66
+ "sequence_length": entry.get("uniprotEnd", 0)
67
+ - entry.get("uniprotStart", 0) + 1,
68
+ "model_url": entry.get("cifUrl", ""),
69
+ "pdb_url": entry.get("pdbUrl", ""),
70
+ "pae_url": entry.get("paeImageUrl", ""),
71
+ "global_plddt": entry.get("globalMetricValue", None),
72
+ "model_version": entry.get("latestVersion", version),
73
+ }
74
+
75
+ print(f"AlphaFold {uniprot_id}: pLDDT={result['global_plddt']}, "
76
+ f"length={result['sequence_length']}")
77
+ return result
78
+ ```
79
+
80
+ ## 2. pLDDT 信頼度プロファイル解析
81
+
82
+ ```python
83
+ import biotite.structure.io.pdbx as pdbx
84
+ import biotite.structure as struc
85
+
86
+
87
+ def alphafold_plddt_profile(uniprot_id, output_dir="results"):
88
+ """
89
+ AlphaFold — pLDDT 残基別信頼度プロファイル。
90
+
91
+ Parameters:
92
+ uniprot_id: str — UniProt アクセッション
93
+ output_dir: str — 出力ディレクトリ
94
+ """
95
+ from pathlib import Path
96
+ output_dir = Path(output_dir)
97
+ output_dir.mkdir(parents=True, exist_ok=True)
98
+
99
+ # CIF 取得
100
+ pred = alphafold_get_prediction(uniprot_id)
101
+ if not pred:
102
+ return pd.DataFrame()
103
+
104
+ cif_url = pred["model_url"]
105
+ resp = requests.get(cif_url, timeout=60)
106
+ resp.raise_for_status()
107
+
108
+ cif_path = output_dir / f"AF-{uniprot_id}.cif"
109
+ cif_path.write_bytes(resp.content)
110
+
111
+ # pLDDT = B-factor in AlphaFold structures
112
+ pdbx_file = pdbx.CIFFile.read(str(cif_path))
113
+ structure = pdbx.get_structure(pdbx_file, model=1)
114
+ ca_mask = structure.atom_name == "CA"
115
+ ca_atoms = structure[ca_mask]
116
+
117
+ residues = []
118
+ for i, atom in enumerate(ca_atoms):
119
+ residues.append({
120
+ "residue_index": i + 1,
121
+ "residue_name": atom.res_name,
122
+ "chain": atom.chain_id,
123
+ "plddt": atom.b_factor,
124
+ })
125
+
126
+ df = pd.DataFrame(residues)
127
+
128
+ # 信頼度カテゴリ
129
+ df["confidence"] = pd.cut(
130
+ df["plddt"],
131
+ bins=[0, 50, 70, 90, 100],
132
+ labels=["Very low", "Low", "Confident", "Very high"],
133
+ )
134
+
135
+ n_high = (df["plddt"] >= 70).sum()
136
+ print(f"pLDDT profile {uniprot_id}: {len(df)} residues, "
137
+ f"{n_high}/{len(df)} confident (≥70)")
138
+ return df
139
+ ```
140
+
141
+ ## 3. PAE (Predicted Aligned Error) 解析
142
+
143
+ ```python
144
+ def alphafold_pae_analysis(uniprot_id):
145
+ """
146
+ AlphaFold — PAE マトリクス解析。
147
+
148
+ Parameters:
149
+ uniprot_id: str — UniProt アクセッション
150
+ """
151
+ url = (f"https://alphafold.ebi.ac.uk/files/"
152
+ f"AF-{uniprot_id}-F1-predicted_aligned_error_v4.json")
153
+ resp = requests.get(url, timeout=30)
154
+ resp.raise_for_status()
155
+ data = resp.json()
156
+
157
+ pae_data = data[0] if isinstance(data, list) else data
158
+ pae_matrix = np.array(pae_data.get("predicted_aligned_error",
159
+ pae_data.get("pae", [])))
160
+
161
+ # ドメイン境界推定 (低 PAE ブロック検出)
162
+ n_res = pae_matrix.shape[0]
163
+ mean_pae = pae_matrix.mean()
164
+ low_pae_mask = pae_matrix < mean_pae * 0.5
165
+
166
+ # 行ごとの低 PAE 連続領域
167
+ domain_scores = []
168
+ for i in range(n_res):
169
+ row = low_pae_mask[i]
170
+ domain_scores.append(row.sum() / n_res)
171
+
172
+ result = {
173
+ "uniprot_id": uniprot_id,
174
+ "pae_matrix_shape": pae_matrix.shape,
175
+ "mean_pae": float(mean_pae),
176
+ "median_pae": float(np.median(pae_matrix)),
177
+ "min_pae": float(pae_matrix.min()),
178
+ "max_pae": float(pae_matrix.max()),
179
+ "domain_scores": domain_scores,
180
+ }
181
+
182
+ print(f"PAE {uniprot_id}: {n_res}x{n_res} matrix, "
183
+ f"mean={mean_pae:.1f} Å")
184
+ return result, pae_matrix
185
+ ```
186
+
187
+ ## 4. AlphaFold 統合パイプライン
188
+
189
+ ```python
190
+ def alphafold_pipeline(uniprot_ids, output_dir="results"):
191
+ """
192
+ AlphaFold 構造解析統合パイプライン。
193
+
194
+ Parameters:
195
+ uniprot_ids: list[str] — UniProt IDs
196
+ output_dir: str — 出力ディレクトリ
197
+ """
198
+ from pathlib import Path
199
+ output_dir = Path(output_dir)
200
+ output_dir.mkdir(parents=True, exist_ok=True)
201
+
202
+ all_predictions = []
203
+ all_plddt = []
204
+
205
+ for uid in uniprot_ids:
206
+ # 1) 予測取得
207
+ pred = alphafold_get_prediction(uid)
208
+ if pred:
209
+ all_predictions.append(pred)
210
+
211
+ # 2) pLDDT プロファイル
212
+ plddt = alphafold_plddt_profile(uid, output_dir=output_dir)
213
+ if not plddt.empty:
214
+ plddt["uniprot_id"] = uid
215
+ all_plddt.append(plddt)
216
+
217
+ # サマリ
218
+ pred_df = pd.DataFrame(all_predictions)
219
+ pred_df.to_csv(output_dir / "predictions.csv", index=False)
220
+
221
+ if all_plddt:
222
+ plddt_df = pd.concat(all_plddt, ignore_index=True)
223
+ plddt_df.to_csv(output_dir / "plddt_profiles.csv", index=False)
224
+
225
+ print(f"AlphaFold pipeline: {len(all_predictions)} structures")
226
+ return {"predictions": pred_df}
227
+ ```
228
+
229
+ ---
230
+
231
+ ## ToolUniverse 連携
232
+
233
+ | TU Key | ツール名 | 連携内容 |
234
+ |--------|---------|---------|
235
+ | `alphafold` | AlphaFold Database | 予測構造・pLDDT・PAE 取得 |
236
+
237
+ ## パイプライン統合
238
+
239
+ ```
240
+ protein-structure-analysis → alphafold-structures → protein-design
241
+ (PDB 実験構造) (AlphaFold 予測) (de novo 設計)
242
+ │ │ ↓
243
+ structural-proteomics ─────────┘ molecular-docking
244
+ (EMDB/PDBe) │ (結合予測)
245
+
246
+ variant-effect-prediction
247
+ (構造ベース変異評価)
248
+ ```
249
+
250
+ ## パイプライン出力
251
+
252
+ | ファイル | 説明 | 次スキル |
253
+ |---------|------|---------|
254
+ | `results/predictions.csv` | 予測メタデータ | → protein-structure-analysis |
255
+ | `results/plddt_profiles.csv` | 残基別 pLDDT | → protein-design |
256
+ | `results/AF-*.cif` | 予測構造ファイル | → molecular-docking |