@nahisaho/satori 0.16.0 → 0.18.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/README.md CHANGED
@@ -7,7 +7,7 @@
7
7
 
8
8
  ## Overview
9
9
 
10
- このディレクトリには、Exp-01〜13 で蓄積した科学データ解析技法を Agent Skills として体系化した **124 個**のスキルを格納しています。Copilot がプロンプトの文脈に応じて適切なスキルを自動ロードし、各実験で確立した解析パターンを再利用します。74 のスキルは [ToolUniverse](https://github.com/mims-harvard/ToolUniverse) SMCP 経由で 1,200 以上の外部科学データベースツールとも連携可能です。
10
+ このディレクトリには、Exp-01〜13 で蓄積した科学データ解析技法を Agent Skills として体系化した **140 個**のスキルを格納しています。Copilot がプロンプトの文脈に応じて適切なスキルを自動ロードし、各実験で確立した解析パターンを再利用します。85 のスキルは [ToolUniverse](https://github.com/mims-harvard/ToolUniverse) SMCP 経由で 1,200 以上の外部科学データベースツールとも連携可能です。
11
11
 
12
12
  ### パイプラインフロー
13
13
 
@@ -208,7 +208,7 @@ symbolic-mathematics ──→ systems-biology ──→ admet-pharmacokinetics
208
208
 
209
209
  ### ToolUniverse MCP ツール連携
210
210
 
211
- 74 のスキル(HIGH 13 + MEDIUM 9 + Phase 3: 20 + Phase 4: 8 + Phase 5: 9 + Phase 6: 7 + Phase 7: 4 + Phase 8: 4)は、[ToolUniverse](https://github.com/mims-harvard/ToolUniverse) SMCP サーバー経由で 1,200 以上の外部科学ツールを利用可能です。各 SKILL.md 内の `### 利用可能ツール` セクションに対応ツールが記載されています。
211
+ 85 のスキル(HIGH 13 + MEDIUM 9 + Phase 3: 20 + Phase 4: 8 + Phase 5: 9 + Phase 6: 7 + Phase 7: 4 + Phase 8: 4 + Phase 9: 5 + Phase 10: 6)は、[ToolUniverse](https://github.com/mims-harvard/ToolUniverse) SMCP サーバー経由で 1,200 以上の外部科学ツールを利用可能です。各 SKILL.md 内の `### 利用可能ツール` セクションに対応ツールが記載されています。
212
212
 
213
213
  ```
214
214
  SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・計算)
@@ -249,7 +249,17 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
249
249
  │ expression-comparison│───MCP──│ Expression Atlas │
250
250
  │ rrna-taxonomy │───MCP──│ MGnify metagenomics │
251
251
  │ marine-ecology │───MCP──│ OBIS, WoRMS, GBIF │
252
- ... (74 skills total) │ │ ... (1,200+ tools)
252
+ encode-screen │───MCP──│ ENCODE, SCREEN, ChIP-Atlas
253
+ │ human-cell-atlas │───MCP──│ HCA Data Portal, CELLxGENE │
254
+ │ geo-expression │───MCP──│ GEO (NCBI E-utilities) │
255
+ │ paleobiology │───MCP──│ Paleobiology Database (PBDB) │
256
+ │ gwas-catalog │───MCP──│ GWAS Catalog (EBI) │
257
+ │ alphafold-structures │───MCP──│ AlphaFold DB API │
258
+ │ arrayexpress-expression│───MCP──│ ArrayExpress, BioStudies │
259
+ │ semantic-scholar │───MCP──│ Semantic Scholar Graph API │
260
+ │ pharmgkb-pgx │───MCP──│ PharmGKB, CPIC Guidelines │
261
+ │ crossref-metadata │───MCP──│ CrossRef DOI/Metadata │
262
+ │ ... (85 skills total) │ │ ... (1,200+ tools) │
253
263
  └──────────────────────┘ └─────────────────────────────┘
254
264
  ```
255
265
 
@@ -257,38 +267,38 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
257
267
 
258
268
  | 中区分 | スキル数 | 概要 |
259
269
  |---|:---:|---|
260
- | A. 基盤・ワークフロー | 16 | パイプライン構築・前処理・データ生成・図表・執筆・仮説立案・批判的レビュー・SI 生成・LaTeX 変換・引用検証・査読対応・改訂追跡・論文品質・系統的レビュー・BioThings ID マッピング・データ投稿 |
270
+ | A. 基盤・ワークフロー | 17 | パイプライン構築・前処理・データ生成・図表・執筆・仮説立案・批判的レビュー・SI 生成・LaTeX 変換・引用検証・査読対応・改訂追跡・論文品質・系統的レビュー・BioThings ID マッピング・データ投稿・CrossRef メタデータ |
261
271
  | B. 統計・探索的解析 | 4 | EDA・仮説検定・次元削減・記号数学 |
262
272
  | C. 機械学習・モデリング | 3 | 回帰・分類・特徴量重要度 |
263
273
  | D. 実験計画・プロセス最適化 | 2 | DOE・応答曲面法・ベイズ最適化 |
264
274
  | E. 信号・スペクトル・時系列 | 4 | スペクトル解析・生体信号・時系列分解・神経電気生理学 |
265
- | F. 生命科学・オミクス | 18 | バイオインフォ・メタボロ・ゲノム配列・マルチオミクス・ネットワーク・プロテオミクス・トランスクリプトミクス・パスウェイ濃縮・代謝物 DB・HPA・ゲノム配列ツール・非コード RNA・オントロジー・EBI DB 群・Ensembl ゲノミクス・STRING/BioGRID PPI・発現比較・モデル生物 DB |
275
+ | F. 生命科学・オミクス | 22 | バイオインフォ・メタボロ・ゲノム配列・マルチオミクス・ネットワーク・プロテオミクス・トランスクリプトミクス・パスウェイ濃縮・代謝物 DB・HPA・ゲノム配列ツール・非コード RNA・オントロジー・EBI DB 群・Ensembl ゲノミクス・STRING/BioGRID PPI・発現比較・モデル生物 DB・GEO 発現プロファイル・寄生虫ゲノミクス・ArrayExpress 発現アーカイブ・GTEx 組織発現 |
266
276
  | G. 化学・材料・イメージング | 8 | ケモインフォ・材料特性評価・画像形態解析・計算材料科学・ChEMBL アッセイマイニング・MD シミュレーション・高度イメージング・深層化学 |
267
277
  | H. 臨床・疫学・メタ科学 | 5 | 生存解析・因果推論・メタアナリシス・臨床試験解析・臨床レポート |
268
- | I. Deep Research・文献検索 | 3 | 科学文献深層リサーチ・エビデンス階層評価・マルチ DB 文献検索・引用ネットワーク・プレプリント横断検索 |
278
+ | I. Deep Research・文献検索 | 4 | 科学文献深層リサーチ・エビデンス階層評価・マルチ DB 文献検索・引用ネットワーク・プレプリント横断検索・Semantic Scholar 学術グラフ |
269
279
  | J. 創薬・ファーマコロジー | 7 | 標的プロファイリング・ADMET/PK・ドラッグリポジショニング・分子ドッキング・薬理学的ターゲット・化合物スクリーニング・NCI-60 スクリーニング |
270
- | K. 構造生物学・タンパク質工学 | 5 | PDB/AlphaFold 構造解析・de novo タンパク質設計・PPI ネットワーク・ドメイン/ファミリー・構造プロテオミクス |
280
+ | K. 構造生物学・タンパク質工学 | 6 | PDB/AlphaFold 構造解析・de novo タンパク質設計・PPI ネットワーク・ドメイン/ファミリー・構造プロテオミクス・AlphaFold DB 構造予測 |
271
281
  | L. 精密医療・臨床意思決定 | 3 | 変異解釈 (ACMG/AMP)・エビデンスベース臨床意思決定・バリアント効果予測 |
272
282
  | M. 実験室自動化・データ管理 | 2 | 液体ハンドリング・プロトコル管理・ELN/LIMS 連携・ラボデータ管理 |
273
283
  | N. 科学プレゼンテーション・図式 | 2 | 科学スライド・ポスター・ワークフロー図・科学図式 |
274
284
  | O. 研究計画・グラント・規制 | 3 | 助成金申請書・研究方法論・倫理審査・規制科学 |
275
- | P. ファーマコビジランス・薬理ゲノミクス | 2 | FAERS 不均衡分析・MedDRA 階層・安全性シグナル検出・PGx 代謝型 |
276
- | Q. 腫瘍学・疾患研究 | 5 | 精密腫瘍学 (CIViC/OncoKB)・疾患-遺伝子関連 (GWAS/Orphanet)・がんゲノミクス (COSMIC/DepMap)・希少疾患遺伝学・細胞株リソース |
285
+ | P. ファーマコビジランス・薬理ゲノミクス | 3 | FAERS 不均衡分析・MedDRA 階層・安全性シグナル検出・PGx 代謝型・PharmGKB 臨床アノテーション |
286
+ | Q. 腫瘍学・疾患研究 | 6 | 精密腫瘍学 (CIViC/OncoKB)・疾患-遺伝子関連 (GWAS/Orphanet)・がんゲノミクス (COSMIC/DepMap)・希少疾患遺伝学・細胞株リソース・ICGC がんゲノムデータ |
277
287
  | R. 量子・先端計算 | 7 | 量子計算・GNN・ベイズ統計・説明可能 AI・深層学習・ヘルスケア AI・強化学習 |
278
288
  | S. 医用イメージング | 1 | DICOM/NIfTI・WSI 病理画像・Radiomics・MONAI |
279
- | T. シングルセル・空間・エピゲノミクス | 8 | scRNA-seq・Visium・MERFISH・CELLxGENE・RNA velocity・エピゲノミクス・レギュラトリーゲノミクス・摂動解析・scVI 統合・scATAC-seq/Signac・GPU シングルセル |
289
+ | T. シングルセル・空間・エピゲノミクス | 11 | scRNA-seq・Visium・MERFISH・CELLxGENE・RNA velocity・エピゲノミクス・レギュラトリーゲノミクス・摂動解析・scVI 統合・scATAC-seq/Signac・GPU シングルセル・ENCODE/SCREEN・Human Cell Atlas・高度 Squidpy 空間解析 |
280
290
  | U. 免疫・感染症 | 2 | 免疫情報学・MHC 結合予測・病原体ゲノミクス・AMR・IEDB |
281
- | V. マイクロバイオーム・環境 | 6 | 16S/メタゲノム・α/β 多様性・SDM・OBIS・GBIF・系統解析・rRNA 分類学・植物バイオロジー・海洋生態学 |
282
- | W. システム生物学 | 2 | SBML シミュレーション・FBA・GRN 推定・BioModels・代謝モデリング |
291
+ | V. マイクロバイオーム・環境 | 8 | 16S/メタゲノム・α/β 多様性・SDM・OBIS・GBIF・系統解析・rRNA 分類学・植物バイオロジー・海洋生態学・環境地理空間データ・古生物学 |
292
+ | W. システム生物学 | 3 | SBML シミュレーション・FBA・GRN 推定・BioModels・代謝モデリング・Metabolic Atlas |
283
293
  | X. 疫学・公衆衛生 | 3 | リスク指標 (RR/OR)・年齢標準化・空間疫学・WHO・CDC・公衆衛生データ・環境毒性学 |
284
- | Y. 集団遺伝学 | 1 | HWE・PCA/ADMIXTURE・Fst・選択スキャン・gnomAD・GWAS |
294
+ | Y. 集団遺伝学 | 2 | HWE・PCA/ADMIXTURE・Fst・選択スキャン・gnomAD・GWAS・GWAS Catalog |
285
295
  | Z. 科学テキストマイニング | 2 | NER・関係抽出・知識グラフ・BERTopic・PubTator バイオアノテーション |
286
296
 
287
297
  ---
288
298
 
289
299
  ## Skills 一覧
290
300
 
291
- ### A. 基盤・ワークフロー(16 種)
301
+ ### A. 基盤・ワークフロー(17 種)
292
302
 
293
303
  全 Exp に共通する横断的な基盤スキル。
294
304
 
@@ -310,6 +320,7 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
310
320
  | 84 | [scientific-systematic-review](scientific-systematic-review/SKILL.md) | PRISMA 2020 系統的レビュー・マルチ DB 検索戦略・スクリーニング・バイアスリスク評価 | 汎用 |
311
321
  | 91 | [scientific-biothings-idmapping](scientific-biothings-idmapping/SKILL.md) | BioThings API (MyGene/MyVariant/MyChem) 横断的 ID マッピング・アノテーション | 汎用 |
312
322
  | 119 | [scientific-data-submission](scientific-data-submission/SKILL.md) | GenBank/SRA/GEO/BioProject/BioSample データ投稿・FAIR 原則準拠 | 汎用 |
323
+ | 139 | [scientific-crossref-metadata](scientific-crossref-metadata/SKILL.md) | CrossRef REST API DOI 解決・論文メタデータ・引用数・ジャーナル情報 | 汎用 |
313
324
 
314
325
  ### B. 統計・探索的解析(4 種)
315
326
 
@@ -352,9 +363,9 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
352
363
  | 24 | [scientific-time-series](scientific-time-series/SKILL.md) | STL 分解・SARIMA 予測・変化点検出・FFT 周期解析・Granger 因果 | 汎用 |
353
364
  | 67 | [scientific-neuroscience-electrophysiology](scientific-neuroscience-electrophysiology/SKILL.md) | SpikeInterface/Kilosort4 スパイクソート・MNE EEG/ERP・NeuroKit2 HRV/EDA・脳機能結合 | 汎用 |
354
365
 
355
- ### F. 生命科学・オミクス(18 種)
366
+ ### F. 生命科学・オミクス(22 種)
356
367
 
357
- バイオ・オミクス・ネットワーク解析・オントロジー・EBI データベース・ゲノミクス・PPI・発現比較・モデル生物 DB を担うスキル群。
368
+ バイオ・オミクス・ネットワーク解析・オントロジー・EBI データベース・ゲノミクス・PPI・発現比較・モデル生物 DB・GEO 発現プロファイル・寄生虫ゲノミクス・ArrayExpress 発現アーカイブ・GTEx 組織発現を担うスキル群。
358
369
 
359
370
  | # | Skill | 説明 | 参照 Exp |
360
371
  |---|---|---|---|
@@ -376,6 +387,10 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
376
387
  | 109 | [scientific-string-network-api](scientific-string-network-api/SKILL.md) | STRING v12/BioGRID/STITCH PPI ネットワーク・化学-タンパク質相互作用・トポロジー解析 | 汎用 |
377
388
  | 110 | [scientific-expression-comparison](scientific-expression-comparison/SKILL.md) | EBI Expression Atlas 発現比較・ベースライン/差次的発現・組織横断ヒートマップ | 汎用 |
378
389
  | 111 | [scientific-model-organism-db](scientific-model-organism-db/SKILL.md) | FlyBase/WormBase/ZFIN/RGD/MGI モデル生物データベース・種間オーソログ検索 | 汎用 |
390
+ | 127 | [scientific-geo-expression](scientific-geo-expression/SKILL.md) | GEO REST API 発現プロファイル・マトリクス取得・差次的発現解析 | 汎用 |
391
+ | 132 | [scientific-parasite-genomics](scientific-parasite-genomics/SKILL.md) | PlasmoDB/VectorBase/ToxoDB 寄生虫ゲノミクス・薬剤標的同定 | 汎用 |
392
+ | 135 | [scientific-arrayexpress-expression](scientific-arrayexpress-expression/SKILL.md) | ArrayExpress/BioStudies REST API 発現実験検索・SDRF メタデータ・データ再解析 | 汎用 |
393
+ | 137 | [scientific-gtex-tissue-expression](scientific-gtex-tissue-expression/SKILL.md) | GTEx Portal REST API v2 組織特異的発現・eQTL・多組織比較 | 汎用 |
379
394
 
380
395
  ### G. 化学・材料・イメージング(8 種)
381
396
 
@@ -404,15 +419,16 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
404
419
  | 71 | [scientific-clinical-trials-analytics](scientific-clinical-trials-analytics/SKILL.md) | ClinicalTrials.gov API v2 検索・競合ランドスケープ・AE/アウトカム抽出 | 汎用 |
405
420
  | 85 | [scientific-clinical-reporting](scientific-clinical-reporting/SKILL.md) | SOAP ノート・バイオマーカーレポート・ファーマコゲノミクス・FHIR JSON | 汎用 |
406
421
 
407
- ### I. Deep Research・文献検索(3 種)
422
+ ### I. Deep Research・文献検索(4 種)
408
423
 
409
- 科学文献の反復的深層リサーチとマルチ DB 文献検索・プレプリント横断検索を担うスキル群。
424
+ 科学文献の反復的深層リサーチとマルチ DB 文献検索・プレプリント横断検索・Semantic Scholar 学術グラフを担うスキル群。
410
425
 
411
426
  | # | Skill | 説明 | 参照 Exp |
412
427
  |---|---|---|---|
413
428
  | 36 | [scientific-deep-research](scientific-deep-research/SKILL.md) | SHIKIGAMI 準拠 Think→Search→Evaluate→Synthesize 反復サイクル・学術 DB 検索・エビデンス階層評価・ソース追跡・交差検証・ハルシネーション防止 | 汎用 |
414
429
  | 78 | [scientific-literature-search](scientific-literature-search/SKILL.md) | PubMed/Semantic Scholar/OpenAlex/EuropePMC/CrossRef マルチ DB 検索・引用ネットワーク | 汎用 |
415
430
  | 97 | [scientific-preprint-archive](scientific-preprint-archive/SKILL.md) | bioRxiv/medRxiv/arXiv/PMC/CORE/Zenodo/OpenAIRE/Unpaywall プレプリント・OA 横断検索 | 汎用 |
431
+ | 136 | [scientific-semantic-scholar](scientific-semantic-scholar/SKILL.md) | Semantic Scholar Academic Graph API 論文検索・引用グラフ・著者プロファイル・TLDR | 汎用 |
416
432
 
417
433
  ### J. 創薬・ファーマコロジー(7 種)
418
434
 
@@ -428,9 +444,9 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
428
444
  | 94 | [scientific-compound-screening](scientific-compound-screening/SKILL.md) | ZINC 化合物ライブラリ検索・バーチャルスクリーニング前処理 | 汎用 |
429
445
  | 120 | [scientific-nci60-screening](scientific-nci60-screening/SKILL.md) | NCI-60/CellMiner/DepMap がん細胞株薬剤応答スクリーニング | 汎用 |
430
446
 
431
- ### K. 構造生物学・タンパク質工学(5 種)
447
+ ### K. 構造生物学・タンパク質工学(6 種)
432
448
 
433
- タンパク質構造解析・設計・PPI ネットワーク・ドメイン解析・構造プロテオミクスを担うスキル群。
449
+ タンパク質構造解析・設計・PPI ネットワーク・ドメイン解析・構造プロテオミクス・AlphaFold DB 構造予測を担うスキル群。
434
450
 
435
451
  | # | Skill | 説明 | 参照 Exp |
436
452
  |---|---|---|---|
@@ -439,6 +455,7 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
439
455
  | 79 | [scientific-protein-interaction-network](scientific-protein-interaction-network/SKILL.md) | STRING/IntAct/STITCH PPI ネットワーク・トポロジー解析・コミュニティ検出 | 汎用 |
440
456
  | 86 | [scientific-protein-domain-family](scientific-protein-domain-family/SKILL.md) | InterPro/InterProScan ドメイン予測・ファミリー分類・アーキテクチャ可視化 | 汎用 |
441
457
  | 93 | [scientific-structural-proteomics](scientific-structural-proteomics/SKILL.md) | EMDB/PDBe/Proteins API/Complex Portal/DeepGO/EVE 構造プロテオミクス | 汎用 |
458
+ | 134 | [scientific-alphafold-structures](scientific-alphafold-structures/SKILL.md) | AlphaFold DB REST API 構造予測取得・pLDDT 信頼度・PAE 解析 | 汎用 |
442
459
 
443
460
  ### L. 精密医療・臨床意思決定(3 種)
444
461
 
@@ -476,18 +493,19 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
476
493
  | 47 | [scientific-research-methodology](scientific-research-methodology/SKILL.md) | SCAMPER/TRIZ ブレインストーミング・研究デザインマトリクス・FINER 基準・IRB 倫理チェック | 汎用 |
477
494
  | 74 | [scientific-regulatory-science](scientific-regulatory-science/SKILL.md) | FDA Orange Book/医療機器 510(k)/ISO 13485 QMS/CAPA/USPTO 特許検索 | 汎用 |
478
495
 
479
- ### P. ファーマコビジランス・薬理ゲノミクス(2 種)
496
+ ### P. ファーマコビジランス・薬理ゲノミクス(3 種)
480
497
 
481
- 市販後医薬品安全性監視と薬理ゲノミクスのためのシグナル検出・定量評価を担うスキル群。
498
+ 市販後医薬品安全性監視と薬理ゲノミクス・PharmGKB 臨床アノテーションのためのシグナル検出・定量評価を担うスキル群。
482
499
 
483
500
  | # | Skill | 説明 | 参照 Exp |
484
501
  |---|---|---|---|
485
502
  | 48 | [scientific-pharmacovigilance](scientific-pharmacovigilance/SKILL.md) | FAERS 不均衡分析 (PRR/ROR/IC/EBGM)・MedDRA 階層・時系列トレンド・Naranjo 因果評価 | 汎用 |
486
503
  | 75 | [scientific-pharmacogenomics](scientific-pharmacogenomics/SKILL.md) | PharmGKB/CPIC ガイドライン・Star アレル・代謝型・FDA PGx バイオマーカー | 汎用 |
504
+ | 138 | [scientific-pharmgkb-pgx](scientific-pharmgkb-pgx/SKILL.md) | PharmGKB REST API 臨床アノテーション・薬物遺伝子関連・投与量ガイドライン | 汎用 |
487
505
 
488
- ### Q. 腫瘍学・疾患研究(5 種)
506
+ ### Q. 腫瘍学・疾患研究(6 種)
489
507
 
490
- 精密腫瘍学・疾患-遺伝子関連研究・がんゲノミクス・希少疾患遺伝学・細胞株リソースを担うスキル群。
508
+ 精密腫瘍学・疾患-遺伝子関連研究・がんゲノミクス・希少疾患遺伝学・細胞株リソース・ICGC がんゲノムデータを担うスキル群。
491
509
 
492
510
  | # | Skill | 説明 | 参照 Exp |
493
511
  |---|---|---|---|
@@ -496,6 +514,7 @@ SATORI Skill (方法論・判断) ToolUniverse SMCP (データ取得・
496
514
  | 81 | [scientific-cancer-genomics](scientific-cancer-genomics/SKILL.md) | COSMIC/cBioPortal/DepMap がんゲノミクス・変異シグネチャー解析 | 汎用 |
497
515
  | 87 | [scientific-rare-disease-genetics](scientific-rare-disease-genetics/SKILL.md) | OMIM/Orphanet/DisGeNET/IMPC 希少疾患遺伝学・統合解析 | 汎用 |
498
516
  | 101 | [scientific-cell-line-resources](scientific-cell-line-resources/SKILL.md) | Cellosaurus 細胞株検索・STR プロファイル検証・コンタミネーション検出 | 汎用 |
517
+ | 140 | [scientific-icgc-cancer-data](scientific-icgc-cancer-data/SKILL.md) | ICGC DCC API 国際がんゲノムデータ・体細胞変異・がん種統計 | 汎用 |
499
518
 
500
519
  ### R. 量子・先端計算(7 種)
501
520
 
@@ -519,9 +538,9 @@ DICOM・WSI 等の医用画像の解析・セグメンテーションを担う
519
538
  |---|---|---|---|
520
539
  | 56 | [scientific-medical-imaging](scientific-medical-imaging/SKILL.md) | DICOM/NIfTI 処理・MONAI U-Net/SwinUNETR・WSI パッチ抽出・Radiomics・3D 可視化 | 汎用 |
521
540
 
522
- ### T. シングルセル・空間・エピゲノミクス(8 種)
541
+ ### T. シングルセル・空間・エピゲノミクス(11 種)
523
542
 
524
- scRNA-seq・空間トランスクリプトミクス・エピゲノミクス・制御ゲノミクス・摂動解析・scVI 統合・scATAC-seq・GPU シングルセルの解析パイプラインを担うスキル群。
543
+ scRNA-seq・空間トランスクリプトミクス・エピゲノミクス・制御ゲノミクス・摂動解析・scVI 統合・scATAC-seq・GPU シングルセル・ENCODE/SCREEN・Human Cell Atlas・高度 Squidpy 空間解析の解析パイプラインを担うスキル群。
525
544
 
526
545
  | # | Skill | 説明 | 参照 Exp |
527
546
  |---|---|---|---|
@@ -533,6 +552,9 @@ scRNA-seq・空間トランスクリプトミクス・エピゲノミクス・
533
552
  | 116 | [scientific-scvi-integration](scientific-scvi-integration/SKILL.md) | scVI/scANVI/totalVI/SOLO シングルセル統合・半教師有りアノテーション・CITE-seq | 汎用 |
534
553
  | 123 | [scientific-scatac-signac](scientific-scatac-signac/SKILL.md) | Signac/SnapATAC2 scATAC-seq・モチーフ解析・Gene Activity・RNA+ATAC マルチモーダル統合 | 汎用 |
535
554
  | 124 | [scientific-gpu-singlecell](scientific-gpu-singlecell/SKILL.md) | rapids-singlecell/cuML/cuGraph GPU アクセラレーションシングルセル解析 | 汎用 |
555
+ | 125 | [scientific-encode-screen](scientific-encode-screen/SKILL.md) | ENCODE REST API 実験/ファイル検索・SCREEN cCRE・ChIP-Atlas エンリッチメント | 汎用 |
556
+ | 126 | [scientific-human-cell-atlas](scientific-human-cell-atlas/SKILL.md) | HCA Data Portal プロジェクト/ファイル・CELLxGENE Census 大規模アトラス | 汎用 |
557
+ | 131 | [scientific-squidpy-advanced](scientific-squidpy-advanced/SKILL.md) | Squidpy 空間自己相関・共起解析・近傍エンリッチメント・ニッチ同定 | 汎用 |
536
558
 
537
559
  ### U. 免疫・感染症(2 種)
538
560
 
@@ -543,9 +565,9 @@ scRNA-seq・空間トランスクリプトミクス・エピゲノミクス・
543
565
  | 59 | [scientific-immunoinformatics](scientific-immunoinformatics/SKILL.md) | MHC-I/II 結合予測・B 細胞エピトープ・TCR/BCR レパトア多様性・抗体 CDR 解析・ワクチン候補ランキング | 汎用 |
544
566
  | 60 | [scientific-infectious-disease](scientific-infectious-disease/SKILL.md) | 病原体 WGS QC・AMR 遺伝子検出・MLST 型別・系統解析 (IQ-TREE)・SIR/SEIR 数理モデル | 汎用 |
545
567
 
546
- ### V. マイクロバイオーム・環境(6 種)
568
+ ### V. マイクロバイオーム・環境(8 種)
547
569
 
548
- マイクロバイオーム解析・環境/生態系モデリング・系統解析・rRNA 分類学・植物バイオロジー・海洋生態学を担うスキル群。
570
+ マイクロバイオーム解析・環境/生態系モデリング・系統解析・rRNA 分類学・植物バイオロジー・海洋生態学・環境地理空間データ・古生物学を担うスキル群。
549
571
 
550
572
  | # | Skill | 説明 | 参照 Exp |
551
573
  |---|---|---|---|
@@ -555,8 +577,10 @@ scRNA-seq・空間トランスクリプトミクス・エピゲノミクス・
555
577
  | 118 | [scientific-rrna-taxonomy](scientific-rrna-taxonomy/SKILL.md) | SILVA/Greengenes2/MGnify rRNA リファレンス・分類学・コンセンサス分類 | 汎用 |
556
578
  | 121 | [scientific-plant-biology](scientific-plant-biology/SKILL.md) | Plant Reactome/TAIR/Ensembl Plants 植物代謝パスウェイ・種間比較 | 汎用 |
557
579
  | 122 | [scientific-marine-ecology](scientific-marine-ecology/SKILL.md) | OBIS/WoRMS/GBIF/FishBase 海洋生物多様性・分布解析 | 汎用 |
580
+ | 128 | [scientific-environmental-geodata](scientific-environmental-geodata/SKILL.md) | SoilGrids/WorldClim 環境地理空間データ・種分布モデル環境変数 | 汎用 |
581
+ | 129 | [scientific-paleobiology](scientific-paleobiology/SKILL.md) | PBDB 化石産出記録・分類群検索・地質年代多様性曲線 | 汎用 |
558
582
 
559
- ### W. システム生物学(2 種)
583
+ ### W. システム生物学(3 種)
560
584
 
561
585
  SBML 動的シミュレーション・代謝フラックス・遺伝子制御ネットワーク推定・代謝モデリングを担うスキル群。
562
586
 
@@ -564,6 +588,7 @@ SBML 動的シミュレーション・代謝フラックス・遺伝子制御ネ
564
588
  |---|---|---|---|
565
589
  | 63 | [scientific-systems-biology](scientific-systems-biology/SKILL.md) | SBML/RoadRunner シミュレーション・FBA/pFBA (cobrapy)・GRN 推定 (GENIE3)・Sobol 感度解析 | 汎用 |
566
590
  | 95 | [scientific-metabolic-modeling](scientific-metabolic-modeling/SKILL.md) | BiGG Models/BioModels ゲノムスケール代謝モデル・反応・代謝物検索 | 汎用 |
591
+ | 130 | [scientific-metabolic-atlas](scientific-metabolic-atlas/SKILL.md) | Metabolic Atlas/Human-GEM 代謝反応・代謝産物検索・ネットワーク解析 | 汎用 |
567
592
 
568
593
  ### X. 疫学・公衆衛生(3 種)
569
594
 
@@ -575,13 +600,14 @@ SBML 動的シミュレーション・代謝フラックス・遺伝子制御ネ
575
600
  | 98 | [scientific-public-health-data](scientific-public-health-data/SKILL.md) | NHANES/MedlinePlus/RxNorm/ODPHP 公衆衛生データアクセス・健康格差API | 汎用 |
576
601
  | 117 | [scientific-toxicology-env](scientific-toxicology-env/SKILL.md) | CTD/Tox21/ToxCast/T3DB/EPA IRIS 環境毒性学・化学物質健康影響解析 | 汎用 |
577
602
 
578
- ### Y. 集団遺伝学(1 種)
603
+ ### Y. 集団遺伝学(2 種)
579
604
 
580
- 集団構造推定・分化指標・自然選択検出を担うスキル。
605
+ 集団構造推定・分化指標・自然選択検出・GWAS Catalog を担うスキル群。
581
606
 
582
607
  | # | Skill | 説明 | 参照 Exp |
583
608
  |---|---|---|---|
584
609
  | 65 | [scientific-population-genetics](scientific-population-genetics/SKILL.md) | PLINK2 QC・HWE 検定・PCA/ADMIXTURE・Weir-Cockerham Fst・iHS/Tajima's D 選択スキャン | 汎用 |
610
+ | 133 | [scientific-gwas-catalog](scientific-gwas-catalog/SKILL.md) | NHGRI-EBI GWAS Catalog REST API 関連解析・研究検索・PheWAS | 汎用 |
585
611
 
586
612
  ### Z. 科学テキストマイニング(2 種)
587
613
 
@@ -653,7 +679,8 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
653
679
  │ ├── scientific-paper-quality/
654
680
  │ ├── scientific-systematic-review/
655
681
  │ ├── scientific-biothings-idmapping/
656
- └── scientific-data-submission/
682
+ ├── scientific-data-submission/
683
+ │ └── scientific-crossref-metadata/
657
684
 
658
685
  │── [B] 統計・探索的解析
659
686
  │ ├── scientific-eda-correlation/
@@ -694,7 +721,11 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
694
721
  │ ├── scientific-ensembl-genomics/
695
722
  │ ├── scientific-string-network-api/
696
723
  │ ├── scientific-expression-comparison/
697
- └── scientific-model-organism-db/
724
+ ├── scientific-model-organism-db/
725
+ │ ├── scientific-geo-expression/
726
+ │ ├── scientific-parasite-genomics/
727
+ │ ├── scientific-arrayexpress-expression/
728
+ │ └── scientific-gtex-tissue-expression/
698
729
 
699
730
  │── [G] 化学・材料・イメージング
700
731
  │ ├── scientific-cheminformatics/
@@ -716,7 +747,8 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
716
747
  ├── [I] Deep Research・文献検索
717
748
  │ ├── scientific-deep-research/
718
749
  │ ├── scientific-literature-search/
719
- └── scientific-preprint-archive/
750
+ ├── scientific-preprint-archive/
751
+ │ └── scientific-semantic-scholar/
720
752
 
721
753
  ├── [J] 創薬・ファーマコロジー
722
754
  │ ├── scientific-drug-target-profiling/
@@ -732,7 +764,8 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
732
764
  │ ├── scientific-protein-design/
733
765
  │ ├── scientific-protein-interaction-network/
734
766
  │ ├── scientific-protein-domain-family/
735
- └── scientific-structural-proteomics/
767
+ ├── scientific-structural-proteomics/
768
+ │ └── scientific-alphafold-structures/
736
769
 
737
770
  ├── [L] 精密医療・臨床意思決定
738
771
  │ ├── scientific-variant-interpretation/
@@ -754,14 +787,16 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
754
787
 
755
788
  ├── [P] ファーマコビジランス・薬理ゲノミクス
756
789
  │ ├── scientific-pharmacovigilance/
757
- └── scientific-pharmacogenomics/
790
+ ├── scientific-pharmacogenomics/
791
+ │ └── scientific-pharmgkb-pgx/
758
792
 
759
793
  ├── [Q] 腫瘍学・疾患研究
760
794
  │ ├── scientific-precision-oncology/
761
795
  │ ├── scientific-disease-research/
762
796
  │ ├── scientific-cancer-genomics/
763
797
  │ ├── scientific-rare-disease-genetics/
764
- └── scientific-cell-line-resources/
798
+ ├── scientific-cell-line-resources/
799
+ │ └── scientific-icgc-cancer-data/
765
800
 
766
801
  ├── [R] 量子・先端計算
767
802
  │ ├── scientific-quantum-computing/
@@ -783,7 +818,10 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
783
818
  │ ├── scientific-perturbation-analysis/
784
819
  │ ├── scientific-scvi-integration/
785
820
  │ ├── scientific-scatac-signac/
786
- └── scientific-gpu-singlecell/
821
+ ├── scientific-gpu-singlecell/
822
+ │ ├── scientific-encode-screen/
823
+ │ ├── scientific-human-cell-atlas/
824
+ │ └── scientific-squidpy-advanced/
787
825
 
788
826
  │── [U] 免疫・感染症
789
827
  │ ├── scientific-immunoinformatics/
@@ -795,11 +833,14 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
795
833
  │ ├── scientific-phylogenetics/
796
834
  │ ├── scientific-rrna-taxonomy/
797
835
  │ ├── scientific-plant-biology/
798
- └── scientific-marine-ecology/
836
+ ├── scientific-marine-ecology/
837
+ │ ├── scientific-environmental-geodata/
838
+ │ └── scientific-paleobiology/
799
839
 
800
840
  │── [W] システム生物学
801
841
  │ ├── scientific-systems-biology/
802
- └── scientific-metabolic-modeling/
842
+ ├── scientific-metabolic-modeling/
843
+ │ └── scientific-metabolic-atlas/
803
844
 
804
845
  │── [X] 疫学・公衆衛生
805
846
  │ ├── scientific-epidemiology-public-health/
@@ -807,7 +848,8 @@ Skills は `.github/skills/` に配置されているため、Copilot が自動
807
848
  │ └── scientific-toxicology-env/
808
849
 
809
850
  │── [Y] 集団遺伝学
810
- └── scientific-population-genetics/
851
+ ├── scientific-population-genetics/
852
+ │ └── scientific-gwas-catalog/
811
853
 
812
854
  └── [Z] 科学テキストマイニング
813
855
  ├── scientific-text-mining-nlp/
package/package.json CHANGED
@@ -1,6 +1,6 @@
1
1
  {
2
2
  "name": "@nahisaho/satori",
3
- "version": "0.16.0",
3
+ "version": "0.18.0",
4
4
  "description": "SATORI — Agent Skills for Science. GitHub Copilot Agent Skills collection for scientific data analysis.",
5
5
  "main": "index.js",
6
6
  "bin": {
@@ -0,0 +1,256 @@
1
+ ---
2
+ name: scientific-alphafold-structures
3
+ description: |
4
+ AlphaFold 構造予測スキル。AlphaFold Protein Structure Database
5
+ REST API による予測構造取得・pLDDT 信頼度解析・PAE 残基間
6
+ 距離予測・構造カバレッジ分析。ToolUniverse 連携: alphafold。
7
+ tu_tools:
8
+ - key: alphafold
9
+ name: AlphaFold Database
10
+ description: AlphaFold 予測構造・コンフィデンス・PAE 取得
11
+ ---
12
+
13
+ # Scientific AlphaFold Structures
14
+
15
+ AlphaFold Protein Structure Database REST API を活用した
16
+ 構造予測取得・信頼度解析パイプラインを提供する。
17
+
18
+ ## When to Use
19
+
20
+ - UniProt ID から AlphaFold 予測構造を取得するとき
21
+ - pLDDT スコアで構造信頼度を評価するとき
22
+ - PAE (Predicted Aligned Error) で残基間予測精度を分析するとき
23
+ - 構造カバレッジ (モデル化割合) を確認するとき
24
+ - AlphaFold 構造を実験構造と比較するとき
25
+ - 大規模プロテオーム構造データをバッチ取得するとき
26
+
27
+ ---
28
+
29
+ ## Quick Start
30
+
31
+ ## 1. AlphaFold 予測構造取得
32
+
33
+ ```python
34
+ import requests
35
+ import pandas as pd
36
+ import numpy as np
37
+ from io import StringIO
38
+
39
+ AFDB_BASE = "https://alphafold.ebi.ac.uk/api"
40
+
41
+
42
+ def alphafold_get_prediction(uniprot_id, version=4):
43
+ """
44
+ AlphaFold DB — 予測構造取得。
45
+
46
+ Parameters:
47
+ uniprot_id: str — UniProt アクセッション (例: "P00533")
48
+ version: int — AlphaFold モデルバージョン
49
+ """
50
+ url = f"{AFDB_BASE}/prediction/{uniprot_id}"
51
+ resp = requests.get(url, timeout=30)
52
+ resp.raise_for_status()
53
+ entries = resp.json()
54
+
55
+ if not entries:
56
+ print(f"No AlphaFold prediction for {uniprot_id}")
57
+ return None
58
+
59
+ entry = entries[0] if isinstance(entries, list) else entries
60
+ result = {
61
+ "uniprot_id": uniprot_id,
62
+ "entry_id": entry.get("entryId", ""),
63
+ "gene": entry.get("gene", ""),
64
+ "organism": entry.get("organismScientificName", ""),
65
+ "tax_id": entry.get("taxId", ""),
66
+ "sequence_length": entry.get("uniprotEnd", 0)
67
+ - entry.get("uniprotStart", 0) + 1,
68
+ "model_url": entry.get("cifUrl", ""),
69
+ "pdb_url": entry.get("pdbUrl", ""),
70
+ "pae_url": entry.get("paeImageUrl", ""),
71
+ "global_plddt": entry.get("globalMetricValue", None),
72
+ "model_version": entry.get("latestVersion", version),
73
+ }
74
+
75
+ print(f"AlphaFold {uniprot_id}: pLDDT={result['global_plddt']}, "
76
+ f"length={result['sequence_length']}")
77
+ return result
78
+ ```
79
+
80
+ ## 2. pLDDT 信頼度プロファイル解析
81
+
82
+ ```python
83
+ import biotite.structure.io.pdbx as pdbx
84
+ import biotite.structure as struc
85
+
86
+
87
+ def alphafold_plddt_profile(uniprot_id, output_dir="results"):
88
+ """
89
+ AlphaFold — pLDDT 残基別信頼度プロファイル。
90
+
91
+ Parameters:
92
+ uniprot_id: str — UniProt アクセッション
93
+ output_dir: str — 出力ディレクトリ
94
+ """
95
+ from pathlib import Path
96
+ output_dir = Path(output_dir)
97
+ output_dir.mkdir(parents=True, exist_ok=True)
98
+
99
+ # CIF 取得
100
+ pred = alphafold_get_prediction(uniprot_id)
101
+ if not pred:
102
+ return pd.DataFrame()
103
+
104
+ cif_url = pred["model_url"]
105
+ resp = requests.get(cif_url, timeout=60)
106
+ resp.raise_for_status()
107
+
108
+ cif_path = output_dir / f"AF-{uniprot_id}.cif"
109
+ cif_path.write_bytes(resp.content)
110
+
111
+ # pLDDT = B-factor in AlphaFold structures
112
+ pdbx_file = pdbx.CIFFile.read(str(cif_path))
113
+ structure = pdbx.get_structure(pdbx_file, model=1)
114
+ ca_mask = structure.atom_name == "CA"
115
+ ca_atoms = structure[ca_mask]
116
+
117
+ residues = []
118
+ for i, atom in enumerate(ca_atoms):
119
+ residues.append({
120
+ "residue_index": i + 1,
121
+ "residue_name": atom.res_name,
122
+ "chain": atom.chain_id,
123
+ "plddt": atom.b_factor,
124
+ })
125
+
126
+ df = pd.DataFrame(residues)
127
+
128
+ # 信頼度カテゴリ
129
+ df["confidence"] = pd.cut(
130
+ df["plddt"],
131
+ bins=[0, 50, 70, 90, 100],
132
+ labels=["Very low", "Low", "Confident", "Very high"],
133
+ )
134
+
135
+ n_high = (df["plddt"] >= 70).sum()
136
+ print(f"pLDDT profile {uniprot_id}: {len(df)} residues, "
137
+ f"{n_high}/{len(df)} confident (≥70)")
138
+ return df
139
+ ```
140
+
141
+ ## 3. PAE (Predicted Aligned Error) 解析
142
+
143
+ ```python
144
+ def alphafold_pae_analysis(uniprot_id):
145
+ """
146
+ AlphaFold — PAE マトリクス解析。
147
+
148
+ Parameters:
149
+ uniprot_id: str — UniProt アクセッション
150
+ """
151
+ url = (f"https://alphafold.ebi.ac.uk/files/"
152
+ f"AF-{uniprot_id}-F1-predicted_aligned_error_v4.json")
153
+ resp = requests.get(url, timeout=30)
154
+ resp.raise_for_status()
155
+ data = resp.json()
156
+
157
+ pae_data = data[0] if isinstance(data, list) else data
158
+ pae_matrix = np.array(pae_data.get("predicted_aligned_error",
159
+ pae_data.get("pae", [])))
160
+
161
+ # ドメイン境界推定 (低 PAE ブロック検出)
162
+ n_res = pae_matrix.shape[0]
163
+ mean_pae = pae_matrix.mean()
164
+ low_pae_mask = pae_matrix < mean_pae * 0.5
165
+
166
+ # 行ごとの低 PAE 連続領域
167
+ domain_scores = []
168
+ for i in range(n_res):
169
+ row = low_pae_mask[i]
170
+ domain_scores.append(row.sum() / n_res)
171
+
172
+ result = {
173
+ "uniprot_id": uniprot_id,
174
+ "pae_matrix_shape": pae_matrix.shape,
175
+ "mean_pae": float(mean_pae),
176
+ "median_pae": float(np.median(pae_matrix)),
177
+ "min_pae": float(pae_matrix.min()),
178
+ "max_pae": float(pae_matrix.max()),
179
+ "domain_scores": domain_scores,
180
+ }
181
+
182
+ print(f"PAE {uniprot_id}: {n_res}x{n_res} matrix, "
183
+ f"mean={mean_pae:.1f} Å")
184
+ return result, pae_matrix
185
+ ```
186
+
187
+ ## 4. AlphaFold 統合パイプライン
188
+
189
+ ```python
190
+ def alphafold_pipeline(uniprot_ids, output_dir="results"):
191
+ """
192
+ AlphaFold 構造解析統合パイプライン。
193
+
194
+ Parameters:
195
+ uniprot_ids: list[str] — UniProt IDs
196
+ output_dir: str — 出力ディレクトリ
197
+ """
198
+ from pathlib import Path
199
+ output_dir = Path(output_dir)
200
+ output_dir.mkdir(parents=True, exist_ok=True)
201
+
202
+ all_predictions = []
203
+ all_plddt = []
204
+
205
+ for uid in uniprot_ids:
206
+ # 1) 予測取得
207
+ pred = alphafold_get_prediction(uid)
208
+ if pred:
209
+ all_predictions.append(pred)
210
+
211
+ # 2) pLDDT プロファイル
212
+ plddt = alphafold_plddt_profile(uid, output_dir=output_dir)
213
+ if not plddt.empty:
214
+ plddt["uniprot_id"] = uid
215
+ all_plddt.append(plddt)
216
+
217
+ # サマリ
218
+ pred_df = pd.DataFrame(all_predictions)
219
+ pred_df.to_csv(output_dir / "predictions.csv", index=False)
220
+
221
+ if all_plddt:
222
+ plddt_df = pd.concat(all_plddt, ignore_index=True)
223
+ plddt_df.to_csv(output_dir / "plddt_profiles.csv", index=False)
224
+
225
+ print(f"AlphaFold pipeline: {len(all_predictions)} structures")
226
+ return {"predictions": pred_df}
227
+ ```
228
+
229
+ ---
230
+
231
+ ## ToolUniverse 連携
232
+
233
+ | TU Key | ツール名 | 連携内容 |
234
+ |--------|---------|---------|
235
+ | `alphafold` | AlphaFold Database | 予測構造・pLDDT・PAE 取得 |
236
+
237
+ ## パイプライン統合
238
+
239
+ ```
240
+ protein-structure-analysis → alphafold-structures → protein-design
241
+ (PDB 実験構造) (AlphaFold 予測) (de novo 設計)
242
+ │ │ ↓
243
+ structural-proteomics ─────────┘ molecular-docking
244
+ (EMDB/PDBe) │ (結合予測)
245
+
246
+ variant-effect-prediction
247
+ (構造ベース変異評価)
248
+ ```
249
+
250
+ ## パイプライン出力
251
+
252
+ | ファイル | 説明 | 次スキル |
253
+ |---------|------|---------|
254
+ | `results/predictions.csv` | 予測メタデータ | → protein-structure-analysis |
255
+ | `results/plddt_profiles.csv` | 残基別 pLDDT | → protein-design |
256
+ | `results/AF-*.cif` | 予測構造ファイル | → molecular-docking |