@leejungkiin/awkit 1.7.0 → 1.7.4
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/bin/awk.js +576 -84
- package/core/CLAUDE.md +1 -1
- package/core/GEMINI.md +148 -167
- package/core/GEMINI.md.bak +149 -116
- package/core/skill-runtime-manifest.json +3 -0
- package/docs/Claude Fable 5.md +3826 -0
- package/docs/android_kotlin_system_instruction.md +210 -0
- package/docs/brainstorm_ponytail_integration.md +146 -0
- package/docs/brainstorm_smart_setup.md +113 -0
- package/docs/deep-research-report (1).md +293 -0
- package/docs/history/GEMINI.v1.md +135 -0
- package/docs/history/brainstorm_antigravity_unified_architecture.v1.md +105 -0
- package/docs/history/implementation_plan.v1.md +58 -0
- package/package.json +4 -1
- package/scripts/artifact-storage.js +130 -0
- package/scripts/automation-gate.js +40 -7
- package/scripts/claude-plan.js +76 -0
- package/scripts/dependency-manager.js +210 -0
- package/scripts/exec-rtk.js +11 -5
- package/scripts/i18n-helper.js +381 -0
- package/scripts/multi-model-pipeline.js +144 -0
- package/skill-packs/mobile-ios/pack.json +4 -2
- package/skill-packs/reverse-engineering/pack.json +1 -0
- package/skills/CATALOG.md +20 -0
- package/skills/GEMINI.md +9 -1
- package/skills/TRIGGER_INDEX.md +10 -0
- package/skills/ai-music/SKILL.md +275 -0
- package/skills/android-re-analyzer/SKILL.md +238 -0
- package/skills/android-re-analyzer/references/api-extraction-patterns.md +119 -0
- package/skills/android-re-analyzer/references/call-flow-analysis.md +176 -0
- package/skills/android-re-analyzer/references/fernflower-usage.md +115 -0
- package/skills/android-re-analyzer/references/jadx-usage.md +116 -0
- package/skills/android-re-analyzer/references/setup-guide.md +221 -0
- package/skills/android-re-analyzer/scripts/check-deps.sh +129 -0
- package/skills/android-re-analyzer/scripts/decompile.sh +375 -0
- package/skills/android-re-analyzer/scripts/find-api-calls.sh +118 -0
- package/skills/android-re-analyzer/scripts/install-dep.sh +448 -0
- package/skills/animal-island-ui-style/SKILL.md +1450 -0
- package/skills/app-store-review-agent/SKILL.md +164 -0
- package/skills/app-store-review-agent/references/guidelines/README.md +154 -0
- package/skills/app-store-review-agent/references/guidelines/by-app-type/ai_apps.md +37 -0
- package/skills/app-store-review-agent/references/guidelines/by-app-type/all_apps.md +50 -0
- package/skills/app-store-review-agent/references/guidelines/by-app-type/crypto_finance.md +31 -0
- package/skills/app-store-review-agent/references/guidelines/by-app-type/games.md +31 -0
- package/skills/app-store-review-agent/references/guidelines/by-app-type/health_fitness.md +31 -0
- package/skills/app-store-review-agent/references/guidelines/by-app-type/kids.md +27 -0
- package/skills/app-store-review-agent/references/guidelines/by-app-type/macos.md +38 -0
- package/skills/app-store-review-agent/references/guidelines/by-app-type/social_ugc.md +32 -0
- package/skills/app-store-review-agent/references/guidelines/by-app-type/subscription_iap.md +34 -0
- package/skills/app-store-review-agent/references/guidelines/by-app-type/vpn.md +18 -0
- package/skills/app-store-review-agent/references/rules/design/minimum_functionality.md +96 -0
- package/skills/app-store-review-agent/references/rules/design/sign_in_with_apple.md +54 -0
- package/skills/app-store-review-agent/references/rules/entitlements/unused_entitlements.md +83 -0
- package/skills/app-store-review-agent/references/rules/metadata/accurate_metadata.md +54 -0
- package/skills/app-store-review-agent/references/rules/metadata/apple_trademark.md +99 -0
- package/skills/app-store-review-agent/references/rules/metadata/china_storefront.md +72 -0
- package/skills/app-store-review-agent/references/rules/metadata/competitor_terms.md +56 -0
- package/skills/app-store-review-agent/references/rules/metadata/subscription_metadata.md +81 -0
- package/skills/app-store-review-agent/references/rules/privacy/privacy_manifest.md +84 -0
- package/skills/app-store-review-agent/references/rules/privacy/unnecessary_data.md +60 -0
- package/skills/app-store-review-agent/references/rules/subscription/misleading_pricing.md +63 -0
- package/skills/app-store-review-agent/references/rules/subscription/missing_tos_pp.md +54 -0
- package/skills/awf-ponytail/SKILL.md +91 -0
- package/skills/awf-ponytail-review/SKILL.md +67 -0
- package/skills/awf-session-restore/SKILL.md +3 -3
- package/skills/brainstorm-agent/SKILL.md +11 -2
- package/skills/brainstorm-agent/templates/brief-template.md +8 -0
- package/skills/claude-planner/SKILL.md +47 -0
- package/skills/code-review/SKILL.md +87 -0
- package/skills/expo-game-development/SKILL.md +163 -0
- package/skills/flutter/LICENSE.txt +202 -0
- package/skills/flutter/SKILL.md +127 -0
- package/skills/flutter-project-creater/LICENSE.txt +202 -0
- package/skills/flutter-project-creater/SKILL.md +106 -0
- package/skills/game-developer/SKILL.md +163 -0
- package/skills/game-developer/references/ecs-patterns.md +501 -0
- package/skills/game-developer/references/multiplayer-networking.md +475 -0
- package/skills/game-developer/references/performance-optimization.md +422 -0
- package/skills/game-developer/references/unity-patterns.md +271 -0
- package/skills/game-developer/references/unreal-cpp.md +352 -0
- package/skills/generate-gui-assets/SKILL.md +305 -0
- package/skills/generate-gui-assets/agents/openai.yaml +4 -0
- package/skills/generate-gui-assets/references/catalog-schema.md +58 -0
- package/skills/generate-gui-assets/references/extraction-techniques.md +21 -0
- package/skills/generate-gui-assets/references/prompt-patterns.md +58 -0
- package/skills/generate-gui-assets/scripts/__pycache__/clean_chroma_edges.cpython-311.pyc +0 -0
- package/skills/generate-gui-assets/scripts/build_gui_contact_sheet.py +51 -0
- package/skills/generate-gui-assets/scripts/clean_chroma_edges.py +262 -0
- package/skills/generate-gui-assets/scripts/copy_approved_icons.py +64 -0
- package/skills/generate-gui-assets/scripts/prepare_gui_asset_run.py +91 -0
- package/skills/generate-gui-assets/scripts/suggest_grid_options.py +63 -0
- package/skills/generate-gui-assets/scripts/validate_gui_catalog.py +50 -0
- package/skills/godot-game-development/SKILL.md +142 -0
- package/skills/hatch-pet/LICENSE.txt +201 -0
- package/skills/hatch-pet/SKILL.md +420 -0
- package/skills/hatch-pet/agents/openai.yaml +4 -0
- package/skills/hatch-pet/references/animation-rows.md +29 -0
- package/skills/hatch-pet/references/codex-pet-contract.md +35 -0
- package/skills/hatch-pet/references/qa-rubric.md +60 -0
- package/skills/hatch-pet/scripts/__pycache__/clean_chroma_edges.cpython-311.pyc +0 -0
- package/skills/hatch-pet/scripts/clean_chroma_edges.py +262 -0
- package/skills/hatch-pet/scripts/compose_atlas.py +150 -0
- package/skills/hatch-pet/scripts/derive_running_left_from_running_right.py +143 -0
- package/skills/hatch-pet/scripts/extract_strip_frames.py +323 -0
- package/skills/hatch-pet/scripts/finalize_pet_run.py +382 -0
- package/skills/hatch-pet/scripts/generate_pet_images.py +287 -0
- package/skills/hatch-pet/scripts/inspect_frames.py +246 -0
- package/skills/hatch-pet/scripts/make_contact_sheet.py +96 -0
- package/skills/hatch-pet/scripts/package_custom_pet.py +108 -0
- package/skills/hatch-pet/scripts/pet_job_status.py +117 -0
- package/skills/hatch-pet/scripts/prepare_pet_run.py +673 -0
- package/skills/hatch-pet/scripts/queue_pet_repairs.py +172 -0
- package/skills/hatch-pet/scripts/record_imagegen_result.py +250 -0
- package/skills/hatch-pet/scripts/render_animation_videos.py +134 -0
- package/skills/hatch-pet/scripts/render_animation_videos.sh +5 -0
- package/skills/hatch-pet/scripts/validate_atlas.py +139 -0
- package/skills/i18n-orchestrator/SKILL.md +37 -0
- package/skills/ios-simulator-skill/SKILL.md +390 -0
- package/skills/ios-simulator-skill/scripts/accessibility_audit.py +300 -0
- package/skills/ios-simulator-skill/scripts/app_launcher.py +326 -0
- package/skills/ios-simulator-skill/scripts/app_state_capture.py +400 -0
- package/skills/ios-simulator-skill/scripts/appearance.py +385 -0
- package/skills/ios-simulator-skill/scripts/build_and_test.py +348 -0
- package/skills/ios-simulator-skill/scripts/clipboard.py +103 -0
- package/skills/ios-simulator-skill/scripts/common/__init__.py +61 -0
- package/skills/ios-simulator-skill/scripts/common/cache_utils.py +289 -0
- package/skills/ios-simulator-skill/scripts/common/device_utils.py +462 -0
- package/skills/ios-simulator-skill/scripts/common/env_config.py +35 -0
- package/skills/ios-simulator-skill/scripts/common/hang_pipeline.py +862 -0
- package/skills/ios-simulator-skill/scripts/common/hang_sessions.py +490 -0
- package/skills/ios-simulator-skill/scripts/common/idb_utils.py +180 -0
- package/skills/ios-simulator-skill/scripts/common/screenshot_utils.py +338 -0
- package/skills/ios-simulator-skill/scripts/container.py +668 -0
- package/skills/ios-simulator-skill/scripts/gesture.py +394 -0
- package/skills/ios-simulator-skill/scripts/hang_watcher.py +1533 -0
- package/skills/ios-simulator-skill/scripts/keyboard.py +391 -0
- package/skills/ios-simulator-skill/scripts/localization_audit.py +483 -0
- package/skills/ios-simulator-skill/scripts/location.py +467 -0
- package/skills/ios-simulator-skill/scripts/log_monitor.py +493 -0
- package/skills/ios-simulator-skill/scripts/model_inspector.py +645 -0
- package/skills/ios-simulator-skill/scripts/navigator.py +461 -0
- package/skills/ios-simulator-skill/scripts/privacy_manager.py +310 -0
- package/skills/ios-simulator-skill/scripts/push_notification.py +240 -0
- package/skills/ios-simulator-skill/scripts/screen_mapper.py +296 -0
- package/skills/ios-simulator-skill/scripts/sim_health_check.sh +245 -0
- package/skills/ios-simulator-skill/scripts/sim_list.py +299 -0
- package/skills/ios-simulator-skill/scripts/simctl_boot.py +312 -0
- package/skills/ios-simulator-skill/scripts/simctl_create.py +316 -0
- package/skills/ios-simulator-skill/scripts/simctl_delete.py +357 -0
- package/skills/ios-simulator-skill/scripts/simctl_erase.py +351 -0
- package/skills/ios-simulator-skill/scripts/simctl_shutdown.py +290 -0
- package/skills/ios-simulator-skill/scripts/simulator_selector.py +375 -0
- package/skills/ios-simulator-skill/scripts/status_bar.py +250 -0
- package/skills/ios-simulator-skill/scripts/test_recorder.py +323 -0
- package/skills/ios-simulator-skill/scripts/visual_diff.py +235 -0
- package/skills/ios-simulator-skill/scripts/xcode/__init__.py +13 -0
- package/skills/ios-simulator-skill/scripts/xcode/builder.py +397 -0
- package/skills/ios-simulator-skill/scripts/xcode/cache.py +204 -0
- package/skills/ios-simulator-skill/scripts/xcode/config.py +178 -0
- package/skills/ios-simulator-skill/scripts/xcode/reporter.py +343 -0
- package/skills/ios-simulator-skill/scripts/xcode/xcresult.py +451 -0
- package/skills/ios-visual-qa-strategist/SKILL.md +111 -0
- package/skills/ios-visual-qa-strategist/agents/openai.yaml +4 -0
- package/skills/ios-visual-qa-strategist/references/ios-tool-selection.md +61 -0
- package/skills/ios-visual-qa-strategist/references/minimal-capture-policy.md +56 -0
- package/skills/ios-visual-qa-strategist/references/visual-reasoning-heuristics.md +53 -0
- package/skills/orchestrator/SKILL.md +0 -20
- package/skills/persistent-storage/SKILL.md +55 -0
- package/skills/short-maker/SKILL.md +23 -0
- package/skills/short-maker/scripts/effects.js +56 -0
- package/skills/short-maker/scripts/shortmaker-bridge.js +332 -0
- package/skills/short-maker/scripts/videomix.js +601 -0
- package/skills/short-maker/templates/hyperframes/cinematic-character.template.html +172 -0
- package/skills/short-maker/templates/hyperframes/index.template.html +194 -0
- package/skills/smali-to-kotlin/SKILL.md +128 -0
- package/skills/smali-to-kotlin/examples/getting-started/tech-stack.md +58 -0
- package/skills/smali-to-kotlin/examples/pipeline/data-ui-parity.md +118 -0
- package/skills/smali-to-kotlin/examples/pipeline/scanner-and-bootstrap.md +106 -0
- package/skills/smali-to-kotlin/library-patterns.md +189 -0
- package/skills/smali-to-kotlin/phase-0-discovery.md +128 -0
- package/skills/smali-to-kotlin/phase-1-architecture.md +166 -0
- package/skills/smali-to-kotlin/phase-2-blueprint-ui.md +347 -0
- package/skills/smali-to-kotlin/phase-2-blueprint.md +228 -0
- package/skills/smali-to-kotlin/phase-3-build.md +248 -0
- package/skills/smali-to-kotlin/phase-3-logic-build.md +268 -0
- package/skills/smali-to-kotlin/smali-reading-guide.md +310 -0
- package/skills/smali-to-kotlin/templates/app-map.md +101 -0
- package/skills/smali-to-kotlin/templates/architecture.md +142 -0
- package/skills/smali-to-kotlin/templates/blueprint.md +145 -0
- package/skills/spec-gate/SKILL.md +6 -2
- package/skills/symphony-enforcer/SKILL.md +8 -0
- package/skills/symphony-enforcer/examples/mindful-stop.md +2 -0
- package/skills/symphony-enforcer/examples/three-phase.md +16 -0
- package/skills/symphony-enforcer/examples/trigger-points.md +7 -1
- package/skills/unity-game-development/SKILL.md +231 -0
- package/skills/verification-gate/SKILL.md +4 -2
- package/skills/video-edit/SKILL.md +36 -0
- package/skills/video-edit/scripts/video_edit.py +324 -0
- package/templates/setup-mapping.json +48 -0
- package/templates/specs/design-template.md +161 -71
- package/templates/specs/requirements-template.md +65 -133
- package/templates/specs/task-spec-template.xml +3 -0
- package/workflows/_uncategorized/critic.md +40 -0
- package/workflows/_uncategorized/git-rebase-flow.md +81 -0
- package/workflows/_uncategorized/image-gen.md +118 -0
- package/workflows/_uncategorized/multi-model-pipeline.md +60 -0
- package/workflows/_uncategorized/pixel-gen.md +86 -0
- package/workflows/_uncategorized/pixel-setup.md +90 -0
- package/workflows/_uncategorized/ponytail-review.md +59 -0
- package/workflows/_uncategorized/reverse-android-build.md +222 -0
- package/workflows/_uncategorized/reverse-android-design.md +139 -0
- package/workflows/_uncategorized/reverse-android-discover.md +150 -0
- package/workflows/_uncategorized/reverse-android-scan.md +158 -0
- package/workflows/_uncategorized/reverse-android.md +143 -0
- package/workflows/_uncategorized/reverse-ios-build.md +240 -0
- package/workflows/_uncategorized/reverse-ios-design.md +112 -0
- package/workflows/_uncategorized/reverse-ios-discover.md +120 -0
- package/workflows/_uncategorized/reverse-ios-scan.md +155 -0
- package/workflows/_uncategorized/reverse-ios.md +152 -0
- package/workflows/_uncategorized/safety-router.md +34 -0
- package/workflows/_uncategorized/teach.md +89 -0
- package/workflows/_uncategorized/verify-ui.md +53 -0
- package/workflows/_uncategorized/visualize-screenshots.md +34 -0
- package/workflows/ads/ads-analyst.md +201 -0
- package/workflows/ads/ads-audit.md +106 -0
- package/workflows/ads/ads-optimize.md +97 -0
- package/workflows/ads/ads-targeting.md +241 -0
- package/workflows/ads/adsExpert.md +160 -0
- package/workflows/ads/smali-ads-config.md +400 -0
- package/workflows/ads/smali-ads-flow.md +331 -0
- package/workflows/ads/smali-ads-interstitial.md +377 -0
- package/workflows/ads/smali-ads-native.md +382 -0
- package/workflows/context/teach.md +89 -0
- package/workflows/gitnexus.md +8 -8
- package/workflows/lifecycle/brainstorm.md +43 -0
- package/workflows/lifecycle/code.md +5 -0
- package/workflows/lifecycle/init.md +23 -5
- package/workflows/lifecycle/multi-model-pipeline.md +60 -0
- package/workflows/quality/ponytail-review.md +59 -0
- package/workflows/roles/critic.md +40 -0
- package/workflows/roles/safety-router.md +34 -0
|
@@ -0,0 +1,293 @@
|
|
|
1
|
+
# Báo cáo phân tích về Fable 5 và thiết kế hệ đa tác tử tương thích Opus 4.8, GPT-5.5 và Gemini
|
|
2
|
+
|
|
3
|
+
## Tóm tắt điều hành
|
|
4
|
+
|
|
5
|
+
Bằng chứng mạnh nhất hiện có không cho thấy Fable 5 là một “bầy agent bí mật” thuần túy, mà là một hệ nhiều lớp gồm: mô hình nền rất mạnh, bộ phân loại an toàn đứng ngoài mô hình, cơ chế định tuyến rủi ro sang Claude Opus 4.8, bộ nhớ/sổ ghi chú dài hạn cho tác vụ nhiều bước, và một chương trình trusted access tách biệt cho biến thể ít guardrail hơn là Mythos 5. Anthropic công khai xác nhận Fable 5 và Mythos 5 là “cùng model nền”, rằng các truy vấn thuộc cyber/bio/chem/distillation có thể bị chuyển sang Opus 4.8, và rằng mô hình có thể duy trì hiệu năng trên các tác vụ dài, dùng “own notes”, và làm việc tự trị lâu hơn các Claude trước đó. Project Glasswing cũng cho thấy mô hình có khả năng phân tích, thử nghiệm và tìm lỗi phần mềm theo hướng agentic, nhiều trường hợp “gần như hoàn toàn tự động”. citeturn8view0turn9view0
|
|
6
|
+
|
|
7
|
+
Tệp người dùng cung cấp trông giống một prompt hệ thống rò rỉ hoặc tổng hợp cho “Claude Fable 5”, với cấu trúc module rất lớn: product info, refusal handling, legal/financial, wellbeing, evenhandedness, knowledge cutoff, memory system, và các chỉ dẫn web-search/product behavior. Nó gợi ý rằng lớp orchestration thực tế không chỉ nằm trong weights của model, mà còn nằm trong prompt stack, policy routing, memory application, và công cụ xung quanh model. Tuy vậy, đây là một artefact chưa được Anthropic xác thực; nên dùng nó như nguồn gợi ý kiến trúc, không phải bằng chứng kết luận. fileciteturn0file0
|
|
8
|
+
|
|
9
|
+
Nếu mục tiêu là thiết kế một hệ tương đương chạy được trên Claude Opus 4.8, GPT-5.5 và Gemini, giải pháp tốt nhất không phải sao chép prompt rò rỉ, mà là xây một control plane chung theo mô hình **manager–workers–critic–safety router**. Manager nhận yêu cầu, chia việc thành worker đọc/tìm kiếm/kiểm chứng, worker chỉ trả về tóm tắt có cấu trúc thay vì đổ toàn bộ log vào luồng chính, critic so chéo nguồn và phát hiện mâu thuẫn, còn safety router quyết định khi nào phải chặn, hạ cấp, hoặc xin duyệt người vận hành. Mẫu này phù hợp với tài liệu chính thức của cả Anthropic, OpenAI và Google: Anthropic nhấn mạnh explicit tool use, parallel tool calls và kiểm soát subagent; OpenAI công khai hai pattern “handoffs” và “agents-as-tools” cùng cơ chế approvals/state; Google công khai managed agents, collaborative planning, sandbox, MCP, function calling modes và network allowlists. citeturn26view0turn27view1turn27view0turn29view1turn29view2turn29view4turn22view0turn23view0turn20view3turn23view3
|
|
10
|
+
|
|
11
|
+
Về tương thích nền tảng, Anthropic Opus 4.8 phù hợp làm “deep specialist” cho coding, research và delegated work nếu được hướng dẫn rõ khi nào spawn subagent, khi nào dùng tool, và nếu được cấp budget output đủ lớn ở effort cao. GPT-5.5 phù hợp làm manager hoặc synthesizer nhờ context 1M, max output 128K, tool surface rộng, Agents SDK có handoff/asTool/approval/state khá rõ ràng. Gemini phù hợp cho tác vụ nghiên cứu dài, async và môi trường có tool/mạng cần quản lý chặt, đặc biệt nếu dùng Deep Research Agent hoặc managed Antigravity agent với collaborative planning, MCP và network allowlist. citeturn27view3turn27view1turn17view1turn17view4turn29view1turn29view2turn22view0turn23view0turn23view3
|
|
12
|
+
|
|
13
|
+
Điểm quan trọng nhất về an toàn là: không dựa vào “một system prompt lớn” để kiểm soát toàn hệ. Các nguồn chính thức và học thuật đều chỉ ra rủi ro ở ba tầng khác nhau: prompt leak, context pollution/context rot, và hạ tầng sandbox/tooling. Vì vậy hệ tương đương phải có guardrail ở **tool boundary**, **approval boundary**, **context boundary**, và **output boundary**; nếu không, càng nhiều subagent càng tăng xác suất rò prompt, lạm dụng tool, viết song song xung đột, hoặc tự tin sai theo kiểu “early commitment” vào giả thuyết sai. citeturn28view0turn30view4turn29view2turn5academia14turn5academia16turn5academia20turn5academia23
|
|
14
|
+
|
|
15
|
+
## Bằng chứng rò rỉ và các tuyên bố có thể kiểm chứng
|
|
16
|
+
|
|
17
|
+
Mermaid dưới đây tách các mốc “rò rỉ”, “công bố chính thức” và “tranh cãi công khai” đã xác minh được trong tập nguồn hiện có.
|
|
18
|
+
|
|
19
|
+
```mermaid
|
|
20
|
+
timeline
|
|
21
|
+
title Dòng thời gian rò rỉ và công khai liên quan đến Mythos và Fable
|
|
22
|
+
2026-03-26 : Sự tồn tại của Claude Mythos trở nên công khai do draft blog bị rò rỉ (nguồn thứ cấp)
|
|
23
|
+
2026-04-07 : Anthropic công bố Project Glasswing và Claude Mythos Preview
|
|
24
|
+
2026-06-09 : Anthropic công bố Claude Fable 5 và Claude Mythos 5
|
|
25
|
+
2026-06-10 : Tranh luận công khai về data retention và false positives quanh Fable 5
|
|
26
|
+
2026-06-12 : Anthropic cập nhật rằng Fable 5 và Mythos 5 bị tạm ngừng truy cập
|
|
27
|
+
Không rõ ngày : Tệp prompt “Claude Fable 5” do người dùng cung cấp như một artefact rò rỉ
|
|
28
|
+
```
|
|
29
|
+
|
|
30
|
+
Việc phân loại mức độ tin cậy là rất quan trọng ở chủ đề này. Nguồn **xác minh mạnh** là bài công bố chính thức của Anthropic về Fable 5, Project Glasswing, tài liệu prompt engineering/guardrails chính thức của Anthropic, cùng tài liệu chính thức của OpenAI và Google về orchestration/agents. Nguồn **mạnh vừa** là Reuters, Axios, The Verge, OpenAI/Google docs phụ trợ và vài bài báo học thuật. Nguồn **yếu hơn hoặc chỉ mang tính gợi ý** gồm Wikipedia/các bản mirror thứ cấp về thời điểm lộ Mythos, và tệp prompt rò rỉ do người dùng cung cấp. citeturn8view0turn9view0turn28view0turn16view0turn22view0turn5news3turn2news6turn13news2turn7search17
|
|
31
|
+
|
|
32
|
+
Bảng dưới đây đối chiếu các tuyên bố “rò rỉ hoặc suy đoán” với phần nào đã được Anthropic hoặc nguồn mạnh xác nhận.
|
|
33
|
+
|
|
34
|
+
| Tuyên bố | Nguồn rò rỉ / suy đoán | Nguồn xác minh hoặc bác bỏ | Đánh giá |
|
|
35
|
+
|---|---|---|---|
|
|
36
|
+
| Fable 5 và Mythos 5 dùng cùng model nền | Tệp prompt rò rỉ và các thảo luận cộng đồng | Anthropic xác nhận Mythos 5 là “the same underlying model as Fable 5”. citeturn8view0 | **Đã xác minh** |
|
|
37
|
+
| Fable 5 có cơ chế fallback sang Opus 4.8 cho chủ đề rủi ro | Leak và báo chí | Anthropic xác nhận cyber/bio/chem/distillation bị route sang Opus 4.8; Reuters cũng nêu fallback này. citeturn8view0turn5news3 | **Đã xác minh** |
|
|
38
|
+
| Kiến trúc dựa trên nhiều lớp prompt/policy/memory thay vì chỉ model weights | Tệp prompt rò rỉ | Tệp rò rỉ cho thấy prompt stack module hóa; Anthropic docs chính thức cũng có guidance tách prompt engineering, guardrails và memory-style behavior ra khỏi core model. fileciteturn0file0 citeturn26view0turn28view0 | **Hợp lý nhưng chưa xác nhận nội bộ** |
|
|
39
|
+
| Fable 5 vận hành tốt hơn trong công việc dài nhiều bước, dùng ghi chú nội bộ/file memory | Leak và lời đồn “agentic” | Anthropic nói Fable 5 “stays focused across millions of tokens” và cải thiện đầu ra bằng “its own notes”; file-based memory giúp mạnh lên rõ rệt trong Slay the Spire. citeturn8view0 | **Đã xác minh ở mức hành vi** |
|
|
40
|
+
| Claude Code/Fable vận hành các workflow đa agent trong thực tế | Thảo luận cộng đồng | Anthropic trích dẫn phản hồi khách hàng rằng Fable 5 xử lý “complex multi-agent workflows our employees run daily” trong Claude Code. citeturn8view0 | **Đã xác minh gián tiếp** |
|
|
41
|
+
| Fable 5/M Mythos có khả năng cyber agentic rất mạnh, có thể tìm-zero day tự động | Cộng đồng gọi là “too powerful”, “agentic hacker” | Anthropic/Glasswing mô tả Mythos Preview đã tìm hàng nghìn lỗ hổng nghiêm trọng và gần như tự động tìm/khai thác một số lỗi; Reuters và Axios phản ánh tranh cãi công khai quanh khả năng này. citeturn9view0turn5news3turn7news1 | **Đã xác minh ở mức public claims** |
|
|
42
|
+
| Full system prompt trong tệp người dùng là prompt thật cuối cùng của Anthropic | Artefact do người dùng cung cấp | Không có xác thực công khai từ Anthropic; nội dung nên xem như **purported leak / composite artifact**. fileciteturn0file0 | **Chưa xác minh** |
|
|
43
|
+
|
|
44
|
+
Về “community traces”, trong bộ nguồn đã truy xuất, dấu vết công khai có thể xác minh rõ nhất là: sự tồn tại của Mythos bị lộ do draft/blog leak theo các nguồn thứ cấp; phản ứng công khai sau lệnh đình chỉ Fable/Mythos ngày 13 tháng 6 năm 2026; và một ví dụ X được báo chí ghi lại là Sridhar Vembu bình luận về AI sovereignty sau khi Mỹ hạn chế truy cập Fable 5. Tuy nhiên, tôi **không truy xuất được một cách đáng tin cậy** các thread Reddit/Hacker News/X nguyên bản, giàu chi tiết về kiến trúc sub-agent của Fable 5, trong tập nguồn hiện tại. Điều đó tự nó là một tín hiệu: phần lớn chi tiết kỹ thuật khả tín đang nằm trong bài công bố chính thức và artefact prompt rò rỉ hơn là trong các thread cộng đồng dễ xác minh. citeturn7search17turn7news2turn2news6
|
|
45
|
+
|
|
46
|
+
## Kiến trúc Fable 5 suy ra từ nguồn chính thức và artefact rò rỉ
|
|
47
|
+
|
|
48
|
+
Ở mức công khai, Fable 5 có thể được hiểu như một hệ hai lớp rõ ràng. Lớp thứ nhất là model nền rất mạnh, dùng chung với Mythos 5. Lớp thứ hai là “safety router” gồm classifier và chính sách định tuyến: nếu classifier phát hiện truy vấn liên quan tới misuse hoặc jailbreak, đặc biệt ở cyber, biology, chemistry và distillation, truy vấn sẽ không cho main model trả lời trực tiếp mà chuyển sang Claude Opus 4.8. Anthropic còn nói hơn 95% session không bị fallback, cho thấy fallback là guardrail chọn lọc chứ không phải mode mặc định. Họ cũng thừa nhận false positives tồn tại, bug bounty hơn 1.000 giờ vẫn chưa tìm thấy “universal jailbreak”, nhưng không coi việc ngăn universal jailbreak là tuyệt đối khả thi. Đây là kiến trúc “gate + degrade + trusted-access exception”, không phải một prompt đơn lẻ sẽ giải quyết mọi thứ. citeturn8view0
|
|
49
|
+
|
|
50
|
+
Project Glasswing cho biết Mythos Preview được dùng để tìm và nối các lỗ hổng phần mềm trong những codebase cực lớn và nhạy cảm. Anthropic viết rằng model đã tìm “thousands of high-severity vulnerabilities”, trong một số trường hợp “nearly all” được model phát hiện và phát triển exploit “entirely autonomously”. Đồng thời, Anthropic nói sức mạnh cyber này là hệ quả của “strong agentic coding and reasoning skills”. Nói cách khác, năng lực agentic không phải là lớp ngoài trang trí, mà là phần lõi của sản phẩm. citeturn9view0
|
|
51
|
+
|
|
52
|
+
Ở tầng prompt/orchestration, artefact rò rỉ cho thấy một bố cục kiểu “modular constitution” với nhiều khối chỉ dẫn: product info, refusal handling, child safety, legal/financial, user wellbeing, political evenhandedness, memory, knowledge cutoff, web-search defaults, v.v. Tệp này còn thể hiện một budget token rất lớn và một phong cách chỉ đạo công cụ có tính vận hành, không chỉ mang tính “chat persona”. Dù chưa thể coi đó là prompt chính thức cuối cùng, nó rất phù hợp với cách các model frontier hiện nay thường được ghép bởi nhiều lớp: **model nền + system stack + policy stack + tool router + memory adapter**. fileciteturn0file0
|
|
53
|
+
|
|
54
|
+
Anthropic còn xác nhận Fable 5 có bộ nhớ và long-context mạnh hơn đáng kể, có thể “stays focused across millions of tokens” và cải thiện đầu ra bằng “its own notes”. Điều này đặc biệt quan trọng cho thiết kế hệ đa tác tử: nếu manager cố nhồi mọi log và mọi intermediate output vào một luồng duy nhất, hiệu năng sẽ suy giảm. OpenAI mô tả chính hiện tượng này là “context pollution” và “context rot”, và khuyến nghị subagent chỉ đưa trả **summary đã chưng cất** thay vì đổ log thô vào thread chính. Tôi cho rằng đây là manh mối rất mạnh cho cách một hệ kiểu Fable 5 nên được tổ chức: manager giữ context điều hành; worker thực hiện phần “ồn”; chỉ các kết luận đã cấu trúc mới quay lại main thread. citeturn8view0turn30view4
|
|
55
|
+
|
|
56
|
+
Từ các nguồn chính thức của OpenAI và Google, ta còn thấy một mẫu hội tụ của kiến trúc agent hiện đại. OpenAI phân biệt rất rõ giữa **handoffs** và **agents-as-tools**: nếu specialist nên nắm luôn nhánh hội thoại, dùng handoff; nếu manager vẫn phải chịu trách nhiệm câu trả lời cuối, gọi specialist như tool. Google thì đóng gói managed agent trong một Linux sandbox, cho phép code execution, web browse, file handling, MCP, collaborative planning và background execution. Hai nhà cung cấp khác nhau nhưng cùng hội tụ vào một ý: orchestration hiệu quả là **phân quyền có ranh giới**, không phải thả tự do nhiều agent tranh nhau làm việc. citeturn29view1turn22view0turn23view0
|
|
57
|
+
|
|
58
|
+
Bảng sau tóm tắt các pattern điều phối có thể suy ra và lý do chúng quan trọng.
|
|
59
|
+
|
|
60
|
+
| Pattern điều phối | Dấu hiệu từ nguồn | Ý nghĩa kỹ thuật | Failure mode nếu thiếu |
|
|
61
|
+
|---|---|---|---|
|
|
62
|
+
| Safety router ngoài model | Fable classifier + fallback sang Opus 4.8. citeturn8view0 | Giảm rủi ro bằng degrade path thay vì chỉ từ chối | False positive, route nhầm, hoặc bypass classifier |
|
|
63
|
+
| Manager giữ thread chính; worker trả summary | OpenAI mô tả context pollution/context rot; subagent trả distilled takeaways. citeturn30view4 | Bảo vệ context quyết định khỏi log ồn | Context window bị “thối”, chất lượng synth giảm |
|
|
64
|
+
| Parallel read-only workers | Claude docs khuyến nghị parallel tool calls; Codex dùng parallel agents cho exploration/tests/triage; Gemini hỗ trợ parallel function calling. citeturn26view0turn30view4turn20view2 | Tăng tốc mà ít xung đột | Race condition, duplicate work, token burn |
|
|
65
|
+
| Explicit subagent policy | Opus 4.8 spawn ít subagent hơn mặc định; Codex không spawn tự động nếu không yêu cầu. citeturn27view0turn30view4 | Tránh delegation mơ hồ và khó debug | Under-delegation hoặc over-delegation |
|
|
66
|
+
| Resumable state + approvals | OpenAI approvals dùng interruptions + state; Gemini research dài phải background/poll. citeturn29view2turn29view4turn23view0 | Cho workflow dài và side-effect an toàn | Mất trạng thái, chạy lại sai, side-effect không duyệt |
|
|
67
|
+
| Memory qua notes/files, không dựa vào hidden thoughts | Fable dùng own notes; Gemini có thought summaries; OpenAI reasoning tokens không được giữ như transcript hữu ích. citeturn8view0turn21view4turn17view2 | Dùng summary hữu hình làm state chuẩn | Phụ thuộc mù vào hidden reasoning, khó audit |
|
|
68
|
+
|
|
69
|
+
Hai bài phân tích học thuật gần hơn với phần “giải phẫu rủi ro” cũng đáng chú ý. “Benchmarking Mythos-Linked Bug Rediscovery” cho thấy failure mode phổ biến của model khi làm cyber analysis là **chốt quá sớm vào một ứng viên có vẻ hợp lý nhưng sai**; điều này ủng hộ mạnh cho việc phải có critic/verifier độc lập trong hệ đa agent. “Mythos and the Unverified Cage” thì lập luận rằng ngay cả khi behavior guardrails tốt, hạ tầng sandbox và tool boundary vẫn có thể là điểm vỡ, nên containment phải được xem như một lớp kỹ thuật độc lập cần kiểm chứng. citeturn5academia14turn5academia20
|
|
70
|
+
|
|
71
|
+
## Hàm ý thiết kế cho hệ tương thích Opus 4.8, GPT-5.5 và Gemini
|
|
72
|
+
|
|
73
|
+
Tôi hiểu “ChatGPT 5.5” ở đây theo nghĩa model GPT-5.5 trong tài liệu chính thức của OpenAI, vì docs hiện dùng tên model ID là `gpt-5.5` và không nêu một model ID riêng gọi là “chatgpt-5.5”. Với mục tiêu xây một orchestration layer chung, đó là cách hiểu thực dụng nhất. citeturn17view1
|
|
74
|
+
|
|
75
|
+
Bảng dưới đây là các ràng buộc và đặc điểm thực dụng nhất khi triển khai cùng một workflow trên ba họ model.
|
|
76
|
+
|
|
77
|
+
| Nền tảng | Ràng buộc và strengths chính | Hệ quả cho workflow |
|
|
78
|
+
|---|---|---|
|
|
79
|
+
| **Claude Opus 4.8** | Anthropic ghi rõ Opus 4.8 có context 1M mặc định, nhưng trên Microsoft Foundry mặc định chỉ 200k; adaptive thinking **không bật mặc định**; với use case coding/agentic nên bắt đầu từ `xhigh` và tối thiểu `high`; nếu chạy `max` hoặc `xhigh` thì nên cấp max output lớn, bắt đầu từ 64k; model thiên về reasoning hơn tool calls, và spawn ít subagent hơn mặc định. citeturn27view3turn27view1turn27view0 | Cần **nói thẳng** khi nào dùng tool, khi nào spawn subagent, khi nào song song, và khi nào không. Opus 4.8 là specialist mạnh, nhưng orchestration tốt phải rất explicit. |
|
|
80
|
+
| **GPT-5.5** | OpenAI docs nêu GPT-5.5 có context 1M, max output 128K, reasoning levels từ `none` tới `xhigh`, tools gồm functions, web search, file search, computer use; reasoning tokens không hiển thị nhưng vẫn tiêu tốn token/context trong lúc chạy; OpenAI khuyến nghị để dành khoảng 25k tokens cho reasoning + outputs khi bắt đầu thử nghiệm. citeturn17view1turn17view2turn17view4 | Rất hợp làm **manager/synthesizer** hoặc orchestrator chính. Cần budgeting token thật chặt, và nên dùng Agents SDK pattern “handoff vs asTool” thay vì prompt mơ hồ. |
|
|
81
|
+
| **Gemini** | Google docs nêu nhiều model Gemini có context 1M+; thinking là dynamic mặc định, có `thinkingLevel`; function calling có các mode `VALIDATED`, `AUTO`, `ANY`, `NONE`; hỗ trợ parallel function calling; managed agents chạy trong Linux sandbox; outbound network mặc định mở, có thể allowlist hoặc disable; Deep Research Agent cần `background=true`, hỗ trợ collaborative planning, MCP và file search. citeturn20view5turn21view4turn20view3turn20view2turn22view0turn23view3turn23view0turn23view1 | Tốt cho **research async**, sandboxed execution và tích hợp tool bên ngoài. Nhưng phải khóa network/tooling chủ động; nếu không, phạm vi hành động mặc định quá rộng cho nhiều use case doanh nghiệp. |
|
|
82
|
+
|
|
83
|
+
Ba nhà cung cấp cũng cho ba “ngôn ngữ prompt” hơi khác nhau. Anthropic ưu tiên rõ ràng, role setting, XML tags, explicit tool guidance và model-specific tuning; OpenAI nghiêng về kết hợp prompt với orchestration primitives trong SDK; Google cho phép system_instruction, AGENTS.md, SKILL.md, tool modes và collaborative planning. Vì vậy, một base prompt đủ tốt phải ở mức trừu tượng vừa phải, còn các “delta prompt” hoặc runtime adapter mới là nơi tối ưu hành vi đặc thù của từng model. citeturn26view0turn29view1turn23view5turn23view6
|
|
84
|
+
|
|
85
|
+
Về memory/state, không nên coi hidden reasoning như bộ nhớ có thể tin cậy. OpenAI nói reasoning tokens không được giữ như history hữu ích cho bước sau; Google chỉ cho thought summaries/thought signatures với mục đích hỗ trợ; Anthropic lại nhấn vào “notes” và file-based memory. Vì vậy, mọi workflow nghiêm túc nên chuẩn hóa state ngoài model bằng một **work ledger** hữu hình: plan hiện tại, danh sách worker, kết quả đã xác minh, unresolved questions, citations, và danh sách side-effect pending approval. Đây là điểm quan trọng nhất để hệ chạy qua nhiều turn và nhiều model mà không lệ thuộc vào đặc thù hidden state của từng hãng. citeturn17view2turn21view4turn8view0turn29view4
|
|
86
|
+
|
|
87
|
+
## System prompt và workflow đề xuất
|
|
88
|
+
|
|
89
|
+
### Prompt nền tảng đề xuất
|
|
90
|
+
|
|
91
|
+
Đây là một **prompt gốc mới**, lấy cảm hứng từ các pattern đã xác minh, nhưng không sao chép prompt rò rỉ.
|
|
92
|
+
|
|
93
|
+
```xml
|
|
94
|
+
<system>
|
|
95
|
+
<identity>
|
|
96
|
+
You are an orchestrating research-and-execution agent.
|
|
97
|
+
Your job is to produce high-quality, verifiable results by coordinating bounded specialist workers.
|
|
98
|
+
</identity>
|
|
99
|
+
|
|
100
|
+
<core_principles>
|
|
101
|
+
Prefer accuracy over speed when they conflict.
|
|
102
|
+
Keep the main thread clean: do not dump raw logs, raw tool output, or long exploratory notes into the main conversation.
|
|
103
|
+
Never rely on hidden chain-of-thought as shared memory. Use explicit summaries, plans, and state objects.
|
|
104
|
+
Use tools when they materially improve correctness, freshness, or grounding.
|
|
105
|
+
If the task may cause external side effects or touches high-risk domains, stop and require approval or switch to safe mode.
|
|
106
|
+
</core_principles>
|
|
107
|
+
|
|
108
|
+
<orchestration_policy>
|
|
109
|
+
First classify the task into one of:
|
|
110
|
+
research | coding | analysis | retrieval | synthesis | high-risk | mixed.
|
|
111
|
+
If mixed, decompose into bounded subproblems.
|
|
112
|
+
|
|
113
|
+
Create a work plan with:
|
|
114
|
+
- objective
|
|
115
|
+
- deliverable format
|
|
116
|
+
- required evidence
|
|
117
|
+
- tool budget
|
|
118
|
+
- approval requirements
|
|
119
|
+
- context budget
|
|
120
|
+
- stop conditions
|
|
121
|
+
|
|
122
|
+
Spawn specialist workers only when delegation creates clear value:
|
|
123
|
+
- parallel reading or retrieval
|
|
124
|
+
- independent comparisons
|
|
125
|
+
- verification or criticism
|
|
126
|
+
- large-context partitioning
|
|
127
|
+
- specialized tooling
|
|
128
|
+
|
|
129
|
+
Do not spawn workers for trivial work that can be done directly.
|
|
130
|
+
Prefer parallel workers for read-heavy tasks.
|
|
131
|
+
Prefer sequential execution for write-heavy or state-mutating tasks.
|
|
132
|
+
</orchestration_policy>
|
|
133
|
+
|
|
134
|
+
<worker_contract>
|
|
135
|
+
Every worker receives:
|
|
136
|
+
- task_id
|
|
137
|
+
- role
|
|
138
|
+
- objective
|
|
139
|
+
- allowed_tools
|
|
140
|
+
- constraints
|
|
141
|
+
- dependencies
|
|
142
|
+
- output_schema
|
|
143
|
+
|
|
144
|
+
Every worker must return a structured result:
|
|
145
|
+
{
|
|
146
|
+
"task_id": "...",
|
|
147
|
+
"status": "done|blocked|needs_clarification|unsafe",
|
|
148
|
+
"summary": "...",
|
|
149
|
+
"key_facts": [],
|
|
150
|
+
"evidence": [{"source": "...", "claim": "..."}],
|
|
151
|
+
"uncertainties": [],
|
|
152
|
+
"risk_flags": [],
|
|
153
|
+
"recommended_next_actions": []
|
|
154
|
+
}
|
|
155
|
+
|
|
156
|
+
Workers must return distilled findings, not raw internal reasoning.
|
|
157
|
+
</worker_contract>
|
|
158
|
+
|
|
159
|
+
<verification_policy>
|
|
160
|
+
For consequential claims, route at least one verifier/critic pass.
|
|
161
|
+
If sources conflict, surface the disagreement instead of averaging them away.
|
|
162
|
+
If evidence is weak, say so explicitly.
|
|
163
|
+
</verification_policy>
|
|
164
|
+
|
|
165
|
+
<context_policy>
|
|
166
|
+
Maintain a visible work ledger:
|
|
167
|
+
- current_plan
|
|
168
|
+
- completed_tasks
|
|
169
|
+
- pending_tasks
|
|
170
|
+
- verified_facts
|
|
171
|
+
- open_questions
|
|
172
|
+
- pending_approvals
|
|
173
|
+
|
|
174
|
+
Compact aggressively:
|
|
175
|
+
- keep requirements, decisions, verified facts, and citations
|
|
176
|
+
- discard noisy logs after summarizing them
|
|
177
|
+
- when context is large, summarize each branch before synthesis
|
|
178
|
+
</context_policy>
|
|
179
|
+
|
|
180
|
+
<safety_policy>
|
|
181
|
+
Never provide disallowed harmful instructions.
|
|
182
|
+
Place validation at the tool boundary.
|
|
183
|
+
Require approval before:
|
|
184
|
+
- file mutation
|
|
185
|
+
- network actions outside allowlist
|
|
186
|
+
- transactions
|
|
187
|
+
- sending messages
|
|
188
|
+
- executing dangerous code
|
|
189
|
+
- operating on sensitive data
|
|
190
|
+
If a request is dual-use or policy-sensitive, respond safely, narrow scope, or route to a safer fallback model.
|
|
191
|
+
</safety_policy>
|
|
192
|
+
|
|
193
|
+
<final_answer_policy>
|
|
194
|
+
Final answers should contain:
|
|
195
|
+
- concise executive summary
|
|
196
|
+
- main findings
|
|
197
|
+
- uncertainty notes
|
|
198
|
+
- citations or evidence references
|
|
199
|
+
- recommended next actions, if useful
|
|
200
|
+
Provide brief progress updates during long runs, but do not narrate every micro-step.
|
|
201
|
+
</final_answer_policy>
|
|
202
|
+
</system>
|
|
203
|
+
```
|
|
204
|
+
|
|
205
|
+
Prompt này bám rất sát những gì cả ba ecosystem đều hỗ trợ tốt: Anthropic thích XML, explicit delegation và tool guidance; OpenAI hỗ trợ manager–specialist boundary rõ ràng; Google hỗ trợ system_instruction + file/skill mounting + collaborative planning. citeturn26view0turn27view1turn27view0turn29view1turn23view5turn23view6
|
|
206
|
+
|
|
207
|
+
### Workflow điều phối đề xuất
|
|
208
|
+
|
|
209
|
+
Quy trình thực thi nên đi theo các bước dưới đây.
|
|
210
|
+
|
|
211
|
+
1. **Intake và phân loại rủi ro.** Manager xác định nhiệm vụ là research, coding, synthesis, mixed hay high-risk; đồng thời đặt deliverable contract và lựa chọn adapter theo model. Với yêu cầu có khả năng mới/động, manager ưu tiên web/retrieval thay vì trả lời từ memory. Điều này phù hợp với rulebooks chính thức của Anthropic, OpenAI và Google về current/fresh information, tools và agent planning. citeturn8view2turn16view0turn22view0
|
|
212
|
+
|
|
213
|
+
2. **Lập kế hoạch có cấu trúc.** Đối với bài toán lớn, manager tạo plan trước khi chạy. Nếu dùng Gemini Deep Research, có thể bật collaborative_planning để người dùng duyệt plan trước khi execution; với GPT-5.5 hoặc Opus 4.8 không có primitive y hệt, plan này nên được dựng ở application layer bằng một “planning pass” đầu tiên. citeturn23view0turn29view1
|
|
214
|
+
|
|
215
|
+
3. **Fan-out sang worker read-only hoặc bounded specialists.** Các công việc như đọc nhiều tài liệu, tra cứu nhiều nguồn, tách một corpus dài, hay so sánh nhiều phương án nên được song song hóa; việc sửa file, ghi DB, gửi email hay side-effect khác phải đi tuần tự. Cả Anthropic và OpenAI đều nhấn mạnh giá trị của parallel tool/agent calls cho read-heavy work, còn OpenAI cảnh báo ghi song song dễ tạo xung đột. citeturn26view0turn30view4
|
|
216
|
+
|
|
217
|
+
4. **Chuẩn hóa kết quả worker.** Mỗi worker chỉ được trả về summary + evidence + uncertainty + risk flags theo schema chuẩn. Không đưa raw chain-of-thought, không đưa toàn bộ command logs lên main thread. Đây là cơ chế giảm context rot mạnh nhất và là điểm then chốt để chạy cùng lúc trên nhiều provider. citeturn30view4turn17view2turn21view4
|
|
218
|
+
|
|
219
|
+
5. **Critic/verifier pass.** Một worker độc lập hoặc chính manager ở chế độ verifier so chéo các results, tìm mâu thuẫn, phát hiện “early commitment” hay nguồn yếu. Đây là lớp nên có đối với mọi tác vụ mà sai số không chấp nhận được. citeturn5academia14turn29view1
|
|
220
|
+
|
|
221
|
+
6. **Safety gate và approval gate.** Trước mỗi side effect hoặc khi rơi vào vùng dual-use, workflow dừng ở approval boundary. OpenAI có primitives chính thức cho approvals và resumable state; Gemini có background state trong Interactions/managed agents; với Anthropic cần tự cài ở app/tool layer. citeturn29view2turn29view4turn23view0turn22view0
|
|
222
|
+
|
|
223
|
+
7. **Synthesis cuối.** Manager tạo câu trả lời cuối từ verified facts và citations, đồng thời lưu work ledger đã compacted cho turn sau. Người dùng chỉ thấy plan đã duyệt, tiến độ ở mức hợp lý, kết quả, uncertainty và references; họ không cần thấy toàn bộ nội bộ reasoning. citeturn29view4turn26view0
|
|
224
|
+
|
|
225
|
+
```mermaid
|
|
226
|
+
flowchart TD
|
|
227
|
+
A[Yêu cầu người dùng] --> B[Intake + phân loại rủi ro]
|
|
228
|
+
B --> C[Lập kế hoạch và budget]
|
|
229
|
+
C --> D{Cần chia việc?}
|
|
230
|
+
D -- Không --> E[Manager xử lý trực tiếp]
|
|
231
|
+
D -- Có --> F[Spawn worker read-only hoặc bounded specialists]
|
|
232
|
+
F --> G[Worker trả summary có cấu trúc]
|
|
233
|
+
G --> H[Critic hoặc verifier so chéo]
|
|
234
|
+
E --> H
|
|
235
|
+
H --> I{Có side effect hoặc rủi ro cao?}
|
|
236
|
+
I -- Có --> J[Approval hoặc fallback safe mode]
|
|
237
|
+
I -- Không --> K[Synthesis cuối]
|
|
238
|
+
J --> K
|
|
239
|
+
K --> L[Lưu work ledger đã compact]
|
|
240
|
+
L --> M[Trả kết quả có chứng cứ]
|
|
241
|
+
```
|
|
242
|
+
|
|
243
|
+
### Cơ chế fallback và an toàn
|
|
244
|
+
|
|
245
|
+
Hệ tối thiểu nên có bốn fallback.
|
|
246
|
+
|
|
247
|
+
Thứ nhất là **capability fallback**: nếu model chính không nên trả lời vì guardrail classifier, do policy, hoặc vì tool surface không phù hợp, route sang model ít quyền hơn nhưng an toàn hơn, đúng tinh thần Fable 5 → Opus 4.8. citeturn8view0
|
|
248
|
+
|
|
249
|
+
Thứ hai là **context fallback**: khi tiến gần ngưỡng context, thay vì tiếp tục append transcript, hệ buộc compact thành ledger summaries. Điều này đặc biệt quan trọng với GPT-5.5 vì reasoning tokens vẫn ăn budget, và với mọi workflow multi-agent vì context rot. citeturn17view2turn30view4
|
|
250
|
+
|
|
251
|
+
Thứ ba là **tool fallback**: nếu network không cần thiết, disable mạng; nếu cần, allowlist domain; nếu tool external quá rộng, giới hạn allowed tools hoặc dùng function mode chặt hơn như `VALIDATED` hoặc `ANY` tuỳ mục đích trên Gemini, hay `needsApproval` trên OpenAI. citeturn23view3turn20view3turn29view2
|
|
252
|
+
|
|
253
|
+
Thứ tư là **leak fallback**: đừng cố giấu mọi thứ bằng một prompt khổng lồ. Thay vào đó, đưa thông tin theo nguyên tắc need-to-know, lọc output sau sinh, và thường xuyên audit prompt/output. Cả Anthropic docs lẫn các paper về PLeak/SysVec đều ủng hộ hướng giảm nội dung nhạy cảm trong prompt và thêm lớp defensive post-processing. citeturn28view0turn5academia16turn5academia23
|
|
254
|
+
|
|
255
|
+
## Biến thể theo model, ca kiểm thử và kiểm soát rủi ro
|
|
256
|
+
|
|
257
|
+
### Biến thể prompt theo từng model
|
|
258
|
+
|
|
259
|
+
| Model | Delta prompt nên thêm | Vì sao |
|
|
260
|
+
|---|---|---|
|
|
261
|
+
| **Claude Opus 4.8** | “Use tools when they materially improve correctness. Spawn subagents only for parallel read-heavy work. At high-complexity tasks, prefer `xhigh` effort. If using adaptive thinking, only trigger it for multi-step reasoning. Provide concise progress updates.” citeturn27view3turn27view1turn27view0 | Opus 4.8 literal hơn, ưu tiên reasoning hơn tool calls, và spawn ít subagent mặc định. |
|
|
262
|
+
| **GPT-5.5** | “The manager stays responsible for the final answer unless a handoff is explicitly required. Prefer specialists as tools for bounded tasks. Keep state resumable. Reserve context headroom for reasoning.” citeturn29view1turn29view4turn17view2 | GPT-5.5 có primitives orchestration tốt nhất ở SDK/runtime; prompt nên bám kiến trúc đó. |
|
|
263
|
+
| **Gemini** | “If the task is large or research-heavy, produce a plan first. Use background execution for long runs. Keep network disabled unless allowlisted. Use collaborative planning when scope is uncertain. Use AGENTS.md/SKILL.md for reusable behavior and tools.” citeturn23view0turn23view3turn23view5turn23view6turn22view0 | Gemini mạnh về async research và managed agent sandbox, nhưng cần kiểm soát network/tooling chặt hơn. |
|
|
264
|
+
|
|
265
|
+
### Ca kiểm thử khuyến nghị
|
|
266
|
+
|
|
267
|
+
| Test case | Hành vi mong đợi | Tiêu chí pass |
|
|
268
|
+
|---|---|---|
|
|
269
|
+
| **Deep research có web + tài liệu nội bộ** | Manager lập plan, spawn 2–4 worker: web researcher, document extractor, verifier, synthesizer. Nếu dùng Gemini có thể dùng collaborative planning trước khi chạy. citeturn23view0turn29view1 | Báo cáo có cấu trúc, có citations, nêu rõ uncertainties, không tràn log vào câu trả lời cuối. |
|
|
270
|
+
| **Codebase review read-only** | Worker song song cho security, test gaps, maintainability; không ghi file; critic hợp nhất. Pattern này gần ví dụ chính thức của Codex. citeturn30view4 | Tạo findings theo category, file references rõ, không conflict write. |
|
|
271
|
+
| **Tác vụ có side effect** | Model đề xuất action nhưng dừng ở approval gate; resume từ state sau khi duyệt. citeturn29view2turn29view4 | Không có side effect nào chạy trước approval. |
|
|
272
|
+
| **Truy vấn dual-use hoặc policy-sensitive** | Safety router route sang safe mode hoặc fallback model; không trả hướng dẫn gây hại. Fable 5 dùng chính pattern này với Opus 4.8. citeturn8view0 | Câu trả lời an toàn, có ích ở mức được phép, nêu giới hạn rõ ràng. |
|
|
273
|
+
| **Corpus rất dài** | Chia tài liệu theo shard, mỗi worker trả takeaway + citations, manager chỉ giữ ledger ngắn gọn. citeturn30view4turn20view5 | Không có context collapse, chất lượng synthesis ổn định. |
|
|
274
|
+
|
|
275
|
+
### Rủi ro, misuse và giảm thiểu
|
|
276
|
+
|
|
277
|
+
| Rủi ro | Mô tả | Giảm thiểu |
|
|
278
|
+
|---|---|---|
|
|
279
|
+
| **Prompt leak / policy exfiltration** | Worker hoặc user cố kéo lộ system prompt, policy, credentials, hidden instructions. PLeak cho thấy đây là class attack thực. citeturn5academia16turn28view0 | Need-to-know prompts, output screening, prompt audits, không nhét bí mật không cần thiết vào prompt, tách credentials ra khỏi model context. |
|
|
280
|
+
| **Tool abuse / credential overreach** | Managed agent có mạng hoặc tool quá rộng, lạm dụng token/quyền. Gemini mặc định mở outbound network; tool có thể dùng bất kỳ credential được cấp. citeturn22view0turn23view3 | Network allowlist hoặc disable, least-privilege, short-lived tokens, approval on side effects. |
|
|
281
|
+
| **Context pollution / context rot** | Main thread ngập log, stack trace, command output; chất lượng quyết định giảm dần. OpenAI nêu hiện tượng này rất rõ. citeturn30view4 | Worker chỉ trả summary có cấu trúc; context compaction định kỳ; work ledger ngoài model. |
|
|
282
|
+
| **Parallel write conflicts** | Nhiều agent sửa cùng vùng state hoặc codebase. OpenAI khuyên cẩn trọng với write-heavy workflows song song. citeturn30view4 | Chỉ song song cho read-heavy; write theo lock hoặc serialized step. |
|
|
283
|
+
| **Sai tự tin do chốt sớm vào giả thuyết thuận mắt** | Paper bug-rediscovery cho thấy model dễ “early commitment”. citeturn5academia14 | Bắt buộc verifier/critic pass, yêu cầu nêu alternative hypotheses, stress-test nguồn. |
|
|
284
|
+
| **Tin tưởng quá mức vào behavioral safeguards** | Paper về “Unverified Cage” lập luận containment hạ tầng cũng có thể vỡ. citeturn5academia20 | Guardrail ở tool boundary, sandbox boundary, audit logs, formal verification cho infra quan trọng. |
|
|
285
|
+
| **False positives / degraded UX** | Fable guardrails rất chặt, có thể chặn cả yêu cầu lành tính. Anthropic thừa nhận điều này. citeturn8view0turn13news2 | Dùng degrade path thay vì refusal cứng; hiển thị lý do ở mức khái quát; có escalation path cho trusted users. |
|
|
286
|
+
|
|
287
|
+
## Kết luận và giới hạn còn mở
|
|
288
|
+
|
|
289
|
+
Kết luận mạnh nhất của nghiên cứu này là: **điểm đáng học từ Fable 5 không phải một “prompt ma thuật”, mà là kiến trúc điều phối nhiều lớp**. Phần cốt lõi có vẻ là frontier model rất mạnh; phần tạo nên sản phẩm vận hành được là safety router, memory discipline, bounded subagenting, structured summaries, resumable state, approvals và tool/network governance. Điều này khớp cùng lúc với Anthropic public materials, với docs mới của OpenAI về handoffs/asTool/state/approvals, và với Google managed agents/Deep Research/collaborative planning. citeturn8view0turn9view0turn29view1turn29view2turn29view4turn22view0turn23view0
|
|
290
|
+
|
|
291
|
+
Nếu phải triển khai ngay một hệ tương đương đa nền tảng, tôi sẽ chọn **GPT-5.5 làm manager/synthesizer**, **Claude Opus 4.8 làm deep specialist cho coding/analysis**, và **Gemini làm async research runner hoặc sandboxed execution surface**. Nhưng cùng một design vẫn có thể chạy đơn nền tảng nếu giữ được năm bất biến: plan-first, bounded workers, structured worker schema, explicit safety/approval boundaries, và work ledger ngoài model. Đây là phần “portable architecture” thực sự. citeturn17view1turn29view1turn27view3turn23view0turn22view0
|
|
292
|
+
|
|
293
|
+
Giới hạn chính của báo cáo là hai điểm. Thứ nhất, tôi không xác minh được một bộ thread Reddit/Hacker News/X nguyên bản, giàu chi tiết kỹ thuật về sub-agent coordination của Fable 5, trong tập nguồn đã truy xuất; phần “community trace” vì vậy kém đầy đủ hơn mong muốn. Thứ hai, tệp prompt do người dùng cung cấp rất hữu ích như một artefact, nhưng vẫn là nguồn chưa được xác thực công khai; tôi đã dùng nó như tín hiệu thiết kế, không như chứng cứ kết luận. Dù vậy, ngay cả khi bỏ hẳn artefact này ra, các nguồn chính thức vẫn đủ để suy ra một workflow hệ đa tác tử tương đương, an toàn hơn và portable hơn nhiều so với việc cố tái hiện noe exact leaked prompt. fileciteturn0file0 citeturn8view0turn9view0turn26view0turn29view1turn22view0
|
|
@@ -0,0 +1,135 @@
|
|
|
1
|
+
# GEMINI.md — Antigravity v12.5
|
|
2
|
+
|
|
3
|
+
> Rules only. Updated: 2026-05-22
|
|
4
|
+
|
|
5
|
+
---
|
|
6
|
+
|
|
7
|
+
## Identity
|
|
8
|
+
|
|
9
|
+
- Bạn là **Antigravity Orchestrator**.
|
|
10
|
+
- Pragmatic. Regression-averse. Symphony-first. Multi-project.
|
|
11
|
+
|
|
12
|
+
---
|
|
13
|
+
|
|
14
|
+
## Session Protocol
|
|
15
|
+
|
|
16
|
+
> [!CAUTION]
|
|
17
|
+
> MỌI session code/debug/plan PHẢI chạy init chain TRƯỚC action. Bỏ qua = vi phạm.
|
|
18
|
+
|
|
19
|
+
### Init Chain (BẮT BUỘC)
|
|
20
|
+
```
|
|
21
|
+
symphony-orchestrator → awf-session-restore (gitnexus state) → nm-memory-sync → orchestrator → action
|
|
22
|
+
```
|
|
23
|
+
|
|
24
|
+
- **Ngoại lệ:** Câu hỏi đơn giản hoặc user yêu cầu bỏ qua.
|
|
25
|
+
- **Exit Protocol:** Task done → `symphony next` + present "Next steps" (gồm `🧘 Dừng phiên` nếu ≥3 tasks done hoặc xong Gate lớn). nm-memory-sync auto-save. Deploy/push → check in-progress tasks trước.
|
|
26
|
+
- **Context Recovery:** Re-read `.project-identity`, GEMINI.md, chạy `nmem_recall`, thông báo user.
|
|
27
|
+
- **File-Level Guards:** Khi sửa `symphony/**/*.json`, `.project-identity`, hoặc `**/SKILL.md` → Đọc lại SKILL.md tương ứng.
|
|
28
|
+
|
|
29
|
+
---
|
|
30
|
+
|
|
31
|
+
## Rules
|
|
32
|
+
|
|
33
|
+
### Code
|
|
34
|
+
- Production quality. File < 500 lines.
|
|
35
|
+
- Không sửa code ngoài scope. Không hardcode secrets → `.env`. Không `git reset --hard`.
|
|
36
|
+
- AI models: Gemini 2.5+ hoặc mới hơn. Firebase: Firebase AI Logic SDK.
|
|
37
|
+
|
|
38
|
+
### Auto-Commit After Build (BẮT BUỘC)
|
|
39
|
+
- Build OK → TỰ ĐỘNG `git add` → `git commit` → `git push`. KHÔNG hỏi user.
|
|
40
|
+
- Commit: conventional format. Push (non-force) SafeToAutoRun=true.
|
|
41
|
+
- Push fail → retry `git pull --rebase && git push` 1 lần. Vẫn fail → báo user, KHÔNG force push.
|
|
42
|
+
|
|
43
|
+
### Command Wrapper & Build Automation
|
|
44
|
+
- Build: CHỈ dùng `awkit build`. CẤM gọi native (`xcodebuild`, `./gradlew`, `npm run build`).
|
|
45
|
+
- `automation.build.enabled: false` → DỪNG, báo user. KHÔNG fallback native.
|
|
46
|
+
- Thêm params qua `--`: `awkit build -- -destination '...'`. Bypass wrapper = VI PHẠM.
|
|
47
|
+
|
|
48
|
+
### 7-Gate System
|
|
49
|
+
- Triage: TRIVIAL (→ Gate 4 thẳng) | MODERATE (→ G3+4+5) | COMPLEX (→ all gates).
|
|
50
|
+
- Gates: G1 brainstorm → G1.5 module-spec (COMPLEX+>3mod) → G2 spec-gate → G2.5 visual (skip nếu backend) → G3 symphony-enforcer → G4 execution → G5 verification.
|
|
51
|
+
- **Gate 4 Three-Phase:**
|
|
52
|
+
- Phase A 🏗️ Infrastructure → B 🎨 UI Shell (mock) → C ⚡ Logic (real data).
|
|
53
|
+
- COMPLEX+UI: 3 phases bắt buộc. MODERATE+UI: A+C gộp, B optional. TRIVIAL: bypass.
|
|
54
|
+
- Phase B xong → **DỪNG, chờ "APPROVE UI"**. Gộp B+C = vi phạm.
|
|
55
|
+
- Mỗi feature Phase C xong → checkpoint user test.
|
|
56
|
+
- Kiro: `.kiro/specs/` → auto-accelerate G1,1.5,2,3.
|
|
57
|
+
- **Gate 2 Claude Planner (New):** Khi Gate 2 (Spec/Architecture Planning) kích hoạt cho MODERATE hoặc COMPLEX tasks, AI tự động chạy `claude-planner` bằng cách gọi `scripts/claude-plan.js`. Nếu Claude CLI chưa cài hoặc hết hạn (lệnh lỗi), AI tự động bỏ qua và sử dụng mô hình hiện tại để lập kế hoạch một cách bình thường.
|
|
58
|
+
- Sửa schema/UI ngoài approved design → ⛔ DỪNG quay G2/2.5.
|
|
59
|
+
- Chi tiết: `orchestrator/SKILL.md` + `symphony-enforcer/SKILL.md`.
|
|
60
|
+
|
|
61
|
+
### Mindful Stop
|
|
62
|
+
- Iterate ≥3 lần trên 1 feature → DỪNG: "⏸️ Đề xuất commit và trải nghiệm thực tế."
|
|
63
|
+
- Keywords [polish, optimize, refine, tối ưu, tweak] → hỏi "Vấn đề cụ thể? Hay phòng ngừa?" → không rõ → backlog P2.
|
|
64
|
+
- ≥3 tasks done hoặc xong Gate lớn → suggest "🧘 Dừng phiên".
|
|
65
|
+
- KHÔNG tự đề xuất tối ưu trừ security/crash bug.
|
|
66
|
+
|
|
67
|
+
### NeuralMemory
|
|
68
|
+
- Brain = projectId. PHẢI switch brain TRƯỚC mọi nmem call.
|
|
69
|
+
- `nmem_remember()` tag projectId. Cross-brain: `nmem_recall(query, brains=["default", projectId])`.
|
|
70
|
+
|
|
71
|
+
### Anti-Yapping & Token Optimization
|
|
72
|
+
- Sau khi dùng tool sửa code → KHÔNG in lại code trong chat. Tóm tắt bằng bullets.
|
|
73
|
+
- Code block trong chat: tối đa 10 dòng. Show diff → dùng `render_diffs()`.
|
|
74
|
+
|
|
75
|
+
### Image Generation Efficiency
|
|
76
|
+
- Image gen: grid/spritesheet cho batch variants, không gen từng ảnh rời.
|
|
77
|
+
|
|
78
|
+
### Communication (CAVEMAN ULTRA)
|
|
79
|
+
- Chat: Tiếng Việt, tối đa 1-2 câu ngắn. Code/Docs: Tiếng Anh.
|
|
80
|
+
- CẤM giải thích dài, chào hỏi. Chỉ xuất KẾT QUẢ.
|
|
81
|
+
- Planning artifacts (implementation_plan.md, walkthrough.md) VẪN chi tiết theo format chuẩn.
|
|
82
|
+
- Tài liệu thảo luận & brainstorm (Brief, Requirements, Brainstorm) PHẢI dùng tiếng Việt (hoặc ngôn ngữ giao tiếp của User), chỉ Code/Architecture mới bắt buộc dùng tiếng Anh.
|
|
83
|
+
|
|
84
|
+
### Brainstorm & Plan Integrity (BPIP)
|
|
85
|
+
- CẤM ghi đè (overwrite) toàn bộ BRIEF.md hoặc plan.md khi tinh chỉnh ý tưởng.
|
|
86
|
+
- PHẢI sử dụng công cụ sửa code (replace_file_content) để cập nhật từng phần.
|
|
87
|
+
- PHẢI duy trì bảng Revision History ở đầu mỗi file design/planning.
|
|
88
|
+
- PHẢI lưu bản sao dự phòng vào `docs/history/` trước khi sửa đổi lớn (định dạng `[filename].v[N].md`, ví dụ: `implementation_plan.v1.md`).
|
|
89
|
+
|
|
90
|
+
|
|
91
|
+
### Anti-sycophancy
|
|
92
|
+
- Push back khi approach có vấn đề. Nêu ưu+nhược, không chỉ list ưu điểm.
|
|
93
|
+
- Cảnh báo TRƯỚC khi implement nếu vi phạm best practices. Nói "Tôi không chắc" khi không chắc.
|
|
94
|
+
|
|
95
|
+
### Safety Guardrails
|
|
96
|
+
- CẤM SafeToAutoRun cho: recursive delete (`rm -rf`), force push, `DROP/DELETE` (no WHERE), docker prune, publish, deploy production.
|
|
97
|
+
- Commit: CHỈ qua `awkit gate git auto`. CẤM `git commit` trực tiếp qua bash.
|
|
98
|
+
- Destructive command → double-confirm user. Không chắc → hỏi trước.
|
|
99
|
+
|
|
100
|
+
### Mandatory Check-Then-Act Protocol (🔥 BẮT BUỘC)
|
|
101
|
+
- TRƯỚC khi dùng công cụ sửa code/run command lần đầu mỗi task, PHẢI tự trả lời trong `<thought>` (KHÔNG in ra chat):
|
|
102
|
+
1. Init Chain đã chạy?
|
|
103
|
+
2. KIẾN TRÚC: Đã xem CODEBASE.md? Đang sửa Definition (gốc) hay Usage (ngọn)? (Cấm grep bừa bãi).
|
|
104
|
+
3. Sửa symbol lớn? → `gitnexus_impact` trước.
|
|
105
|
+
4. Commit → `awkit gate git auto` only.
|
|
106
|
+
|
|
107
|
+
### Decision Principles
|
|
108
|
+
Complete>Shortcuts, Evidence>Assumptions, Standard>Custom, Explicit>Implicit, Test>Trust, Small>Big, Root>Leaves.
|
|
109
|
+
|
|
110
|
+
### Project Context
|
|
111
|
+
- CODEBASE.md tồn tại → KHÔNG scan raw directory.
|
|
112
|
+
- KHÔNG hỏi user về project structure.
|
|
113
|
+
- CODEBASE.md outdated → ghi chú "⚠️ dùng /codebase-sync".
|
|
114
|
+
|
|
115
|
+
### Tư Duy Kiến Trúc & GitNexus (Anti-Grep-First)
|
|
116
|
+
- **Top-Down:** LUÔN đọc `CODEBASE.md` trước để map requirement vào đúng Layer kiến trúc.
|
|
117
|
+
- **Root > Leaves:** Đổi GIÁ TRỊ → Tìm Definition (gốc: theme, config, entity). CẤM grep blind value ở Usage (ngọn).
|
|
118
|
+
- **GitNexus Graph:** Có Anchor Class → `gitnexus_context` để hiểu luồng, `gitnexus_impact` TRƯỚC KHI sửa.
|
|
119
|
+
- `.gitnexus/` tồn tại → BẮT BUỘC dùng GitNexus. `gitnexus_detect_changes()` trước commit.
|
|
120
|
+
- Chi tiết: `gitnexus-intelligence/SKILL.md`.
|
|
121
|
+
|
|
122
|
+
### Kiro Specs
|
|
123
|
+
- `.kiro/specs/` tồn tại → source of truth: requirements.md (G1+1.5 AUTO-PASS), design.md (G2 AUTO-APPROVE), tasks.md (G3 AUTO-IMPORT).
|
|
124
|
+
- Gate 4 code PHẢI đối chiếu `.kiro/specs/<module>/`. Chi tiết: `orchestrator/SKILL.md`.
|
|
125
|
+
|
|
126
|
+
---
|
|
127
|
+
|
|
128
|
+
## Routing
|
|
129
|
+
|
|
130
|
+
- **Execution order:** `symphony-orchestrator` → `awf-session-restore` (gitnexus state) → `nm-memory-sync` → `symphony-enforcer` → `orchestrator` (triage + gate-check) → action
|
|
131
|
+
- **Gate skills:** `orchestrator` (triage) → `brainstorm-agent` (G1) → `module-spec-writer` (G1.5) → `spec-gate` (G2) → `visual-design-gate` (G2.5) → `symphony-enforcer` (G3) → `verification-gate` (G5)
|
|
132
|
+
- **Code intelligence:** `gitnexus-intelligence` (impact analysis, blast radius, safe refactoring)
|
|
133
|
+
- **Skill catalog:** xem `orchestrator/SKILL.md`
|
|
134
|
+
- **Workflows:** 75+ (`/xxx`). Core: `/init` `/code` `/debug` `/recap` `/next` `/todo` `/gitnexus`
|
|
135
|
+
- **Shortcuts:** `/todo` `/done` `/next`
|
|
@@ -0,0 +1,105 @@
|
|
|
1
|
+
# Brainstorm: Tích hợp Kiến trúc Đa Tác tử và Triết lý Wise Teacher vào Antigravity (AWKit)
|
|
2
|
+
|
|
3
|
+
## Lịch sử Hiệu chỉnh (Revision History)
|
|
4
|
+
|
|
5
|
+
| Phiên bản | Ngày | Người thực hiện | Nội dung thay đổi |
|
|
6
|
+
| :--- | :--- | :--- | :--- |
|
|
7
|
+
| v1.0 | 2026-06-14 | Antigravity Orchestrator | Khởi tạo tài liệu gộp thống nhất cả 3 nghiên cứu: Wise Teacher, Fable 5 Multi-Agent và Antigravity Subagents. |
|
|
8
|
+
|
|
9
|
+
---
|
|
10
|
+
|
|
11
|
+
## Tóm tắt Điều hành (Executive Summary)
|
|
12
|
+
|
|
13
|
+
Tài liệu này đề xuất phương án tối ưu hóa toàn diện Antigravity (AWKit) bằng cách kết hợp:
|
|
14
|
+
1. **Triết lý giảng dạy cuốn chiếu (Wise Teacher):** Đảm bảo user nắm vững Vấn đề (Problem), Giải pháp (Solution), và Bối cảnh (Broader Context).
|
|
15
|
+
2. **Kiến trúc đa tác tử phân lớp (Manager-Workers-Critic-Safety Router):** Chống "Context Rot" và tối ưu hóa hiệu năng theo mô hình của Fable 5.
|
|
16
|
+
3. **Cơ chế Subagents của Antigravity:** Tận dụng tối đa built-in `research` và các custom sub-agents để thực thi an toàn, cô lập ngữ cảnh và nâng cao hiệu quả làm việc.
|
|
17
|
+
|
|
18
|
+
---
|
|
19
|
+
|
|
20
|
+
## 1. Triết lý Giảng dạy Cuốn chiếu (Wise Teacher Protocol)
|
|
21
|
+
|
|
22
|
+
Phương pháp này chuyển đổi hoạt động của Antigravity từ "chỉ bàn giao code" sang "chuyển giao tri thức sâu sắc" cho con người một cách cuốn chiếu (Incremental Learning).
|
|
23
|
+
|
|
24
|
+
```mermaid
|
|
25
|
+
graph TD
|
|
26
|
+
A[Bắt đầu Mục tiêu] --> B[User tự trình bày hiểu biết - Restatement]
|
|
27
|
+
B --> C[AI phân tích & lấp đầy lỗ hổng kiến thức]
|
|
28
|
+
C --> D[Quiz kiểm tra bằng AskUserQuestion]
|
|
29
|
+
D -->|Sai/Chưa hiểu sâu| C
|
|
30
|
+
D -->|Đã Master| E[Đánh dấu hoàn thành mục trong checklist]
|
|
31
|
+
```
|
|
32
|
+
|
|
33
|
+
### 3 Trụ cột Kiến thức Bắt buộc:
|
|
34
|
+
- **The Problem (Vấn đề):** Tại sao vấn đề tồn tại, các nhánh hướng đi để giải quyết.
|
|
35
|
+
- **The Solution (Giải pháp):** Tại sao chọn phương án này, quyết định thiết kế và edge cases.
|
|
36
|
+
- **Broader Context (Bối cảnh rộng):** Tác động lâu dài của thay đổi đối với toàn bộ hệ thống.
|
|
37
|
+
|
|
38
|
+
### Cơ chế Tương tác:
|
|
39
|
+
- **Proactive Restatement:** Buộc user tự tóm tắt trước để AI dò tìm lỗ hổng kiến thức thực tế.
|
|
40
|
+
- **Adaptive Explanations (ELI5 / ELI14 / ELII):** Giải thích linh hoạt từ mức cực kỳ đơn giản (cho khái niệm trừu tượng) tới mức chuyên sâu (cho logic mã nguồn chi tiết).
|
|
41
|
+
- **Interactive Quizzing:** Sử dụng tool `AskUserQuestion` để tạo các câu đố trắc nghiệm (đảo lộn đáp án, ẩn kết quả cho tới khi nộp bài).
|
|
42
|
+
|
|
43
|
+
---
|
|
44
|
+
|
|
45
|
+
## 2. Kiến trúc Điều phối Đa Tác tử (Multi-Agent Control Plane)
|
|
46
|
+
|
|
47
|
+
Dựa trên nghiên cứu về Fable 5 và các tài liệu chính thức từ OpenAI/Google, chúng ta cần tránh việc dồn mọi log thô vào một luồng chat duy nhất (gây ra **Context Rot**). Thay vào đó, thiết lập một Control Plane phân lớp:
|
|
48
|
+
|
|
49
|
+
```mermaid
|
|
50
|
+
graph TD
|
|
51
|
+
Manager[Manager / Synthesizer] -->|1. Phân loại & Định tuyến| Router[Safety Router / Classifier]
|
|
52
|
+
Manager -->|2. Phân rã nhiệm vụ| Workers[Bounded Specialists / Workers]
|
|
53
|
+
Workers -->|3. Trả kết quả tóm tắt| Critic[Critic / Verifier Pass]
|
|
54
|
+
Critic -->|4. Phản biện & Đối chiếu| Manager
|
|
55
|
+
Manager -->|5. Cập nhật| Ledger[External Work Ledger]
|
|
56
|
+
```
|
|
57
|
+
|
|
58
|
+
### Các Thành phần Cốt lõi:
|
|
59
|
+
1. **Manager (Trình điều phối):** Giữ bối cảnh điều hành chính, phân rã công việc và tổng hợp kết quả cuối cùng.
|
|
60
|
+
2. **Workers (Tác tử chuyên biệt):** Chỉ thực hiện các tác vụ đọc-ghi trong ranh giới được chỉ định, chỉ trả về **Structured Summary JSON** thay vì log thô.
|
|
61
|
+
3. **Critic / Verifier:** So chéo kết quả, phát hiện mâu thuẫn, ngăn ngừa việc AI "chốt quá sớm" vào các giả thuyết sai (early commitment).
|
|
62
|
+
4. **Safety Router:** Nhận diện các tác vụ nguy cơ cao (cyber, database write) để định tuyến sang degraded mode hoặc kích hoạt cổng phê duyệt (Approval Gate).
|
|
63
|
+
5. **External Work Ledger:** Sổ ghi chép trạng thái ngoài model (lưu tại `.brain/session.json`) giúp khôi phục ngữ cảnh (resumable state) trên mọi họ mô hình (Claude, GPT, Gemini).
|
|
64
|
+
|
|
65
|
+
---
|
|
66
|
+
|
|
67
|
+
## 3. Hiện thực hóa bằng Cơ chế Subagents của Antigravity
|
|
68
|
+
|
|
69
|
+
Chúng ta ứng dụng trực tiếp tài liệu hướng dẫn của Google Antigravity 2.0 để cấu trúc các vai trò trên:
|
|
70
|
+
|
|
71
|
+
```mermaid
|
|
72
|
+
sequenceDiagram
|
|
73
|
+
autonumber
|
|
74
|
+
actor User
|
|
75
|
+
participant Manager as Manager (Orchestrator)
|
|
76
|
+
participant Research as Research Agent (Built-in)
|
|
77
|
+
participant Critic as Critic Agent (Custom)
|
|
78
|
+
|
|
79
|
+
User->>Manager: Yêu cầu task COMPLEX
|
|
80
|
+
Manager->>Research: invoke_subagent (Quét codebase cô lập)
|
|
81
|
+
Research-->>Manager: Trả về Structured Summary JSON (Idle)
|
|
82
|
+
Note over Manager: Xây dựng giải pháp
|
|
83
|
+
Manager->>Critic: invoke_subagent (Yêu cầu review chéo)
|
|
84
|
+
Critic-->>Manager: Trả về Báo cáo lỗi tiềm ẩn & phản biện (Idle)
|
|
85
|
+
Note over Manager: Điều chỉnh giải pháp hoàn thiện
|
|
86
|
+
Manager->>User: Trình bày giải pháp cuối cùng kèm minh chứng
|
|
87
|
+
```
|
|
88
|
+
|
|
89
|
+
### Cách thức Triển khai cụ thể:
|
|
90
|
+
- **Tận dụng Built-in `research`:** Dùng cho mọi tác vụ tìm kiếm codebase hoặc đọc file lớn. Session tìm kiếm thô sẽ tự giải phóng khi subagent hoàn thành, giữ cho context chính cực sạch.
|
|
91
|
+
- **Định nghĩa Custom `critic` qua `define_subagent`:**
|
|
92
|
+
- Thiết lập `system_prompt` hướng tới việc rà soát lỗi logic, stress-test các giả thuyết.
|
|
93
|
+
- Cấu hình **Read-Only** tools để bảo vệ codebase khỏi việc ghi đè vô ý.
|
|
94
|
+
- **Định nghĩa Custom `safety-router`:** Phân loại các hành động có side-effect (ví dụ: mutated file, write database, outbound network). Sử dụng tính năng interruption của Antigravity để dừng luồng và xin phê duyệt từ user (Approval Boundary).
|
|
95
|
+
- **Giao tiếp qua Tin nhắn (Inter-Agent Messaging):** Tận dụng trạng thái `Idle` và cơ chế thức tỉnh khi nhận tin nhắn để duy trì các sub-agents chạy ngầm trong suốt phiên làm việc, tránh khởi tạo lại nhiều lần gây hao phí token.
|
|
96
|
+
|
|
97
|
+
---
|
|
98
|
+
|
|
99
|
+
## 4. Kịch bản Kiểm thử & Đánh giá (Verification Cases)
|
|
100
|
+
|
|
101
|
+
| Kịch bản | Cách thức thực thi | Tiêu chí Đạt (Pass Criteria) |
|
|
102
|
+
| :--- | :--- | :--- |
|
|
103
|
+
| **Deep Research & Code Review** | Manager spawn `research` để tìm codebase, sau đó spawn 2 `critic` song song để review độc lập. | Báo cáo cuối đầy đủ bằng chứng, không lẫn log thô của `research`. |
|
|
104
|
+
| **Approval Boundary Test** | Thực thi một câu lệnh ghi đè file nhạy cảm. | Hệ thống bắt buộc phải kích hoạt `safety-router`, tạm dừng tiến trình và hiển thị yêu cầu Approve rõ ràng cho User. |
|
|
105
|
+
| **Wise Teacher Checkpoint** | Kích hoạt `/teach` sau một gate lớn. | Tạo thành công checklist học tập tại `.brain/teach_checklist.md`, hỏi user restate và đặt câu hỏi qua `AskUserQuestion`. |
|
|
@@ -0,0 +1,58 @@
|
|
|
1
|
+
# Add Game Development Skills (Unity, Godot, Expo)
|
|
2
|
+
|
|
3
|
+
Implement dedicated game development skills inside `main-awf/skills` to enhance the orchestrator's capability in building games using Unity, Godot, and Expo.
|
|
4
|
+
|
|
5
|
+
## User Review Required
|
|
6
|
+
|
|
7
|
+
> [!NOTE]
|
|
8
|
+
> All new skills will be created directly in `skills/` of `main-awf` workspace and then deployed to `~/.gemini/antigravity` via `awkit install`.
|
|
9
|
+
|
|
10
|
+
## Proposed Changes
|
|
11
|
+
|
|
12
|
+
### AWKit Skills
|
|
13
|
+
|
|
14
|
+
---
|
|
15
|
+
|
|
16
|
+
#### [NEW] [unity-game-development/SKILL.md](file:///Users/trungkientn/Dev/NodeJS/main-awf/skills/unity-game-development/SKILL.md)
|
|
17
|
+
Contains high-density instructions for Unity game development, enforcing:
|
|
18
|
+
- C# coding style (PascalCase public, camelCase private, `m_` fields prefix).
|
|
19
|
+
- Component-based architecture and ScriptableObjects for data-driven game structures.
|
|
20
|
+
- Performance optimization: avoiding `Find`/`GetComponent` in hot paths (`Update()`), caching, object pooling.
|
|
21
|
+
- Separate Editor code via `#if UNITY_EDITOR`.
|
|
22
|
+
- Direct Unity MCP server integration.
|
|
23
|
+
|
|
24
|
+
#### [NEW] [godot-game-development/SKILL.md](file:///Users/trungkientn/Dev/NodeJS/main-awf/skills/godot-game-development/SKILL.md)
|
|
25
|
+
Contains guidelines for Godot 4.x game development, enforcing:
|
|
26
|
+
- Godot 4 API standards (rejecting Godot 3 syntax).
|
|
27
|
+
- GDScript style preferences (`@export`, `@onready`, `await` signals).
|
|
28
|
+
- Composition-first scene tree structure over deep class inheritance.
|
|
29
|
+
- Signal connection best practices (`signal.connect(callback)`).
|
|
30
|
+
- Physics and locomotion handling via parameterless `move_and_slide()`.
|
|
31
|
+
|
|
32
|
+
#### [NEW] [expo-game-development/SKILL.md](file:///Users/trungkientn/Dev/NodeJS/main-awf/skills/expo-game-development/SKILL.md)
|
|
33
|
+
Contains instructions for Expo/React Native game development, covering:
|
|
34
|
+
- High-frequency drawing techniques (React Native Skia, Expo GL/Three.js).
|
|
35
|
+
- State optimization: keeping physics/game tick loop decoupled from heavy React re-renders.
|
|
36
|
+
- User input handling (React Native Gesture Handler).
|
|
37
|
+
- Game loop implementations using `requestAnimationFrame`.
|
|
38
|
+
- Asset management and sound effects via `expo-av`.
|
|
39
|
+
|
|
40
|
+
---
|
|
41
|
+
|
|
42
|
+
#### [MODIFY] [CATALOG.md](file:///Users/trungkientn/Dev/NodeJS/main-awf/skills/CATALOG.md)
|
|
43
|
+
Add the three new skills to the active skills table.
|
|
44
|
+
|
|
45
|
+
#### [MODIFY] [TRIGGER_INDEX.md](file:///Users/trungkientn/Dev/NodeJS/main-awf/skills/TRIGGER_INDEX.md)
|
|
46
|
+
Register keywords and triggers for the new game skills.
|
|
47
|
+
|
|
48
|
+
---
|
|
49
|
+
|
|
50
|
+
## Verification Plan
|
|
51
|
+
|
|
52
|
+
### Automated Verification
|
|
53
|
+
- Run `awkit status` to inspect mapping diffs.
|
|
54
|
+
- Deploy to runtime using `awkit install`.
|
|
55
|
+
- Verify CLI integration and syntax using `awkit doctor`.
|
|
56
|
+
|
|
57
|
+
### Manual Verification
|
|
58
|
+
- Ask the user to verify the added skills locally or confirm availability in future workspace tasks.
|