PyPI - devflow-engine - Versions diffs - 1.0.0__py3-none-any.whl - Mend

devflow-engine 1.0.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (393) hide show

devflow_engine/__init__.py +3 -0
devflow_engine/agentic_prompts.py +100 -0
devflow_engine/agentic_runtime.py +398 -0
devflow_engine/api_key_flow_harness.py +539 -0
devflow_engine/api_keys.py +357 -0
devflow_engine/bootstrap/__init__.py +2 -0
devflow_engine/bootstrap/provision_from_template.py +84 -0
devflow_engine/cli/__init__.py +0 -0
devflow_engine/cli/app.py +7270 -0
devflow_engine/core/__init__.py +0 -0
devflow_engine/core/config.py +86 -0
devflow_engine/core/logging.py +29 -0
devflow_engine/core/paths.py +45 -0
devflow_engine/core/toml_kv.py +33 -0
devflow_engine/devflow_event_worker.py +1292 -0
devflow_engine/devflow_state.py +201 -0
devflow_engine/devin2/__init__.py +9 -0
devflow_engine/devin2/agent_definition.py +120 -0
devflow_engine/devin2/pi_runner.py +204 -0
devflow_engine/devin_orchestration.py +69 -0
devflow_engine/docs/prompts/anti-patterns.md +42 -0
devflow_engine/docs/prompts/devin-agent-prompt.md +55 -0
devflow_engine/docs/prompts/devin2-agent-prompt.md +81 -0
devflow_engine/docs/prompts/examples/devin-vapi-clone-reference-exchange.json +85 -0
devflow_engine/doctor/__init__.py +2 -0
devflow_engine/doctor/triage.py +140 -0
devflow_engine/error/__init__.py +0 -0
devflow_engine/error/remediation.py +21 -0
devflow_engine/errors/error_solver_dag.py +522 -0
devflow_engine/errors/runtime_observability.py +67 -0
devflow_engine/idea/__init__.py +4 -0
devflow_engine/idea/actors.py +481 -0
devflow_engine/idea/agentic.py +465 -0
devflow_engine/idea/analyze.py +93 -0
devflow_engine/idea/devin_chat_dag.py +1 -0
devflow_engine/idea/diff.py +99 -0
devflow_engine/idea/drafts.py +446 -0
devflow_engine/idea/idea_creation_dag.py +643 -0
devflow_engine/idea/ideation_enrichment.py +355 -0
devflow_engine/idea/ideation_enrichment_worker.py +19 -0
devflow_engine/idea/paths.py +28 -0
devflow_engine/idea/promote.py +53 -0
devflow_engine/idea/redaction.py +27 -0
devflow_engine/idea/repo_tools.py +1277 -0
devflow_engine/idea/response_mode.py +30 -0
devflow_engine/idea/story_pipeline.py +1585 -0
devflow_engine/idea/sufficiency.py +376 -0
devflow_engine/idea/traditional_stories.py +1257 -0
devflow_engine/implementation/__init__.py +0 -0
devflow_engine/implementation/alembic_preflight.py +700 -0
devflow_engine/implementation/dag.py +8450 -0
devflow_engine/implementation/green_gate.py +93 -0
devflow_engine/implementation/prompts.py +108 -0
devflow_engine/implementation/test_runtime.py +623 -0
devflow_engine/integration/__init__.py +19 -0
devflow_engine/integration/agentic.py +66 -0
devflow_engine/integration/dag.py +3539 -0
devflow_engine/integration/prompts.py +114 -0
devflow_engine/integration/supabase_schema.sql +31 -0
devflow_engine/integration/supabase_sync.py +177 -0
devflow_engine/llm/__init__.py +1 -0
devflow_engine/llm/cli_one_shot.py +84 -0
devflow_engine/llm/cli_stream.py +371 -0
devflow_engine/llm/execution_context.py +26 -0
devflow_engine/llm/invoke.py +1322 -0
devflow_engine/llm/provider_api.py +304 -0
devflow_engine/llm/repo_knowledge.py +588 -0
devflow_engine/llm_primitives.py +315 -0
devflow_engine/orchestration.py +62 -0
devflow_engine/planning/__init__.py +0 -0
devflow_engine/planning/analyze_repo.py +92 -0
devflow_engine/planning/render_drafts.py +133 -0
devflow_engine/playground/__init__.py +0 -0
devflow_engine/playground/hooks.py +26 -0
devflow_engine/playwright_workflow/__init__.py +5 -0
devflow_engine/playwright_workflow/dag.py +1317 -0
devflow_engine/process/__init__.py +5 -0
devflow_engine/process/dag.py +59 -0
devflow_engine/project_registration/__init__.py +3 -0
devflow_engine/project_registration/dag.py +1581 -0
devflow_engine/project_registry.py +109 -0
devflow_engine/prompts/devin/generic/prompt.md +6 -0
devflow_engine/prompts/devin/ideation/prompt.md +263 -0
devflow_engine/prompts/devin/ideation/scenarios.md +5 -0
devflow_engine/prompts/devin/ideation_loop/prompt.md +6 -0
devflow_engine/prompts/devin/insight/prompt.md +11 -0
devflow_engine/prompts/devin/insight/scenarios.md +5 -0
devflow_engine/prompts/devin/intake/prompt.md +15 -0
devflow_engine/prompts/devin/iterate/prompt.md +12 -0
devflow_engine/prompts/devin/shared/eval_doctrine.md +9 -0
devflow_engine/prompts/devin/shared/principles.md +246 -0
devflow_engine/prompts/devin_eval/assessment/prompt.md +18 -0
devflow_engine/prompts/idea/api_ideation_agent/prompt.md +8 -0
devflow_engine/prompts/idea/api_insight_agent/prompt.md +8 -0
devflow_engine/prompts/idea/response_doctrine/prompt.md +18 -0
devflow_engine/prompts/implementation/dependency_assessment/prompt.md +12 -0
devflow_engine/prompts/implementation/green/green/prompt.md +11 -0
devflow_engine/prompts/implementation/green/node_config/prompt.md +3 -0
devflow_engine/prompts/implementation/green_review/outcome_review/prompt.md +5 -0
devflow_engine/prompts/implementation/green_review/prior_run_review/prompt.md +5 -0
devflow_engine/prompts/implementation/red/prompt.md +27 -0
devflow_engine/prompts/implementation/redreview/prompt.md +23 -0
devflow_engine/prompts/implementation/redreview_repair/prompt.md +16 -0
devflow_engine/prompts/implementation/setupdoc/prompt.md +10 -0
devflow_engine/prompts/implementation/story_planning/prompt.md +13 -0
devflow_engine/prompts/implementation/test_design/prompt.md +27 -0
devflow_engine/prompts/integration/README.md +185 -0
devflow_engine/prompts/integration/green/example.md +67 -0
devflow_engine/prompts/integration/green/green/prompt.md +10 -0
devflow_engine/prompts/integration/green/node_config/prompt.md +42 -0
devflow_engine/prompts/integration/green/past_prompts/20260417T212300/green/prompt.md +15 -0
devflow_engine/prompts/integration/green/past_prompts/20260417T212300/node_config/prompt.md +42 -0
devflow_engine/prompts/integration/green_enrich/example.md +79 -0
devflow_engine/prompts/integration/green_enrich/green_enrich/prompt.md +9 -0
devflow_engine/prompts/integration/green_enrich/node_config/prompt.md +41 -0
devflow_engine/prompts/integration/green_enrich/past_prompts/20260417T212300/green_enrich/prompt.md +14 -0
devflow_engine/prompts/integration/green_enrich/past_prompts/20260417T212300/node_config/prompt.md +41 -0
devflow_engine/prompts/integration/red/code_repair/prompt.md +12 -0
devflow_engine/prompts/integration/red/example.md +152 -0
devflow_engine/prompts/integration/red/node_config/prompt.md +86 -0
devflow_engine/prompts/integration/red/past_prompts/20260417T212300/code_repair/prompt.md +19 -0
devflow_engine/prompts/integration/red/past_prompts/20260417T212300/node_config/prompt.md +84 -0
devflow_engine/prompts/integration/red/past_prompts/20260417T212300/red/prompt.md +16 -0
devflow_engine/prompts/integration/red/past_prompts/20260417T212300/red_repair/prompt.md +15 -0
devflow_engine/prompts/integration/red/past_prompts/20260417T215032/code_repair/prompt.md +10 -0
devflow_engine/prompts/integration/red/past_prompts/20260417T215032/node_config/prompt.md +84 -0
devflow_engine/prompts/integration/red/past_prompts/20260417T215032/red_repair/prompt.md +11 -0
devflow_engine/prompts/integration/red/red/prompt.md +11 -0
devflow_engine/prompts/integration/red/red_repair/prompt.md +12 -0
devflow_engine/prompts/integration/red_review/example.md +71 -0
devflow_engine/prompts/integration/red_review/node_config/prompt.md +41 -0
devflow_engine/prompts/integration/red_review/past_prompts/20260417T212300/node_config/prompt.md +41 -0
devflow_engine/prompts/integration/red_review/past_prompts/20260417T212300/red_review/prompt.md +15 -0
devflow_engine/prompts/integration/red_review/red_review/prompt.md +9 -0
devflow_engine/prompts/integration/resolve/example.md +111 -0
devflow_engine/prompts/integration/resolve/node_config/prompt.md +64 -0
devflow_engine/prompts/integration/resolve/past_prompts/20260417T212300/node_config/prompt.md +64 -0
devflow_engine/prompts/integration/resolve/past_prompts/20260417T212300/resolve_implicated_users/prompt.md +15 -0
devflow_engine/prompts/integration/resolve/past_prompts/20260417T212300/resolve_side_effects/prompt.md +15 -0
devflow_engine/prompts/integration/resolve/resolve_implicated_users/prompt.md +10 -0
devflow_engine/prompts/integration/resolve/resolve_side_effects/prompt.md +10 -0
devflow_engine/prompts/integration/validate/build_idea_acceptance_coverage/prompt.md +12 -0
devflow_engine/prompts/integration/validate/code_repair/prompt.md +13 -0
devflow_engine/prompts/integration/validate/example.md +143 -0
devflow_engine/prompts/integration/validate/node_config/prompt.md +87 -0
devflow_engine/prompts/integration/validate/past_prompts/20260417T212300/code_repair/prompt.md +19 -0
devflow_engine/prompts/integration/validate/past_prompts/20260417T212300/node_config/prompt.md +67 -0
devflow_engine/prompts/integration/validate/past_prompts/20260417T212300/validate_enrich_gate/prompt.md +17 -0
devflow_engine/prompts/integration/validate/past_prompts/20260417T212300/validate_repair/prompt.md +16 -0
devflow_engine/prompts/integration/validate/past_prompts/20260417T215032/code_repair/prompt.md +10 -0
devflow_engine/prompts/integration/validate/past_prompts/20260417T215032/node_config/prompt.md +67 -0
devflow_engine/prompts/integration/validate/past_prompts/20260417T215032/validate_repair/prompt.md +9 -0
devflow_engine/prompts/integration/validate/validate_enrich_gate/prompt.md +10 -0
devflow_engine/prompts/integration/validate/validate_repair/prompt.md +20 -0
devflow_engine/prompts/integration/write_workflows/example.md +100 -0
devflow_engine/prompts/integration/write_workflows/node_config/prompt.md +44 -0
devflow_engine/prompts/integration/write_workflows/past_prompts/20260417T212300/node_config/prompt.md +44 -0
devflow_engine/prompts/integration/write_workflows/past_prompts/20260417T212300/write_workflows/prompt.md +17 -0
devflow_engine/prompts/integration/write_workflows/write_workflows/prompt.md +11 -0
devflow_engine/prompts/iterate/README.md +7 -0
devflow_engine/prompts/iterate/coder/prompt.md +11 -0
devflow_engine/prompts/iterate/framer/prompt.md +11 -0
devflow_engine/prompts/iterate/iterator/prompt.md +13 -0
devflow_engine/prompts/iterate/observer/prompt.md +11 -0
devflow_engine/prompts/recovery/diagnosis/prompt.md +7 -0
devflow_engine/prompts/recovery/execution/prompt.md +8 -0
devflow_engine/prompts/recovery/execution_verification/prompt.md +7 -0
devflow_engine/prompts/recovery/failure_investigation/prompt.md +10 -0
devflow_engine/prompts/recovery/preflight_health_repo_repair/prompt.md +8 -0
devflow_engine/prompts/recovery/remediation_execution/prompt.md +11 -0
devflow_engine/prompts/recovery/root_cause_investigation/prompt.md +12 -0
devflow_engine/prompts/scope_idea/doctrine/prompt.md +7 -0
devflow_engine/prompts/source_doc_eval/document/prompt.md +6 -0
devflow_engine/prompts/source_doc_eval/targeted_mutation/prompt.md +9 -0
devflow_engine/prompts/source_doc_mutation/domain_entities/prompt.md +6 -0
devflow_engine/prompts/source_doc_mutation/product_brief/prompt.md +6 -0
devflow_engine/prompts/source_doc_mutation/project_doc_coherence/prompt.md +7 -0
devflow_engine/prompts/source_doc_mutation/project_doc_render/prompt.md +9 -0
devflow_engine/prompts/source_doc_mutation/source_doc_coherence/prompt.md +5 -0
devflow_engine/prompts/source_doc_mutation/source_doc_enrichment_coherence/prompt.md +6 -0
devflow_engine/prompts/source_doc_mutation/user_workflows/prompt.md +6 -0
devflow_engine/prompts/source_scope/doctrine/prompt.md +10 -0
devflow_engine/prompts/ui_grounding/doctrine/prompt.md +7 -0
devflow_engine/recovery/__init__.py +3 -0
devflow_engine/recovery/dag.py +2609 -0
devflow_engine/recovery/models.py +220 -0
devflow_engine/refactor.py +93 -0
devflow_engine/registry/__init__.py +1 -0
devflow_engine/registry/cards.py +238 -0
devflow_engine/registry/domain_normalize.py +60 -0
devflow_engine/registry/effects.py +65 -0
devflow_engine/registry/enforce_report.py +150 -0
devflow_engine/registry/module_cards_classify.py +164 -0
devflow_engine/registry/module_cards_draft.py +184 -0
devflow_engine/registry/module_cards_gate.py +59 -0
devflow_engine/registry/packages.py +347 -0
devflow_engine/registry/pathways.py +323 -0
devflow_engine/review/__init__.py +11 -0
devflow_engine/review/dag.py +588 -0
devflow_engine/review/review_story.py +67 -0
devflow_engine/scope_idea/__init__.py +3 -0
devflow_engine/scope_idea/agentic.py +39 -0
devflow_engine/scope_idea/dag.py +1069 -0
devflow_engine/scope_idea/models.py +175 -0
devflow_engine/skills/builtins/devflow/queue_failure_investigation/SKILL.md +112 -0
devflow_engine/skills/builtins/devflow/queue_idea_to_story/SKILL.md +120 -0
devflow_engine/skills/builtins/devflow/queue_integration/SKILL.md +105 -0
devflow_engine/skills/builtins/devflow/queue_recovery/SKILL.md +108 -0
devflow_engine/skills/builtins/devflow/queue_runtime_core/SKILL.md +155 -0
devflow_engine/skills/builtins/devflow/queue_story_implementation/SKILL.md +122 -0
devflow_engine/skills/builtins/devin/idea_to_story_handoff/SKILL.md +120 -0
devflow_engine/skills/builtins/devin/ideation/SKILL.md +168 -0
devflow_engine/skills/builtins/devin/ideation/state-and-phrasing-reference.md +18 -0
devflow_engine/skills/builtins/devin/insight/SKILL.md +22 -0
devflow_engine/skills/registry.example.yaml +42 -0
devflow_engine/source_doc_assumptions.py +291 -0
devflow_engine/source_doc_mutation_dag.py +1606 -0
devflow_engine/source_doc_mutation_eval.py +417 -0
devflow_engine/source_doc_mutation_worker.py +25 -0
devflow_engine/source_docs_schema.py +207 -0
devflow_engine/source_docs_updater.py +309 -0
devflow_engine/source_scope/__init__.py +15 -0
devflow_engine/source_scope/agentic.py +45 -0
devflow_engine/source_scope/dag.py +1626 -0
devflow_engine/source_scope/models.py +177 -0
devflow_engine/stores/__init__.py +0 -0
devflow_engine/stores/execution_store.py +3534 -0
devflow_engine/story/__init__.py +0 -0
devflow_engine/story/contracts.py +160 -0
devflow_engine/story/discovery.py +47 -0
devflow_engine/story/evidence.py +118 -0
devflow_engine/story/hashing.py +27 -0
devflow_engine/story/implemented_queue_purge.py +148 -0
devflow_engine/story/indexer.py +105 -0
devflow_engine/story/io.py +20 -0
devflow_engine/story/markdown_contracts.py +298 -0
devflow_engine/story/reconciliation.py +408 -0
devflow_engine/story/validate_stories.py +149 -0
devflow_engine/story/validate_tests_story.py +512 -0
devflow_engine/story/validation.py +133 -0
devflow_engine/ui_grounding/__init__.py +11 -0
devflow_engine/ui_grounding/agentic.py +31 -0
devflow_engine/ui_grounding/dag.py +874 -0
devflow_engine/ui_grounding/models.py +224 -0
devflow_engine/ui_grounding/pencil_bridge.py +247 -0
devflow_engine/vendor/__init__.py +0 -0
devflow_engine/vendor/datalumina_genai/__init__.py +11 -0
devflow_engine/vendor/datalumina_genai/core/__init__.py +0 -0
devflow_engine/vendor/datalumina_genai/core/exceptions.py +9 -0
devflow_engine/vendor/datalumina_genai/core/nodes/__init__.py +0 -0
devflow_engine/vendor/datalumina_genai/core/nodes/agent.py +48 -0
devflow_engine/vendor/datalumina_genai/core/nodes/agent_streaming_node.py +26 -0
devflow_engine/vendor/datalumina_genai/core/nodes/base.py +89 -0
devflow_engine/vendor/datalumina_genai/core/nodes/concurrent.py +30 -0
devflow_engine/vendor/datalumina_genai/core/nodes/router.py +69 -0
devflow_engine/vendor/datalumina_genai/core/schema.py +72 -0
devflow_engine/vendor/datalumina_genai/core/task.py +52 -0
devflow_engine/vendor/datalumina_genai/core/validate.py +139 -0
devflow_engine/vendor/datalumina_genai/core/workflow.py +200 -0
devflow_engine/worker.py +1086 -0
devflow_engine/worker_guard.py +233 -0
devflow_engine-1.0.0.dist-info/METADATA +235 -0
devflow_engine-1.0.0.dist-info/RECORD +393 -0
devflow_engine-1.0.0.dist-info/WHEEL +4 -0
devflow_engine-1.0.0.dist-info/entry_points.txt +3 -0
devin/__init__.py +6 -0
devin/dag.py +58 -0
devin/dag_two_arm.py +138 -0
devin/devin_chat_scenario_catalog.json +588 -0
devin/devin_eval.py +677 -0
devin/nodes/__init__.py +0 -0
devin/nodes/ideation/__init__.py +0 -0
devin/nodes/ideation/node.py +195 -0
devin/nodes/ideation/playground.py +267 -0
devin/nodes/ideation/prompt.md +65 -0
devin/nodes/ideation/scenarios/continue_refinement.py +13 -0
devin/nodes/ideation/scenarios/continue_refinement_evals.py +18 -0
devin/nodes/ideation/scenarios/idea_fits_existing_patterns.py +17 -0
devin/nodes/ideation/scenarios/idea_fits_existing_patterns_evals.py +16 -0
devin/nodes/ideation/scenarios/large_idea_split.py +4 -0
devin/nodes/ideation/scenarios/large_idea_split_evals.py +17 -0
devin/nodes/ideation/scenarios/source_documentation_added.py +4 -0
devin/nodes/ideation/scenarios/source_documentation_added_evals.py +16 -0
devin/nodes/ideation/scenarios/user_says_create_it.py +30 -0
devin/nodes/ideation/scenarios/user_says_create_it_evals.py +23 -0
devin/nodes/ideation/scenarios/vague_idea.py +16 -0
devin/nodes/ideation/scenarios/vague_idea_evals.py +47 -0
devin/nodes/ideation/tools.json +312 -0
devin/nodes/insight/__init__.py +0 -0
devin/nodes/insight/node.py +49 -0
devin/nodes/insight/playground.py +154 -0
devin/nodes/insight/prompt.md +61 -0
devin/nodes/insight/scenarios/architecture_pattern_query.py +15 -0
devin/nodes/insight/scenarios/architecture_pattern_query_evals.py +25 -0
devin/nodes/insight/scenarios/codebase_exploration.py +15 -0
devin/nodes/insight/scenarios/codebase_exploration_evals.py +23 -0
devin/nodes/insight/scenarios/devin_ideation_routing.py +19 -0
devin/nodes/insight/scenarios/devin_ideation_routing_evals.py +39 -0
devin/nodes/insight/scenarios/devin_insight_routing.py +20 -0
devin/nodes/insight/scenarios/devin_insight_routing_evals.py +40 -0
devin/nodes/insight/scenarios/operational_debugging.py +15 -0
devin/nodes/insight/scenarios/operational_debugging_evals.py +23 -0
devin/nodes/insight/scenarios/operational_question.py +9 -0
devin/nodes/insight/scenarios/operational_question_evals.py +8 -0
devin/nodes/insight/scenarios/queue_status.py +15 -0
devin/nodes/insight/scenarios/queue_status_evals.py +23 -0
devin/nodes/insight/scenarios/source_doc_explanation.py +14 -0
devin/nodes/insight/scenarios/source_doc_explanation_evals.py +21 -0
devin/nodes/insight/scenarios/worker_state_check.py +15 -0
devin/nodes/insight/scenarios/worker_state_check_evals.py +22 -0
devin/nodes/insight/tools.json +126 -0
devin/nodes/intake/__init__.py +0 -0
devin/nodes/intake/node.py +27 -0
devin/nodes/intake/playground.py +47 -0
devin/nodes/intake/prompt.md +12 -0
devin/nodes/intake/scenarios/ideation_routing.py +4 -0
devin/nodes/intake/scenarios/ideation_routing_evals.py +5 -0
devin/nodes/intake/scenarios/insight_routing.py +4 -0
devin/nodes/intake/scenarios/insight_routing_evals.py +5 -0
devin/nodes/iterate/README.md +44 -0
devin/nodes/iterate/__init__.py +1 -0
devin/nodes/iterate/_archived_design_stages/01-objectives-requirements.md +112 -0
devin/nodes/iterate/_archived_design_stages/02-evals.md +131 -0
devin/nodes/iterate/_archived_design_stages/03-tools-and-boundaries.md +110 -0
devin/nodes/iterate/_archived_design_stages/04-harness-and-playground.md +32 -0
devin/nodes/iterate/_archived_design_stages/05-prompt-deferred.md +11 -0
devin/nodes/iterate/_archived_design_stages/coder_agent_design/01-objectives-requirements.md +20 -0
devin/nodes/iterate/_archived_design_stages/coder_agent_design/02-evals.md +8 -0
devin/nodes/iterate/_archived_design_stages/coder_agent_design/03-tools-and-boundaries.md +14 -0
devin/nodes/iterate/_archived_design_stages/coder_agent_design/04-harness-and-playground.md +12 -0
devin/nodes/iterate/_archived_design_stages/framer_agent_design/01-objectives-requirements.md +20 -0
devin/nodes/iterate/_archived_design_stages/framer_agent_design/02-evals.md +8 -0
devin/nodes/iterate/_archived_design_stages/framer_agent_design/03-tools-and-boundaries.md +13 -0
devin/nodes/iterate/_archived_design_stages/framer_agent_design/04-harness-and-playground.md +12 -0
devin/nodes/iterate/_archived_design_stages/iterator_agent_design/01-objectives-requirements.md +25 -0
devin/nodes/iterate/_archived_design_stages/iterator_agent_design/02-evals.md +9 -0
devin/nodes/iterate/_archived_design_stages/iterator_agent_design/03-tools-and-boundaries.md +14 -0
devin/nodes/iterate/_archived_design_stages/iterator_agent_design/04-harness-and-playground.md +12 -0
devin/nodes/iterate/_archived_design_stages/observer_agent_design/01-objectives-requirements.md +20 -0
devin/nodes/iterate/_archived_design_stages/observer_agent_design/02-evals.md +8 -0
devin/nodes/iterate/_archived_design_stages/observer_agent_design/03-tools-and-boundaries.md +14 -0
devin/nodes/iterate/_archived_design_stages/observer_agent_design/04-harness-and-playground.md +13 -0
devin/nodes/iterate/agent-roles.md +89 -0
devin/nodes/iterate/agents/README.md +10 -0
devin/nodes/iterate/artifacts.md +504 -0
devin/nodes/iterate/contract.md +100 -0
devin/nodes/iterate/eval-plan.md +74 -0
devin/nodes/iterate/node.py +100 -0
devin/nodes/iterate/pipeline/README.md +13 -0
devin/nodes/iterate/playground-contract.md +76 -0
devin/nodes/iterate/prompt.md +11 -0
devin/nodes/iterate/scenarios/README.md +38 -0
devin/nodes/iterate/scenarios/artifact-and-loop-scenarios.md +101 -0
devin/nodes/iterate/scenarios/coder_artifact_alignment.py +32 -0
devin/nodes/iterate/scenarios/coder_artifact_alignment_evals.py +45 -0
devin/nodes/iterate/scenarios/coder_bounded_fix.py +27 -0
devin/nodes/iterate/scenarios/coder_bounded_fix_evals.py +45 -0
devin/nodes/iterate/scenarios/devin_iterate_routing.py +21 -0
devin/nodes/iterate/scenarios/devin_iterate_routing_evals.py +36 -0
devin/nodes/iterate/scenarios/framer_scope_boundary.py +25 -0
devin/nodes/iterate/scenarios/framer_scope_boundary_evals.py +57 -0
devin/nodes/iterate/scenarios/framer_task_framing.py +25 -0
devin/nodes/iterate/scenarios/framer_task_framing_evals.py +58 -0
devin/nodes/iterate/scenarios/iterate_error_fix.py +21 -0
devin/nodes/iterate/scenarios/iterate_error_fix_evals.py +39 -0
devin/nodes/iterate/scenarios/iterate_quick_change.py +21 -0
devin/nodes/iterate/scenarios/iterate_quick_change_evals.py +35 -0
devin/nodes/iterate/scenarios/iterate_to_idea_promotion.py +23 -0
devin/nodes/iterate/scenarios/iterate_to_idea_promotion_evals.py +53 -0
devin/nodes/iterate/scenarios/iterate_to_insight_reroute.py +23 -0
devin/nodes/iterate/scenarios/iterate_to_insight_reroute_evals.py +53 -0
devin/nodes/iterate/scenarios/observer_evidence_seam.py +28 -0
devin/nodes/iterate/scenarios/observer_evidence_seam_evals.py +55 -0
devin/nodes/iterate/scenarios/observer_repro_creation.py +28 -0
devin/nodes/iterate/scenarios/observer_repro_creation_evals.py +45 -0
devin/nodes/iterate/scenarios/routing-matrix.md +45 -0
devin/nodes/shared/__init__.py +0 -0
devin/nodes/shared/filemaker_expert.md +80 -0
devin/nodes/shared/filemaker_expert.py +354 -0
devin/nodes/shared/filemaker_expert_eval/runner.py +176 -0
devin/nodes/shared/filemaker_expert_eval/scenarios.json +65 -0
devin/nodes/shared/goldilocks_advisor_eval/runner.py +214 -0
devin/nodes/shared/goldilocks_advisor_eval/scenarios.json +58 -0
devin/nodes/shared/helpers.py +156 -0
devin/nodes/shared/idea_compliance_advisor_eval/runner.py +252 -0
devin/nodes/shared/idea_compliance_advisor_eval/scenarios.json +75 -0
devin/nodes/shared/models.py +44 -0
devin/nodes/shared/post.py +40 -0
devin/nodes/shared/router.py +107 -0
devin/nodes/shared/tools.py +191 -0
devin/shared/devin-chat-rubric.md +237 -0
devin/shared/devin-chat-scenario-suite.md +90 -0
devin/shared/eval_doctrine.md +9 -0

devflow_engine/api_key_flow_harness.py ADDED Viewed

@@ -0,0 +1,539 @@
+from __future__ import annotations
+import base64
+import json
+import os
+import threading
+import uuid
+from dataclasses import asdict, dataclass, field
+from datetime import UTC, datetime, timedelta
+from hashlib import sha256
+from http.server import BaseHTTPRequestHandler, ThreadingHTTPServer
+from typing import Any, Literal
+from urllib.parse import parse_qs, urlparse
+from cryptography.hazmat.primitives.ciphers.aead import AESGCM
+from . import api_keys
+from .devflow_event_worker import DevflowEventWorkerService
+import devflow_engine.devflow_event_worker as worker_module
+FailureMode = Literal["success", "caller_contract", "grant_resolution", "decrypt", "storage"]
+StorageMode = Literal["mock", "real"]
+@dataclass(frozen=True)
+class ApiKeyTransportSmokeScenario:
+    provider: str = "openai"
+    api_key: str = "smoke-openai-key-12345678"
+    tier: str = "light"
+    storage_mode: StorageMode = "mock"
+    failure_mode: FailureMode = "success"
+    worker_id: str = "devflow-api-key-smoke"
+    project_id: str = field(default_factory=lambda: str(uuid.uuid4()))
+    event_id: str = field(default_factory=lambda: str(uuid.uuid4()))
+    grant_id: str = field(default_factory=lambda: str(uuid.uuid4()))
+    grant_token: str = "temporary-transport-secret"
+    occurred_at: str = field(default_factory=lambda: datetime.now(UTC).isoformat())
+@dataclass(frozen=True)
+class ApiKeyTransportSmokeResult:
+    ok: bool
+    failure_seam: str | None
+    message: str | None
+    scenario: dict[str, Any]
+    dispatch_result: dict[str, Any] | None
+    final_event: dict[str, Any] | None
+    execution_runs: list[dict[str, Any]]
+    execution_step_runs: list[dict[str, Any]]
+    grant_requests: list[dict[str, Any]]
+    supabase_requests: list[dict[str, Any]]
+    storage: dict[str, Any]
+    def to_dict(self) -> dict[str, Any]:
+        return asdict(self)
+class _MockStorageRecorder:
+    def __init__(self) -> None:
+        self.keychain_writes: list[dict[str, Any]] = []
+        self.runtime_writes: list[dict[str, Any]] = []
+        self.runtime_env_vars: list[str] = []
+    def store_provider_api_key(self, provider: str, api_key: str) -> None:
+        spec = api_keys._resolve_provider_spec(provider)
+        credential = api_keys.validate_provider_api_key(provider=spec.provider, api_key=api_key)
+        self.keychain_writes.append(
+            {
+                "provider": spec.provider,
+                "length": len(credential),
+                "last4": credential[-4:],
+            }
+        )
+    def set_runtime_provider_api_key(self, provider: str, api_key: str) -> str:
+        spec = api_keys._resolve_provider_spec(provider)
+        credential = api_keys.validate_provider_api_key(provider=spec.provider, api_key=api_key)
+        self.runtime_writes.append(
+            {
+                "provider": spec.provider,
+                "env_var": spec.env_var,
+                "length": len(credential),
+                "last4": credential[-4:],
+            }
+        )
+        self.runtime_env_vars.append(spec.env_var)
+        return spec.env_var
+    def snapshot(self) -> dict[str, Any]:
+        return {
+            "mode": "mock",
+            "keychain_writes": list(self.keychain_writes),
+            "runtime_writes": list(self.runtime_writes),
+            "runtime_env_vars": list(self.runtime_env_vars),
+        }
+class _InMemorySupabase:
+    def __init__(self, *, scenario: ApiKeyTransportSmokeScenario, event_payload: dict[str, Any]) -> None:
+        self._lock = threading.Lock()
+        self.next_run_id = 1
+        self.next_step_id = 1
+        self.requests: list[dict[str, Any]] = []
+        self.tables: dict[str, list[dict[str, Any]]] = {
+            "devflow_projects": [
+                {
+                    "id": scenario.project_id,
+                    "name": "API Key Smoke Project",
+                    "environment": "development",
+                    "metadata": {},
+                    "devflow_repo_root": None,
+                }
+            ],
+            "devflow_execution_events": [
+                {
+                    "id": scenario.event_id,
+                    "project_id": scenario.project_id,
+                    "event_type": "devflow_API_KEY",
+                    "status": "queued",
+                    "stage": None,
+                    "error": None,
+                    "run_id": None,
+                    "producer": None,
+                    "occurred_at": scenario.occurred_at,
+                    "payload": event_payload,
+                }
+            ],
+            "devflow_execution_runs": [],
+            "devflow_execution_step_runs": [],
+        }
+    def handle(self, *, method: str, path: str, headers: dict[str, str], body: Any | None) -> tuple[int, Any]:
+        parsed = urlparse(path)
+        table = parsed.path.removeprefix("/rest/v1/")
+        query = parse_qs(parsed.query, keep_blank_values=True)
+        with self._lock:
+            self.requests.append(
+                {
+                    "method": method,
+                    "path": parsed.path,
+                    "query": {key: list(values) for key, values in query.items()},
+                    "body": body,
+                }
+            )
+            if table not in self.tables:
+                return 404, {"detail": f"Unknown table: {table}"}
+            if method == "GET":
+                return 200, self._select(table=table, query=query)
+            if method == "PATCH":
+                rows = self._patch(table=table, query=query, fields=body or {})
+                prefer = str(headers.get("Prefer") or "")
+                return 200, rows if "return=representation" in prefer else []
+            if method == "POST":
+                row = self._insert(table=table, payload=body or {})
+                prefer = str(headers.get("Prefer") or "")
+                return 201, [row] if "return=representation" in prefer else []
+        return 405, {"detail": f"Unsupported method: {method}"}
+    def _select(self, *, table: str, query: dict[str, list[str]]) -> list[dict[str, Any]]:
+        rows = [dict(row) for row in self.tables[table] if self._matches(row=row, query=query)]
+        order = self._single_value(query, "order")
+        if order:
+            field, _, direction = order.partition(".")
+            rows.sort(key=lambda item: item.get(field))
+            if direction.lower() == "desc":
+                rows.reverse()
+        limit = self._single_value(query, "limit")
+        if limit and limit.isdigit():
+            rows = rows[: int(limit)]
+        return rows
+    def _patch(self, *, table: str, query: dict[str, list[str]], fields: dict[str, Any]) -> list[dict[str, Any]]:
+        rows: list[dict[str, Any]] = []
+        for row in self.tables[table]:
+            if not self._matches(row=row, query=query):
+                continue
+            row.update(fields)
+            rows.append(dict(row))
+        return rows
+    def _insert(self, *, table: str, payload: dict[str, Any]) -> dict[str, Any]:
+        row = dict(payload)
+        if table == "devflow_execution_runs":
+            row.setdefault("id", self.next_run_id)
+            self.next_run_id += 1
+        elif table == "devflow_execution_step_runs":
+            row.setdefault("id", self.next_step_id)
+            self.next_step_id += 1
+        self.tables[table].append(row)
+        return dict(row)
+    def _matches(self, *, row: dict[str, Any], query: dict[str, list[str]]) -> bool:
+        for key, values in query.items():
+            if key in {"select", "order", "limit"}:
+                continue
+            if not values:
+                continue
+            raw = values[-1]
+            if raw.startswith("eq."):
+                expected = raw[3:]
+                if str(row.get(key)) != expected:
+                    return False
+                continue
+            if raw == "is.null":
+                if row.get(key) is not None:
+                    return False
+                continue
+        return True
+    @staticmethod
+    def _single_value(query: dict[str, list[str]], key: str) -> str | None:
+        values = query.get(key)
+        if not values:
+            return None
+        return values[-1]
+class _SupabaseHandler(BaseHTTPRequestHandler):
+    server: "_HarnessHttpServer"
+    def do_GET(self) -> None:  # noqa: N802
+        self._handle()
+    def do_PATCH(self) -> None:  # noqa: N802
+        self._handle()
+    def do_POST(self) -> None:  # noqa: N802
+        self._handle()
+    def _handle(self) -> None:
+        length = int(self.headers.get("Content-Length") or "0")
+        raw = self.rfile.read(length) if length else b""
+        body = json.loads(raw.decode("utf-8")) if raw else None
+        status, payload = self.server.dispatch(method=self.command, path=self.path, headers=dict(self.headers), body=body)
+        encoded = json.dumps(payload).encode("utf-8")
+        self.send_response(status)
+        self.send_header("Content-Type", "application/json")
+        self.send_header("Content-Length", str(len(encoded)))
+        self.end_headers()
+        self.wfile.write(encoded)
+    def log_message(self, format: str, *args: object) -> None:
+        return None
+class _GrantResolutionServer:
+    def __init__(self, *, scenario: ApiKeyTransportSmokeScenario) -> None:
+        self.scenario = scenario
+        self.secret = "smoke-grant-secret"
+        self.requests: list[dict[str, Any]] = []
+        self.base_url: str = ""
+    def handle(self, *, method: str, path: str, headers: dict[str, str], body: Any | None) -> tuple[int, Any]:
+        parsed = urlparse(path)
+        request = {
+            "method": method,
+            "path": parsed.path,
+            "authorization": headers.get("Authorization"),
+        }
+        self.requests.append(request)
+        canonical_path = f"/api/devflow/settings/transport-grant/{self.scenario.grant_id}"
+        legacy_resolve_path = "/api/devflow/settings/transport-grant/resolve"
+        if self.scenario.failure_mode == "caller_contract":
+            if method == "POST" and parsed.path == legacy_resolve_path:
+                return 200, {"detail": "legacy endpoint available"}
+            request["response_status"] = 404
+            return 404, {"detail": "Not Found"}
+        if method != "GET" or parsed.path != canonical_path:
+            request["response_status"] = 404
+            return 404, {"detail": "Not Found"}
+        if self.scenario.failure_mode == "grant_resolution":
+            request["response_status"] = 404
+            return 404, {"detail": "DevFlow transport grant not found or expired"}
+        grant_token = self.scenario.grant_token
+        if self.scenario.failure_mode == "decrypt":
+            grant_token = "wrong-transport-secret"
+        payload = {
+            "grantId": self.scenario.grant_id,
+            "grantToken": grant_token,
+            "wrappedKey": "ciphertext",
+            "wrappingAlgorithm": "AES-GCM",
+            "wrappingKeyId": "kid-smoke-123",
+            "iv": "nonce-smoke",
+            "metadata": {
+                "algorithm": "AES-GCM",
+                "version": "devflow.api_key.v1",
+            },
+            "expiresAt": (datetime.now(UTC) + timedelta(minutes=5)).isoformat(),
+        }
+        request["response_status"] = 200
+        return 200, payload
+class _GrantHandler(BaseHTTPRequestHandler):
+    server: "_HarnessHttpServer"
+    def do_GET(self) -> None:  # noqa: N802
+        self._handle()
+    def do_POST(self) -> None:  # noqa: N802
+        self._handle()
+    def _handle(self) -> None:
+        length = int(self.headers.get("Content-Length") or "0")
+        raw = self.rfile.read(length) if length else b""
+        body = json.loads(raw.decode("utf-8")) if raw else None
+        status, payload = self.server.dispatch(method=self.command, path=self.path, headers=dict(self.headers), body=body)
+        encoded = json.dumps(payload).encode("utf-8")
+        self.send_response(status)
+        self.send_header("Content-Type", "application/json")
+        self.send_header("Content-Length", str(len(encoded)))
+        self.end_headers()
+        self.wfile.write(encoded)
+    def log_message(self, format: str, *args: object) -> None:
+        return None
+class _HarnessHttpServer(ThreadingHTTPServer):
+    def __init__(self, server_address: tuple[str, int], handler_class: type[BaseHTTPRequestHandler], dispatcher) -> None:
+        super().__init__(server_address, handler_class)
+        self._dispatcher = dispatcher
+    def dispatch(self, *, method: str, path: str, headers: dict[str, str], body: Any | None) -> tuple[int, Any]:
+        return self._dispatcher(method=method, path=path, headers=headers, body=body)
+class _ServerThread:
+    def __init__(self, server: _HarnessHttpServer) -> None:
+        self.server = server
+        self.thread = threading.Thread(target=self.server.serve_forever, daemon=True)
+    def __enter__(self) -> "_ServerThread":
+        self.thread.start()
+        return self
+    def __exit__(self, exc_type, exc, tb) -> None:
+        self.server.shutdown()
+        self.server.server_close()
+        self.thread.join(timeout=5)
+def _encrypt_transport_payload(*, grant_token: str, provider: str, credential: str, tier: str) -> dict[str, Any]:
+    plaintext = json.dumps(
+        {
+            "submitted_at": datetime.now(UTC).isoformat(),
+            "secret": {
+                "tier": tier,
+                "provider": provider,
+                "credential": credential,
+            },
+        }
+    ).encode("utf-8")
+    iv = b"0123456789ab"
+    key = sha256(grant_token.encode("utf-8")).digest()
+    ciphertext = AESGCM(key).encrypt(iv, plaintext, None)
+    return {
+        "ciphertext": base64.b64encode(ciphertext).decode("ascii"),
+        "iv": base64.b64encode(iv).decode("ascii"),
+        "metadata": {
+            "algorithm": "AES-GCM",
+            "key_derivation": "SHA-256",
+            "key_material": "transport-grant-token",
+            "content_type": "application/json",
+            "content_encoding": "utf-8",
+            "version": "devflow.api_key.v1",
+        },
+    }
+def _build_event_payload(scenario: ApiKeyTransportSmokeScenario) -> dict[str, Any]:
+    return {
+        "transport": {
+            "format": "devflow.api_key.v1",
+            "grant_id": scenario.grant_id,
+            "expires_at": (datetime.now(UTC) + timedelta(minutes=5)).isoformat(),
+            "secret_count": 1,
+            "wrapping_key_id": "kid-smoke-123",
+        },
+        "secret_descriptor": {
+            "tier": scenario.tier,
+            "provider": scenario.provider,
+            "last4": scenario.api_key[-4:],
+            "length": len(scenario.api_key),
+        },
+        "transport_payload": _encrypt_transport_payload(
+            grant_token=scenario.grant_token,
+            provider=scenario.provider,
+            credential=scenario.api_key,
+            tier=scenario.tier,
+        ),
+    }
+def _classify_failure(*, exc: Exception, scenario: ApiKeyTransportSmokeScenario, grant_requests: list[dict[str, Any]]) -> str:
+    message = str(exc)
+    if scenario.failure_mode == "caller_contract":
+        return "dfe_caller_contract"
+    if scenario.failure_mode == "grant_resolution":
+        return "clarity_grant_resolution"
+    if scenario.failure_mode == "decrypt":
+        return "decrypt_logic"
+    if scenario.failure_mode == "storage":
+        return "keychain_env_setting"
+    if "transport grant resolution request failed" in message:
+        last_status = None if not grant_requests else grant_requests[-1].get("response_status")
+        if last_status in {404, 405}:
+            return "dfe_caller_contract"
+        return "clarity_grant_resolution"
+    if "transport grant" in message or "unwrap material" in message:
+        return "clarity_grant_resolution"
+    if "decrypt" in message or "transport payload" in message:
+        return "decrypt_logic"
+    if "keychain" in message or "storage" in message:
+        return "keychain_env_setting"
+    return "worker_runtime"
+def _restore_environ(previous: dict[str, str | None]) -> None:
+    for key, value in previous.items():
+        if value is None:
+            os.environ.pop(key, None)
+        else:
+            os.environ[key] = value
+def run_api_key_transport_smoke(
+    scenario: ApiKeyTransportSmokeScenario | None = None,
+) -> ApiKeyTransportSmokeResult:
+    scenario = scenario or ApiKeyTransportSmokeScenario()
+    event_payload = _build_event_payload(scenario)
+    supabase = _InMemorySupabase(scenario=scenario, event_payload=event_payload)
+    grant_server = _GrantResolutionServer(scenario=scenario)
+    storage = _MockStorageRecorder()
+    supabase_http = _HarnessHttpServer(("127.0.0.1", 0), _SupabaseHandler, supabase.handle)
+    grant_http = _HarnessHttpServer(("127.0.0.1", 0), _GrantHandler, grant_server.handle)
+    grant_server.base_url = f"http://127.0.0.1:{grant_http.server_address[1]}/api/devflow/settings/transport-grant"
+    supabase_url = f"http://127.0.0.1:{supabase_http.server_address[1]}"
+    env_previous = {
+        key: os.environ.get(key)
+        for key in (
+            "DEVFLOW_TRANSPORT_GRANT_RESOLUTION_URL",
+            "DEVFLOW_TRANSPORT_GRANT_RESOLUTION_SECRET",
+        )
+    }
+    original_bootstrap = worker_module.bootstrap_provider_api_keys
+    original_resolve_config = worker_module._resolve_supabase_rest_config
+    original_store = worker_module.store_provider_api_key
+    original_set_runtime = worker_module.set_runtime_provider_api_key
+    dispatch_result: dict[str, Any] | None = None
+    failure_seam: str | None = None
+    message: str | None = None
+    try:
+        os.environ["DEVFLOW_TRANSPORT_GRANT_RESOLUTION_URL"] = grant_server.base_url
+        os.environ["DEVFLOW_TRANSPORT_GRANT_RESOLUTION_SECRET"] = grant_server.secret
+        worker_module.bootstrap_provider_api_keys = lambda env=None: {}
+        worker_module._resolve_supabase_rest_config = lambda: (supabase_url, "svc-key")
+        if scenario.storage_mode == "mock":
+            worker_module.store_provider_api_key = storage.store_provider_api_key
+            worker_module.set_runtime_provider_api_key = storage.set_runtime_provider_api_key
+        if scenario.failure_mode == "storage":
+            worker_module.store_provider_api_key = lambda provider, api_key: (_ for _ in ()).throw(
+                RuntimeError("Failed to write macOS keychain entry for provider smoke")
+            )
+        with _ServerThread(supabase_http), _ServerThread(grant_http):
+            service = DevflowEventWorkerService(worker_id=scenario.worker_id)
+            result = service.dispatch_next_event()
+            if result is None:
+                raise RuntimeError("No queued devflow_API_KEY event was dispatched")
+            dispatch_result = {
+                "event_id": result.event_id,
+                "execution_run_id": result.execution_run_id,
+                "workflow_key": result.workflow_key,
+                "command": result.command,
+                "result": result.result,
+            }
+            if result.workflow_key != "api_key":
+                raise RuntimeError(f"Unexpected workflow_key: {result.workflow_key}")
+            if result.result.get("provider") != scenario.provider:
+                raise RuntimeError("Worker reported an unexpected provider")
+            if not grant_server.requests:
+                raise RuntimeError("Worker never requested transport grant resolution")
+            request = grant_server.requests[-1]
+            if request.get("method") != "GET":
+                raise RuntimeError("Worker did not use GET for transport grant resolution")
+            auth_header = str(request.get("authorization") or "")
+            if not auth_header.startswith("Bearer "):
+                raise RuntimeError("Worker omitted HMAC auth for transport grant resolution")
+    except Exception as exc:
+        failure_seam = _classify_failure(exc=exc, scenario=scenario, grant_requests=grant_server.requests)
+        message = str(exc)
+    finally:
+        worker_module.bootstrap_provider_api_keys = original_bootstrap
+        worker_module._resolve_supabase_rest_config = original_resolve_config
+        worker_module.store_provider_api_key = original_store
+        worker_module.set_runtime_provider_api_key = original_set_runtime
+        _restore_environ(env_previous)
+    final_event = None
+    for row in supabase.tables["devflow_execution_events"]:
+        if str(row.get("id")) == scenario.event_id:
+            final_event = dict(row)
+            break
+    storage_snapshot = storage.snapshot() if scenario.storage_mode == "mock" else {"mode": "real"}
+    return ApiKeyTransportSmokeResult(
+        ok=failure_seam is None,
+        failure_seam=failure_seam,
+        message=message,
+        scenario={
+            "provider": scenario.provider,
+            "tier": scenario.tier,
+            "storage_mode": scenario.storage_mode,
+            "failure_mode": scenario.failure_mode,
+            "project_id": scenario.project_id,
+            "event_id": scenario.event_id,
+            "grant_id": scenario.grant_id,
+        },
+        dispatch_result=dispatch_result,
+        final_event=final_event,
+        execution_runs=[dict(row) for row in supabase.tables["devflow_execution_runs"]],
+        execution_step_runs=[dict(row) for row in supabase.tables["devflow_execution_step_runs"]],
+        grant_requests=list(grant_server.requests),
+        supabase_requests=list(supabase.requests),
+        storage=storage_snapshot,
+    )