npm - job-forge - Versions diffs - 2.13.0 → 2.14.0 - Mend

job-forge 2.13.0 → 2.14.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (13) hide show

package/.opencode/agents/general-free.md +4 -3
package/.opencode/agents/general-paid.md +2 -1
package/.opencode/agents/glm-minimal.md +4 -3
package/.opencode/opencode-model-fallback.json +3 -3
package/bin/create-job-forge.mjs +12 -4
package/docs/MODEL-ROUTING.md +6 -6
package/iso/agents/general-free.md +6 -2
package/iso/agents/general-paid.md +5 -1
package/iso/agents/glm-minimal.md +6 -2
package/iso/config.json +8 -5
package/models.yaml +2 -12
package/opencode.json +10 -7
package/package.json +1 -1

package/.opencode/agents/general-free.md CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 description: Procedural worker on free-tier model. Use for form filling via Geometra, tracker updates, TSV merges, scan dedup, OTP retrieval, and other mechanical/scripted tasks where quality-sensitive text generation is NOT required.
 mode: subagent
-model: openrouter/minimax/minimax-m2.5:free
+model: openrouter/z-ai/glm-4.5-air:free
 tools:
   geometra_connect: true
   geometra_page_model: true
@@ -17,9 +17,10 @@ tools:
 temperature: 0.1
 reasoningEffort: minimal
 fallback_models:
-  - openrouter/qwen/qwen3-coder:free
-  - openrouter/google/gemma-4-26b-a4b-it:free
+  - openrouter/minimax/minimax-m2.5:free
   - openrouter/openai/gpt-oss-20b:free
+  - openrouter/nvidia/nemotron-3-nano-30b-a3b:free
+  - openrouter/qwen/qwen3-coder:free
 ---
 You are the @general-free subagent. You run on a free-tier model, which means the orchestrator has delegated this task to you **specifically because the work is procedural**: deterministic steps, scripted outputs, no nuanced writing required.

package/.opencode/agents/general-paid.md CHANGED Viewed

@@ -8,9 +8,10 @@ tools:
 temperature: 0.3
 reasoningEffort: medium
 fallback_models:
-  - openrouter/qwen/qwen3-coder:free
+  - openrouter/nvidia/nemotron-3-super-120b-a12b:free
   - openrouter/openai/gpt-oss-120b:free
   - openrouter/z-ai/glm-4.5-air:free
+  - openrouter/qwen/qwen3-coder:free
 ---
 You are the @general-paid subagent. The orchestrator delegated this task to you because it requires quality writing or judgment — the kind of work `@general-free` isn't well-suited for.

package/.opencode/agents/glm-minimal.md CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 description: Narrow-scope extractor on free-tier model. Use for single-purpose tasks where the orchestrator passes the exact input and expects a small, structured output — e.g., "extract these 8 fields from this JD text" or "parse this form schema into a label→type map". NOT for multi-step workflows.
 mode: subagent
-model: openrouter/google/gemma-4-26b-a4b-it:free
+model: openrouter/openai/gpt-oss-20b:free
 tools:
   geometra_*: false
   gmail_*: false
@@ -14,9 +14,10 @@ tools:
 temperature: 0
 reasoningEffort: none
 fallback_models:
-  - openrouter/minimax/minimax-m2.5:free
-  - openrouter/openai/gpt-oss-20b:free
+  - openrouter/google/gemma-4-26b-a4b-it:free
+  - openrouter/nvidia/nemotron-nano-9b-v2:free
   - openrouter/google/gemma-4-31b-it:free
+  - openrouter/z-ai/glm-4.5-air:free
 ---
 You are the @glm-minimal subagent. You handle narrow, one-shot extractions where the orchestrator has pre-digested the context and just needs you to do a specific transform.

package/.opencode/opencode-model-fallback.json CHANGED Viewed

@@ -3,9 +3,9 @@
   "timeout_seconds": 30,
   "notify_on_fallback": true,
   "fallback_models": [
-    "openrouter/qwen/qwen3-next-80b-a3b-instruct:free",
     "openrouter/openai/gpt-oss-120b:free",
-    "openrouter/google/gemma-4-26b-a4b-it:free",
-    "openrouter/z-ai/glm-4.5-air:free"
+    "openrouter/z-ai/glm-4.5-air:free",
+    "openrouter/nvidia/nemotron-3-super-120b-a12b:free",
+    "openrouter/qwen/qwen3-next-80b-a3b-instruct:free"
   ]
 }

package/bin/create-job-forge.mjs CHANGED Viewed

@@ -177,17 +177,25 @@ const opencodeCfg = {
   },
   // Register the exact OpenRouter free models the harness uses so they're
   // selectable even if they are not in OpenCode's built-in preloaded set.
+  // This list is a superset: role primaries, per-agent fallback chains,
+  // and the orchestrator fallback chain.
   provider: {
     openrouter: {
       models: {
+        // Orchestrator + agentic coding (role default)
         'qwen/qwen3-coder:free': {},
+        // Role primaries
+        'z-ai/glm-4.5-air:free': {}, // fast
+        'qwen/qwen3-next-80b-a3b-instruct:free': {}, // quality
+        'openai/gpt-oss-20b:free': {}, // minimal
+        // Common fallbacks
+        'openai/gpt-oss-120b:free': {},
         'minimax/minimax-m2.5:free': {},
-        'qwen/qwen3-next-80b-a3b-instruct:free': {},
+        'nvidia/nemotron-3-super-120b-a12b:free': {},
+        'nvidia/nemotron-3-nano-30b-a3b:free': {},
+        'nvidia/nemotron-nano-9b-v2:free': {},
         'google/gemma-4-26b-a4b-it:free': {},
         'google/gemma-4-31b-it:free': {},
-        'openai/gpt-oss-120b:free': {},
-        'openai/gpt-oss-20b:free': {},
-        'z-ai/glm-4.5-air:free': {},
       },
     },
   },

package/docs/MODEL-ROUTING.md CHANGED Viewed

@@ -18,9 +18,9 @@ Defined in `.opencode/agents/*.md` (shipped in the harness, symlinked into consu
 | Agent | Model | Reasoning | Use for |
 |-------|-------|-----------|---------|
-| `@general-free` | `openrouter/minimax/minimax-m2.5:free` | `minimal` | Geometra form fills, tracker TSV merges, scan dedup, OTP retrieval via Gmail, scripted pipeline steps |
+| `@general-free` | `openrouter/z-ai/glm-4.5-air:free` | `minimal` | Geometra form fills, tracker TSV merges, scan dedup, OTP retrieval via Gmail, scripted pipeline steps |
 | `@general-paid` | `openrouter/qwen/qwen3-next-80b-a3b-instruct:free` | `medium` | Offer evaluation narratives (Blocks A-F), cover letters, "Why X?" answers, STAR+R interview stories, LinkedIn outreach prose |
-| `@glm-minimal` | `openrouter/google/gemma-4-26b-a4b-it:free` | `none` | Narrow one-shot transforms: "extract these 8 fields from this JD text → JSON", "classify this archetype" |
+| `@glm-minimal` | `openrouter/openai/gpt-oss-20b:free` | `none` | Narrow one-shot transforms: "extract these 8 fields from this JD text → JSON", "classify this archetype" |
 The full task-to-agent mapping lives in [AGENTS.md → Subagent Routing](../AGENTS.md#subagent-routing--which-agent-for-which-task). The orchestrator (your primary session) is expected to delegate before taking any multi-step action — see the **Pre-flight delegation** rule in AGENTS.md.
@@ -139,9 +139,9 @@ Default chains ship upstream in each agent's YAML frontmatter (`node_modules/job
 | Agent | Primary | Fallback chain (in order) |
 |-------|---------|---------------------------|
-| `@general-free` | `openrouter/minimax/minimax-m2.5:free` | `openrouter/qwen/qwen3-coder:free` → `openrouter/google/gemma-4-26b-a4b-it:free` → `openrouter/openai/gpt-oss-20b:free` |
-| `@general-paid` | `openrouter/qwen/qwen3-next-80b-a3b-instruct:free` | `openrouter/qwen/qwen3-coder:free` → `openrouter/openai/gpt-oss-120b:free` → `openrouter/z-ai/glm-4.5-air:free` |
-| `@glm-minimal` | `openrouter/google/gemma-4-26b-a4b-it:free` | `openrouter/minimax/minimax-m2.5:free` → `openrouter/openai/gpt-oss-20b:free` → `openrouter/google/gemma-4-31b-it:free` |
+| `@general-free` | `openrouter/z-ai/glm-4.5-air:free` | `openrouter/minimax/minimax-m2.5:free` → `openrouter/openai/gpt-oss-20b:free` → `openrouter/nvidia/nemotron-3-nano-30b-a3b:free` → `openrouter/qwen/qwen3-coder:free` |
+| `@general-paid` | `openrouter/qwen/qwen3-next-80b-a3b-instruct:free` | `openrouter/nvidia/nemotron-3-super-120b-a12b:free` → `openrouter/openai/gpt-oss-120b:free` → `openrouter/z-ai/glm-4.5-air:free` → `openrouter/qwen/qwen3-coder:free` |
+| `@glm-minimal` | `openrouter/openai/gpt-oss-20b:free` | `openrouter/google/gemma-4-26b-a4b-it:free` → `openrouter/nvidia/nemotron-nano-9b-v2:free` → `openrouter/google/gemma-4-31b-it:free` → `openrouter/z-ai/glm-4.5-air:free` |
 These chains are deliberately free-only so the default OpenCode path never needs to pay. **Note:** OpenCode model IDs must use the provider prefix it expects (`openrouter/...`, `opencode/...`, etc.). The raw OpenRouter model slug by itself is not enough.
@@ -172,7 +172,7 @@ Plugin-level config at `.opencode/opencode-model-fallback.json` — applies to a
   "cooldown_seconds": 60,
   "timeout_seconds": 30,
   "notify_on_fallback": true,
-  "fallback_models": ["openrouter/minimax/minimax-m2.5:free", "openrouter/qwen/qwen3-coder:free"]
+  "fallback_models": ["openrouter/openai/gpt-oss-120b:free", "openrouter/z-ai/glm-4.5-air:free"]
 }
 ```

package/iso/agents/general-free.md CHANGED Viewed

@@ -10,10 +10,14 @@ targets:
     mode: subagent
     temperature: 0.1
     reasoningEffort: minimal
+    # Primary (z-ai/glm-4.5-air:free) resolves from openrouter-free preset.
+    # Fallback chain is ordered by decreasing likelihood of rate-limits,
+    # staying within free models that can tool-call Geometra + Gmail MCPs.
     fallback_models:
-      - openrouter/qwen/qwen3-coder:free
-      - openrouter/google/gemma-4-26b-a4b-it:free
+      - openrouter/minimax/minimax-m2.5:free
       - openrouter/openai/gpt-oss-20b:free
+      - openrouter/nvidia/nemotron-3-nano-30b-a3b:free
+      - openrouter/qwen/qwen3-coder:free
     tools:
       geometra_connect: true
       geometra_page_model: true

package/iso/agents/general-paid.md CHANGED Viewed

@@ -11,10 +11,14 @@ targets:
     mode: subagent
     temperature: 0.3
     reasoningEffort: medium
+    # Primary (qwen/qwen3-next-80b-a3b-instruct:free) resolves from the
+    # openrouter-free preset. Fallback chain prioritizes models with
+    # strong long-form writing judgment over raw size.
     fallback_models:
-      - openrouter/qwen/qwen3-coder:free
+      - openrouter/nvidia/nemotron-3-super-120b-a12b:free
       - openrouter/openai/gpt-oss-120b:free
       - openrouter/z-ai/glm-4.5-air:free
+      - openrouter/qwen/qwen3-coder:free
     tools:
       geometra_*: false
       gmail_*: false

package/iso/agents/glm-minimal.md CHANGED Viewed

@@ -10,10 +10,14 @@ targets:
     mode: subagent
     temperature: 0
     reasoningEffort: none
+    # Primary (openai/gpt-oss-20b:free) resolves from openrouter-free
+    # preset. Fallback chain sticks to small dense models with reliable
+    # structured-output behavior — no creative generation upstream.
     fallback_models:
-      - openrouter/minimax/minimax-m2.5:free
-      - openrouter/openai/gpt-oss-20b:free
+      - openrouter/google/gemma-4-26b-a4b-it:free
+      - openrouter/nvidia/nemotron-nano-9b-v2:free
       - openrouter/google/gemma-4-31b-it:free
+      - openrouter/z-ai/glm-4.5-air:free
     tools:
       geometra_*: false
       gmail_*: false

package/iso/config.json CHANGED Viewed

@@ -8,13 +8,16 @@
         "openrouter": {
           "models": {
             "qwen/qwen3-coder:free": {},
-            "minimax/minimax-m2.5:free": {},
+            "z-ai/glm-4.5-air:free": {},
             "qwen/qwen3-next-80b-a3b-instruct:free": {},
-            "google/gemma-4-26b-a4b-it:free": {},
-            "google/gemma-4-31b-it:free": {},
-            "openai/gpt-oss-120b:free": {},
             "openai/gpt-oss-20b:free": {},
-            "z-ai/glm-4.5-air:free": {}
+            "openai/gpt-oss-120b:free": {},
+            "minimax/minimax-m2.5:free": {},
+            "nvidia/nemotron-3-super-120b-a12b:free": {},
+            "nvidia/nemotron-3-nano-30b-a3b:free": {},
+            "nvidia/nemotron-nano-9b-v2:free": {},
+            "google/gemma-4-26b-a4b-it:free": {},
+            "google/gemma-4-31b-it:free": {}
           }
         }
       }

package/models.yaml CHANGED Viewed

@@ -9,9 +9,9 @@
 #
 # JobForge's subagents bind to preset roles via the `role:` field in
 # iso/agents/<slug>.md:
-#   @general-free  → role: fast     (Haiku / OpenRouter MiniMax M2.5 free / gpt-5.4-mini)
+#   @general-free  → role: fast     (Haiku / OpenRouter GLM 4.5 Air free / gpt-5.4-mini)
 #   @general-paid  → role: quality  (Opus 4.7 / OpenRouter Qwen3 Next 80B free / gpt-5.4)
-#   @glm-minimal   → role: minimal  (Haiku / OpenRouter Gemma 4 26B free / gpt-5.4-nano)
+#   @glm-minimal   → role: minimal  (Haiku / OpenRouter GPT-OSS-20B free / gpt-5.4-nano)
 #
 # Override anything by adding fields here. For example, to pin Opus on
 # Claude Code for the @general-paid (quality) role:
@@ -30,13 +30,3 @@
 #           model: gpt-5.4
 extends: openrouter-free
-# Only override the preset where we prefer a different OpenRouter pick.
-# The preset's quality-tier OpenCode pick is openai/gpt-oss-120b:free;
-# we prefer Qwen3 Next 80B for job-application writing quality.
-roles:
-  quality:
-    targets:
-      opencode:
-        provider: openrouter
-        model: qwen/qwen3-next-80b-a3b-instruct:free

package/opencode.json CHANGED Viewed

@@ -3,26 +3,29 @@
   "model": "openrouter/qwen/qwen3-coder:free",
   "agent": {
     "fast": {
-      "model": "openrouter/minimax/minimax-m2.5:free"
+      "model": "openrouter/z-ai/glm-4.5-air:free"
     },
     "quality": {
       "model": "openrouter/qwen/qwen3-next-80b-a3b-instruct:free"
     },
     "minimal": {
-      "model": "openrouter/google/gemma-4-26b-a4b-it:free"
+      "model": "openrouter/openai/gpt-oss-20b:free"
     }
   },
   "provider": {
     "openrouter": {
       "models": {
         "qwen/qwen3-coder:free": {},
-        "minimax/minimax-m2.5:free": {},
+        "z-ai/glm-4.5-air:free": {},
         "qwen/qwen3-next-80b-a3b-instruct:free": {},
-        "google/gemma-4-26b-a4b-it:free": {},
-        "google/gemma-4-31b-it:free": {},
-        "openai/gpt-oss-120b:free": {},
         "openai/gpt-oss-20b:free": {},
-        "z-ai/glm-4.5-air:free": {}
+        "openai/gpt-oss-120b:free": {},
+        "minimax/minimax-m2.5:free": {},
+        "nvidia/nemotron-3-super-120b-a12b:free": {},
+        "nvidia/nemotron-3-nano-30b-a3b:free": {},
+        "nvidia/nemotron-nano-9b-v2:free": {},
+        "google/gemma-4-26b-a4b-it:free": {},
+        "google/gemma-4-31b-it:free": {}
       }
     }
   },

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "job-forge",
-  "version": "2.13.0",
+  "version": "2.14.0",
   "description": "AI-powered job search pipeline built on opencode",
   "type": "module",
   "bin": {