npm - @oss-scout/core - Versions diffs - 1.0.0 → 1.2.0 - Mend

@oss-scout/core 1.0.0 → 1.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (28) hide show

package/dist/cli.bundle.cjs +70 -64
package/dist/cli.js +19 -129
package/dist/commands/search.d.ts +4 -0
package/dist/commands/search.js +2 -0
package/dist/core/anti-llm-policy.js +3 -30
package/dist/core/issue-discovery.d.ts +10 -1
package/dist/core/issue-discovery.js +83 -48
package/dist/core/issue-eligibility.d.ts +2 -1
package/dist/core/issue-eligibility.js +6 -3
package/dist/core/issue-vetting.d.ts +10 -1
package/dist/core/issue-vetting.js +12 -2
package/dist/core/personalization.d.ts +27 -12
package/dist/core/personalization.js +50 -18
package/dist/core/preference-fields.js +2 -0
package/dist/core/probe-repo-file.d.ts +47 -0
package/dist/core/probe-repo-file.js +57 -0
package/dist/core/repo-health.js +9 -17
package/dist/core/roadmap.js +11 -21
package/dist/core/schemas.d.ts +4 -0
package/dist/core/schemas.js +9 -0
package/dist/core/search-phases.d.ts +5 -4
package/dist/core/search-phases.js +12 -9
package/dist/core/types.d.ts +15 -0
package/dist/formatters/human.d.ts +60 -0
package/dist/formatters/human.js +199 -0
package/dist/scout.d.ts +24 -10
package/dist/scout.js +29 -14
package/package.json +1 -1

package/dist/cli.js CHANGED Viewed

@@ -6,6 +6,7 @@ import { Command } from "commander";
 import { enableDebug } from "./core/logger.js";
 import { getCLIVersion } from "./core/utils.js";
 import { formatJsonSuccess, formatJsonError } from "./formatters/json.js";
+import { renderSearch, renderFeatures, renderResults, renderVetList, renderVet, RESULTS_EMPTY_MESSAGE, VET_LIST_EMPTY_MESSAGE, } from "./formatters/human.js";
 import { ValidationError, errorMessage, resolveErrorCode, } from "./core/errors.js";
 import { hasLocalState, loadLocalState, saveLocalState, } from "./core/local-state.js";
 import { CONCRETE_STRATEGIES, SearchStrategySchema } from "./core/schemas.js";
@@ -30,14 +31,6 @@ async function runAction(options, body) {
         handleCommandError(err, options);
     }
 }
-/** Emoji for a vetting recommendation, shared by the search and vet renderers. */
-function recommendationIcon(recommendation) {
-    if (recommendation === "approve")
-        return "✅";
-    if (recommendation === "skip")
-        return "❌";
-    return "⚠️";
-}
 const program = new Command();
 program
     .name("oss-scout")
@@ -116,6 +109,8 @@ program
     .option("--strategy <strategies>", `Search strategies (${CONCRETE_STRATEGIES.join(",")},all). Defaults to the defaultStrategy preference, or all.`)
     .option("--prefer-languages <list>", "Comma-separated languages to soft-boost in ranking (#1244). Candidates whose repo language matches sort above equally-recommended non-matches. Does not filter results.")
     .option("--prefer-repos <list>", "Comma-separated `owner/repo` slugs to soft-boost in ranking (#1244). Stronger weight than language match. Does not filter results.")
+    .option("--avoid-repos <list>", "Comma-separated `owner/repo` slugs to soft-penalize in ranking (#168). Milder than excludeRepos: pushes them down but does not filter them out.")
+    .option("--boost-issue-types <list>", "Comma-separated issue label types to soft-boost in ranking (#168), case-insensitive (e.g. `bug,good first issue`). Does not filter results.")
     .option("--diversity-ratio <n>", "Fraction of result slots (0-1) reserved for candidates that matched NEITHER preference list (#1244). Counterweights echo-chamber bias as boosts accumulate. Default 0 (disabled).")
     .action(async (count, options) => runAction(options, async () => {
     if (!hasLocalState() && !options.json) {
@@ -175,6 +170,8 @@ program
         strategies,
         preferLanguages: splitCsv(options.preferLanguages),
         preferRepos: splitCsv(options.preferRepos),
+        avoidRepos: splitCsv(options.avoidRepos),
+        boostIssueTypes: splitCsv(options.boostIssueTypes),
         diversityRatio,
     });
     if (options.json) {
@@ -182,30 +179,10 @@ program
     }
     else {
         // Human-readable output
-        console.log(`\nFound ${results.candidates.length} issue candidates:\n`);
-        for (const c of results.candidates) {
-            const icon = recommendationIcon(c.recommendation);
-            const stalledTag = c.linkedPR?.isStalled
-                ? " (stalled PR, revive opportunity)"
-                : "";
-            // Personalization tag (#1244). A candidate is either boosted
-            // (matched a preference) or a diversity slot (matched none and
-            // filled a reserved slot); never both.
-            let personalizationTag = "";
-            if (c.boostScore && c.boostReasons && c.boostReasons.length > 0) {
-                personalizationTag = ` [boosted: ${c.boostReasons.join("; ")}]`;
-            }
-            else if (c.diversitySlot) {
-                personalizationTag = " [diversity slot]";
-            }
-            console.log(`  ${icon} ${c.issue.repo}#${c.issue.number} [${c.viabilityScore}/100]${personalizationTag}${stalledTag}`);
-            console.log(`     ${c.issue.title}`);
-            console.log(`     ${c.issue.url}`);
-            if (c.repoScore) {
-                console.log(`     Repo: ${c.repoScore.score}/10, ${c.repoScore.mergedPRCount} merged PRs`);
-            }
-            console.log();
-        }
+        console.log(renderSearch(results));
+        // Rate-limit warning stays on stderr (NOT folded into the stdout
+        // render), so --json stdout purity and the stdout/stderr split are
+        // both preserved.
         if (results.rateLimitWarning) {
             console.error(`\n⚠️  ${results.rateLimitWarning}`);
         }
@@ -252,41 +229,11 @@ program
         console.log(formatJsonSuccess(result));
     }
     else {
-        const total = result.quickWins.length + result.biggerBets.length;
-        if (result.message) {
-            console.log(`\n${result.message}\n`);
-        }
-        if (total === 0)
-            return;
-        const headerScope = options.broad
-            ? "across the ecosystem"
-            : "in your anchor repos";
-        console.log(`\n🎯 Feature opportunities ${headerScope} (${result.quickWins.length} quick wins + ${result.biggerBets.length} bigger bets)\n`);
-        if (!options.broad) {
-            console.log(`Anchor repos: ${result.anchorRepos.join(", ")}\n`);
-        }
-        if (result.quickWins.length) {
-            console.log("── Quick wins ─────────────────────────────────────────");
-            for (const c of result.quickWins) {
-                const stalledTag = c.linkedPR?.isStalled
-                    ? " (stalled PR, revive opportunity)"
-                    : "";
-                console.log(`  ${c.issue.repo}#${c.issue.number} [${c.viabilityScore}/100] ${c.issue.title}${stalledTag}`);
-                console.log(`     ${c.issue.url}`);
-            }
-            console.log("");
-        }
-        if (result.biggerBets.length) {
-            console.log("── Bigger bets ────────────────────────────────────────");
-            for (const c of result.biggerBets) {
-                const stalledTag = c.linkedPR?.isStalled
-                    ? " (stalled PR, revive opportunity)"
-                    : "";
-                console.log(`  ${c.issue.repo}#${c.issue.number} [${c.viabilityScore}/100] ${c.issue.title}${stalledTag}`);
-                console.log(`     ${c.issue.url}`);
-            }
-            console.log("");
-        }
+        // renderFeatures returns "" only when there is no message AND
+        // nothing to list; guard so the caller never logs a blank line.
+        const out = renderFeatures(result, { broad: options.broad });
+        if (out)
+            console.log(out);
     }
 }));
 // ── results command ────────────────────────────────────────────────
@@ -313,21 +260,10 @@ resultsCmd
         return;
     }
     if (results.length === 0) {
-        console.log("\nNo saved results. Run `oss-scout search` to find issues.\n");
+        console.log(RESULTS_EMPTY_MESSAGE);
         return;
     }
-    console.log(`\nSaved results (${results.length}):\n`);
-    console.log("  Score  Repo                              Issue   Recommendation  Title");
-    console.log("  ─────  ────────────────────────────────  ──────  ──────────────  ─────");
-    for (const r of results) {
-        const score = String(r.viabilityScore).padStart(3);
-        const repo = r.repo.padEnd(32).slice(0, 32);
-        const issue = `#${r.number}`.padEnd(6);
-        const rec = r.recommendation.padEnd(14);
-        const title = r.title.length > 50 ? r.title.slice(0, 47) + "..." : r.title;
-        console.log(`  ${score}    ${repo}  ${issue}  ${rec}  ${title}`);
-    }
-    console.log();
+    console.log(renderResults(results));
 }));
 resultsCmd
     .command("clear")
@@ -408,35 +344,10 @@ program
     }
     else {
         if (result.results.length === 0) {
-            console.log("\nNo saved results to vet. Run `oss-scout search` first.\n");
+            console.log(VET_LIST_EMPTY_MESSAGE);
             return;
         }
-        console.log(`\nVet-list results (${result.summary.total}):\n`);
-        for (const r of result.results) {
-            const icon = r.status === "still_available"
-                ? "✅"
-                : r.status === "claimed"
-                    ? "🔒"
-                    : r.status === "has_pr"
-                        ? "🔀"
-                        : r.status === "closed"
-                            ? "🚫"
-                            : "❌";
-            const score = r.ok ? ` [${r.viabilityScore}/100]` : "";
-            console.log(`  ${icon} ${r.repo}#${r.number} — ${r.status}${score}`);
-            console.log(`     ${r.title}`);
-        }
-        if (result.transitions.length > 0) {
-            console.log(`\n🔔 Changes since last check (${result.transitions.length}):`);
-            for (const t of result.transitions) {
-                console.log(`  ${t.repo}#${t.number}: ${t.from} → ${t.to}`);
-            }
-        }
-        console.log(`\nSummary: ${result.summary.stillAvailable} available, ${result.summary.claimed} claimed, ${result.summary.hasPR} has PR, ${result.summary.closed} closed, ${result.summary.errors} errors`);
-        if (result.prunedCount != null) {
-            console.log(`Pruned ${result.prunedCount} unavailable issues from saved results.`);
-        }
-        console.log();
+        console.log(renderVetList(result));
     }
 }));
 // ── skip command ───────────────────────────────────────────────────
@@ -538,28 +449,7 @@ program
         console.log(formatJsonSuccess(result));
     }
     else {
-        const icon = recommendationIcon(result.recommendation);
-        console.log(`\n${icon} ${result.issue.repo}#${result.issue.number}: ${result.recommendation.toUpperCase()}`);
-        console.log(`   ${result.issue.title}`);
-        console.log(`   ${result.issue.url}\n`);
-        if (result.reasonsToApprove.length > 0) {
-            console.log("Reasons to approve:");
-            for (const r of result.reasonsToApprove)
-                console.log(`  + ${r}`);
-        }
-        if (result.reasonsToSkip.length > 0) {
-            console.log("Reasons to skip:");
-            for (const r of result.reasonsToSkip)
-                console.log(`  - ${r}`);
-        }
-        if (result.projectHealth.checkFailed) {
-            console.log(`\nProject health: unknown (check failed: ${result.projectHealth.failureReason})`);
-        }
-        else {
-            console.log(`\nProject health: ${result.projectHealth.isActive ? "Active" : "Inactive"}`);
-            console.log(`  Last commit: ${result.projectHealth.daysSinceLastCommit} days ago`);
-            console.log(`  CI status: ${result.projectHealth.ciStatus}`);
-        }
+        console.log(renderVet(result));
     }
 }));
 program.parse();

package/dist/commands/search.d.ts CHANGED Viewed

@@ -64,6 +64,10 @@ interface SearchCommandOptions {
     preferLanguages?: string[];
     /** Soft sort boost for candidates in these `owner/repo` slugs (#1244). */
     preferRepos?: string[];
+    /** Soft sort penalty for candidates in these `owner/repo` slugs (#168). */
+    avoidRepos?: string[];
+    /** Soft sort boost for candidates whose labels match these types (#168). */
+    boostIssueTypes?: string[];
     /** Diversity counterweight: fraction of slots reserved for unboosted candidates (#1244). */
     diversityRatio?: number;
 }

package/dist/commands/search.js CHANGED Viewed

@@ -10,6 +10,8 @@ export async function runSearch(options) {
             strategies: options.strategies,
             preferLanguages: options.preferLanguages,
             preferRepos: options.preferRepos,
+            avoidRepos: options.avoidRepos,
+            boostIssueTypes: options.boostIssueTypes,
             diversityRatio: options.diversityRatio,
         });
         scout.saveResults(result.candidates);

package/dist/core/anti-llm-policy.js CHANGED Viewed

@@ -7,10 +7,9 @@
  * can rely on a structured `AntiLLMPolicyResult` rather than re-implementing
  * the scan in agent prose.
  */
-import { errorMessage, getHttpStatusCode, isRateLimitError, rethrowIfFatal, } from "./errors.js";
-import { warn } from "./logger.js";
+import { getHttpStatusCode, isRateLimitError } from "./errors.js";
 import { getHttpCache, versionedCacheKey } from "./http-cache.js";
-const MODULE = "anti-llm-policy";
+import { probeRepoFile } from "./probe-repo-file.js";
 /** TTL for cached anti-LLM policy scan results (1 hour). Policy docs change rarely. */
 const POLICY_SCAN_CACHE_TTL_MS = 60 * 60 * 1000;
 /**
@@ -85,39 +84,13 @@ const SOURCE_FILE_FAMILIES = [
         paths: ["README.md", "readme.md", "Readme.md"],
     },
 ];
-/**
- * Fetch one path's raw text content. The `transient` flag distinguishes a
- * clean miss (404 — file absent) from a degraded miss (5xx, network) so the
- * caller can decide whether to cache "no policy" or retry. Throws on
- * 401/auth and rate-limit per documented project error strategy.
- */
-async function fetchFileText(octokit, owner, repo, path) {
-    try {
-        const { data } = await octokit.repos.getContent({ owner, repo, path });
-        if ("content" in data && typeof data.content === "string") {
-            return {
-                text: Buffer.from(data.content, "base64").toString("utf-8"),
-                transient: false,
-            };
-        }
-        return { text: null, transient: false };
-    }
-    catch (error) {
-        const status = getHttpStatusCode(error);
-        if (status === 404)
-            return { text: null, transient: false };
-        rethrowIfFatal(error);
-        warn(MODULE, `Unexpected error fetching ${path} from ${owner}/${repo}: ${errorMessage(error)}`);
-        return { text: null, transient: true };
-    }
-}
 /**
  * Fetch the first available file from a family. Probes are issued in parallel,
  * but auth/rate-limit rejections re-throw so the IssueVetter's existing
  * rate-limit handling kicks in instead of silently caching a wrong answer.
  */
 async function fetchFamilyText(octokit, owner, repo, paths) {
-    const results = await Promise.allSettled(paths.map((p) => fetchFileText(octokit, owner, repo, p)));
+    const results = await Promise.allSettled(paths.map((p) => probeRepoFile(octokit, owner, repo, p)));
     let hadTransientFailure = false;
     for (const result of results) {
         if (result.status === "fulfilled") {

package/dist/core/issue-discovery.d.ts CHANGED Viewed

@@ -11,6 +11,7 @@
  *
  * All state is injected via constructor parameters (ScoutStateReader + ScoutPreferences).
  */
+import { type SearchBudgetTracker } from "./search-budget.js";
 import { type IssueCandidate } from "./types.js";
 import type { ScoutPreferences, SearchStrategy } from "./schemas.js";
 import { type ScoutStateReader } from "./issue-vetting.js";
@@ -31,14 +32,20 @@ export declare class IssueDiscovery {
     private octokit;
     private githubToken;
     private vetter;
+    private budgetTracker;
     /** Set after searchIssues() runs if rate limits affected the search (low pre-flight quota or mid-search rate limit hits). */
     rateLimitWarning: string | null;
     /**
      * @param githubToken  - GitHub personal access token or token from `gh auth token`
      * @param preferences  - User's search preferences (languages, labels, scopes, etc.)
      * @param stateReader  - Read-only interface for accessing scout state (merged PRs, starred repos, etc.)
+     * @param budgetTracker - Search budget tracker. Defaults to the shared
+     *   singleton so existing callers behave identically. A long-lived host
+     *   serving concurrent searches can inject a per-search instance so one
+     *   search's init() no longer resets the budget state of another (the
+     *   shared-singleton concurrency hazard, #156).
      */
-    constructor(githubToken: string, preferences: ScoutPreferences, stateReader: ScoutStateReader);
+    constructor(githubToken: string, preferences: ScoutPreferences, stateReader: ScoutStateReader, budgetTracker?: SearchBudgetTracker);
     /**
      * Get starred repos from the state reader.
      * @returns Array of starred repo names in "owner/repo" format
@@ -76,6 +83,8 @@ export declare class IssueDiscovery {
         skippedUrls?: Set<string>;
         preferLanguages?: string[];
         preferRepos?: string[];
+        avoidRepos?: string[];
+        boostIssueTypes?: string[];
         diversityRatio?: number;
         interPhaseDelayMs?: number;
         broadPhaseDelayMs?: number;

package/dist/core/issue-discovery.js CHANGED Viewed

@@ -12,7 +12,7 @@
  * All state is injected via constructor parameters (ScoutStateReader + ScoutPreferences).
  */
 import { getOctokit, checkRateLimit } from "./github.js";
-import { getSearchBudgetTracker } from "./search-budget.js";
+import { getSearchBudgetTracker, } from "./search-budget.js";
 import { daysBetween, extractRepoFromUrl, sleep } from "./utils.js";
 import { SCOPE_LABELS, } from "./types.js";
 import { CONCRETE_STRATEGIES } from "./schemas.js";
@@ -28,6 +28,20 @@ const MODULE = "issue-discovery";
 const LOW_BUDGET_THRESHOLD = 20;
 /** If remaining search quota is below this, only run Phase 0. */
 const CRITICAL_BUDGET_THRESHOLD = 10;
+/**
+ * Page size for Phase 0 (repos the user has contributed to). Larger than the
+ * default 5 so the backlog of open issues in known repos is reachable, not
+ * just the 5 newest-created. One `listForRepo` call regardless of page size,
+ * so this widens the candidate pool at no extra REST cost.
+ */
+const PHASE0_PER_PAGE = 30;
+/**
+ * Max issue age (by last activity) for Phase 0 contributed repos. Relaxed well
+ * past the default `maxIssueAgeDays` (90) because in a repo the user already
+ * knows, an older-but-still-open issue is still worth evaluating — the vetter
+ * screens staleness, existing PRs, and claims downstream.
+ */
+const CONTRIBUTED_REPO_MAX_AGE_DAYS = 365;
 /** Build a reusable filter function from config. */
 function buildIssueFilter(config) {
     return (items) => {
@@ -63,8 +77,8 @@ function buildIssueFilter(config) {
 }
 /** Phase 0: Search repos where user has merged PRs (highest merge probability). */
 async function runPhase0(octokit, vetter, repos, maxResults, filterIssues) {
-    info(MODULE, `Phase 0: Searching issues in ${repos.length} merged-PR repos (no label filter)...`);
-    const { candidates, allReposFailed, rateLimitHit } = await fetchIssuesFromKnownRepos(octokit, vetter, repos, [], maxResults, "merged_pr", filterIssues);
+    info(MODULE, `Phase 0: Searching issues in ${repos.length} merged-PR repos (no label filter, ${PHASE0_PER_PAGE}/repo)...`);
+    const { candidates, allReposFailed, rateLimitHit } = await fetchIssuesFromKnownRepos(octokit, vetter, repos, [], maxResults, "merged_pr", filterIssues, PHASE0_PER_PAGE);
     info(MODULE, `Found ${candidates.length} candidates from merged-PR repos`);
     return {
         candidates,
@@ -87,7 +101,7 @@ async function runPhase1(octokit, vetter, repos, labels, maxResults, filterIssue
     };
 }
 /** Phase 2: General label-filtered search with multi-tier interleaving. */
-async function runPhase2(octokit, vetter, scopes, labels, configLabels, languages, isAnyLanguage, maxResults, minStars, phase0RepoSet, starredRepoSet, existingCandidates, filterIssues) {
+async function runPhase2(octokit, vetter, scopes, labels, configLabels, languages, isAnyLanguage, maxResults, minStars, phase0RepoSet, starredRepoSet, existingCandidates, filterIssues, tracker) {
     info(MODULE, "Phase 2: General issue search...");
     const seenRepos = new Set(existingCandidates.map((c) => c.issue.repo));
     // Build per-tier label groups. Multi-tier when 2+ scopes; single-tier otherwise.
@@ -116,7 +130,7 @@ async function runPhase2(octokit, vetter, scopes, labels, configLabels, language
     let rateLimitHit = false;
     for (const { tier, tierLabels } of tierLabelGroups) {
         try {
-            const allItems = await searchAcrossLanguagesAndLabels(octokit, languages, isAnyLanguage, tierLabels, (langQ) => `is:issue is:open ${langQ} no:assignee`.replace(/  +/g, " ").trim(), budgetPerTier * 3);
+            const allItems = await searchAcrossLanguagesAndLabels(octokit, languages, isAnyLanguage, tierLabels, (langQ) => `is:issue is:open ${langQ} no:assignee`.replace(/  +/g, " ").trim(), budgetPerTier * 3, tracker);
             info(MODULE, `Phase 2 [${tier}]: processing ${allItems.length} items...`);
             const { candidates: tierCandidates, allVetFailed, rateLimitHit: vetRateLimitHit, } = await filterVetAndScore(vetter, allItems, filterIssues, [phase0RepoSet, starredRepoSet, seenRepos], budgetPerTier, minStars, `Phase 2 [${tier}]`);
             tierResults.push(tierCandidates);
@@ -153,7 +167,7 @@ async function runPhase2(octokit, vetter, scopes, labels, configLabels, language
     };
 }
 /** Phase 3: Actively maintained repos (REST-first, Search API fallback). */
-async function runPhase3(octokit, vetter, langQuery, minStars, projectCategories, maxResults, phase0RepoSet, starredRepoSet, starredRepos, existingCandidates, filterIssues) {
+async function runPhase3(octokit, vetter, langQuery, minStars, projectCategories, maxResults, phase0RepoSet, starredRepoSet, starredRepos, existingCandidates, filterIssues, tracker) {
     info(MODULE, "Phase 3: Searching actively maintained repos...");
     const seenRepos = new Set(existingCandidates.map((c) => c.issue.repo));
     // Step 1: Try REST API with starred repos first (no Search API quota used)
@@ -196,7 +210,7 @@ async function runPhase3(octokit, vetter, langQuery, minStars, projectCategories
             sort: "updated",
             order: "desc",
             per_page: maxResults * 3,
-        });
+        }, tracker);
         info(MODULE, `Found ${data.total_count} issues in maintained-repo search, processing top ${data.items.length}...`);
         const { candidates, allVetFailed, rateLimitHit: vetRateLimitHit, } = await filterVetAndScore(vetter, data.items, filterIssues, [phase0RepoSet, starredRepoSet, seenRepos], maxResults, minStars, "Phase 3");
         info(MODULE, `Found ${candidates.length} candidates from maintained-repo search`);
@@ -236,19 +250,28 @@ export class IssueDiscovery {
     octokit;
     githubToken;
     vetter;
+    budgetTracker;
     /** Set after searchIssues() runs if rate limits affected the search (low pre-flight quota or mid-search rate limit hits). */
     rateLimitWarning = null;
     /**
      * @param githubToken  - GitHub personal access token or token from `gh auth token`
      * @param preferences  - User's search preferences (languages, labels, scopes, etc.)
      * @param stateReader  - Read-only interface for accessing scout state (merged PRs, starred repos, etc.)
+     * @param budgetTracker - Search budget tracker. Defaults to the shared
+     *   singleton so existing callers behave identically. A long-lived host
+     *   serving concurrent searches can inject a per-search instance so one
+     *   search's init() no longer resets the budget state of another (the
+     *   shared-singleton concurrency hazard, #156).
      */
-    constructor(githubToken, preferences, stateReader) {
+    constructor(githubToken, preferences, stateReader, budgetTracker = getSearchBudgetTracker()) {
         this.preferences = preferences;
         this.stateReader = stateReader;
         this.githubToken = githubToken;
         this.octokit = getOctokit(githubToken);
-        this.vetter = new IssueVetter(this.octokit, this.stateReader);
+        this.budgetTracker = budgetTracker;
+        // Thread the same tracker into the vetter so the merged-PR Search API
+        // call (checkUserMergedPRsInRepo) pays the same budget as the search phases.
+        this.vetter = new IssueVetter(this.octokit, this.stateReader, this.budgetTracker);
     }
     /**
      * Get starred repos from the state reader.
@@ -300,9 +323,27 @@ export class IssueDiscovery {
         const allCandidates = [];
         const phaseErrors = {};
         let rateLimitHitDuringSearch = false;
+        // The standard inter-phase pause for rate-limit management. Phases 1, 2,
+        // and 3 all apply this identical delay before querying (Phase 0 is first,
+        // so it never waits). The broad phase wraps this with an extra cooldown.
+        const applyInterPhaseDelay = async () => {
+            if (interPhaseDelay > 0) {
+                info(MODULE, `Waiting ${(interPhaseDelay / 1000).toFixed(0)}s between phases for rate limit management...`);
+                await sleep(interPhaseDelay);
+            }
+        };
+        // Fold a phase's result into the running totals. Every phase accumulates
+        // candidates, records its error under a stable key, and flips the
+        // rate-limit flag the same way; only the key and the result differ.
+        const recordPhaseResult = (key, result) => {
+            allCandidates.push(...result.candidates);
+            phaseErrors[key] = result.error;
+            if (result.rateLimitHit)
+                rateLimitHitDuringSearch = true;
+        };
         // Pre-flight rate limit check
         this.rateLimitWarning = null;
-        const tracker = getSearchBudgetTracker();
+        const tracker = this.budgetTracker;
         let searchBudget = LOW_BUDGET_THRESHOLD - 1;
         try {
             const rateLimit = await checkRateLimit(this.githubToken);
@@ -347,15 +388,24 @@ export class IssueDiscovery {
         if (aiBlocklisted.size > 0) {
             debug(MODULE, `[AI_POLICY_FILTER] Filtering issues from ${aiBlocklisted.size} blocklisted repo(s): ${[...aiBlocklisted].join(", ")}`);
         }
-        const filterIssues = buildIssueFilter({
+        const baseFilterConfig = {
             excludedRepos: new Set(config.excludeRepos.map((r) => r.toLowerCase())),
             excludeOrgs: new Set((config.excludeOrgs ?? []).map((o) => o.toLowerCase())),
             aiBlocklisted,
             lowScoringRepos,
             skippedUrls: options.skippedUrls ?? new Set(),
-            maxAgeDays: config.maxIssueAgeDays || 90,
             now: new Date(),
             includeDocIssues: config.includeDocIssues ?? true,
+        };
+        const filterIssues = buildIssueFilter({
+            ...baseFilterConfig,
+            maxAgeDays: config.maxIssueAgeDays || 90,
+        });
+        // Phase 0 (contributed repos) gets a relaxed age window so the existing
+        // backlog surfaces, not just issues active in the last 90 days.
+        const filterIssuesPhase0 = buildIssueFilter({
+            ...baseFilterConfig,
+            maxAgeDays: CONTRIBUTED_REPO_MAX_AGE_DAYS,
         });
         // Phase 0: Repos the user has engaged with — merged PRs first (strongest
         // signal), then open PRs (active engagement even without a merge yet).
@@ -374,11 +424,8 @@ export class IssueDiscovery {
         if (phase0Repos.length > 0 && enabledStrategies.has("merged")) {
             const remaining = maxResults - allCandidates.length;
             if (remaining > 0) {
-                const result = await runPhase0(this.octokit, this.vetter, phase0Repos, remaining, filterIssues);
-                allCandidates.push(...result.candidates);
-                phaseErrors["0"] = result.error;
-                if (result.rateLimitHit)
-                    rateLimitHitDuringSearch = true;
+                const result = await runPhase0(this.octokit, this.vetter, phase0Repos, remaining, filterIssuesPhase0);
+                recordPhaseResult("0", result);
             }
             strategiesUsed.push("merged");
         }
@@ -387,19 +434,13 @@ export class IssueDiscovery {
             starredRepos.length > 0 &&
             searchBudget >= CRITICAL_BUDGET_THRESHOLD &&
             enabledStrategies.has("starred")) {
-            if (interPhaseDelay > 0) {
-                info(MODULE, `Waiting ${(interPhaseDelay / 1000).toFixed(0)}s between phases for rate limit management...`);
-                await sleep(interPhaseDelay);
-            }
+            await applyInterPhaseDelay();
             const reposToSearch = starredRepos.filter((r) => !phase0RepoSet.has(r));
             if (reposToSearch.length > 0) {
                 const remaining = maxResults - allCandidates.length;
                 if (remaining > 0) {
                     const result = await runPhase1(this.octokit, this.vetter, reposToSearch, labels, remaining, filterIssues);
-                    allCandidates.push(...result.candidates);
-                    phaseErrors["1"] = result.error;
-                    if (result.rateLimitHit)
-                        rateLimitHitDuringSearch = true;
+                    recordPhaseResult("1", result);
                     // Recorded only when the phase actually queried (#130)
                     strategiesUsed.push("starred");
                 }
@@ -424,10 +465,7 @@ export class IssueDiscovery {
             }
             else {
                 // Always apply baseline inter-phase delay
-                if (interPhaseDelay > 0) {
-                    info(MODULE, `Waiting ${(interPhaseDelay / 1000).toFixed(0)}s between phases for rate limit management...`);
-                    await sleep(interPhaseDelay);
-                }
+                await applyInterPhaseDelay();
                 // Apply additional broad-phase cooldown, but skip if previous phases found nothing
                 if (allCandidates.length > 0 && broadDelay > 0) {
                     info(MODULE, `Waiting ${(broadDelay / 1000).toFixed(0)}s for rate limit cooldown before broad search...`);
@@ -437,11 +475,8 @@ export class IssueDiscovery {
                     info(MODULE, `Skipping broad phase delay: no results from previous phases, proceeding immediately`);
                 }
                 const remaining = maxResults - allCandidates.length;
-                const result = await runPhase2(this.octokit, this.vetter, scopes, labels, config.labels, languages, isAnyLanguage, remaining, minStars, phase0RepoSet, starredRepoSet, allCandidates, filterIssues);
-                allCandidates.push(...result.candidates);
-                phaseErrors["2"] = result.error;
-                if (result.rateLimitHit)
-                    rateLimitHitDuringSearch = true;
+                const result = await runPhase2(this.octokit, this.vetter, scopes, labels, config.labels, languages, isAnyLanguage, remaining, minStars, phase0RepoSet, starredRepoSet, allCandidates, filterIssues, tracker);
+                recordPhaseResult("2", result);
                 // Recorded only when the phase actually queried, not when the
                 // skip-threshold branch short-circuited it (#130)
                 strategiesUsed.push("broad");
@@ -451,16 +486,10 @@ export class IssueDiscovery {
         if (allCandidates.length < maxResults &&
             searchBudget >= LOW_BUDGET_THRESHOLD &&
             enabledStrategies.has("maintained")) {
-            if (interPhaseDelay > 0) {
-                info(MODULE, `Waiting ${(interPhaseDelay / 1000).toFixed(0)}s between phases for rate limit management...`);
-                await sleep(interPhaseDelay);
-            }
+            await applyInterPhaseDelay();
             const remaining = maxResults - allCandidates.length;
-            const result = await runPhase3(this.octokit, this.vetter, langQuery, minStars, config.projectCategories ?? [], remaining, phase0RepoSet, starredRepoSet, starredRepos, allCandidates, filterIssues);
-            allCandidates.push(...result.candidates);
-            phaseErrors["3"] = result.error;
-            if (result.rateLimitHit)
-                rateLimitHitDuringSearch = true;
+            const result = await runPhase3(this.octokit, this.vetter, langQuery, minStars, config.projectCategories ?? [], remaining, phase0RepoSet, starredRepoSet, starredRepos, allCandidates, filterIssues, tracker);
+            recordPhaseResult("3", result);
             strategiesUsed.push("maintained");
         }
         // Build result / error summary
@@ -501,11 +530,17 @@ export class IssueDiscovery {
                     `Found ${allCandidates.length} candidate${allCandidates.length === 1 ? "" : "s"} but some search phases were limited. ` +
                     `Try again after the rate limit resets for complete results.`;
         }
-        // Personalization annotation (#1244): tag matched candidates with a
-        // `personalization` marker before sorting so the new sort tier has values
-        // to read. Returns a new array (no in-place candidate mutation, #158);
-        // a no-op when neither preference list is supplied.
-        const ranked = annotateBoost(allCandidates, options.preferLanguages, options.preferRepos);
+        // Personalization annotation (#1244, extended #168): tag candidates with a
+        // net `personalization` marker (preferRepos/preferLanguages/boostIssueTypes
+        // add, avoidRepos subtracts) before sorting so the sort tier has values to
+        // read. Returns a new array (no in-place candidate mutation, #158); a no-op
+        // when none of the bias lists are supplied.
+        const ranked = annotateBoost(allCandidates, {
+            preferLanguages: options.preferLanguages,
+            preferRepos: options.preferRepos,
+            avoidRepos: options.avoidRepos,
+            boostIssueTypes: options.boostIssueTypes,
+        });
         // Sort by priority, recommendation, boost (#1244), then viability score
         ranked.sort((a, b) => {
             const priorityOrder = {

package/dist/core/issue-eligibility.d.ts CHANGED Viewed

@@ -6,6 +6,7 @@
  * Extracted from issue-vetting.ts to isolate eligibility logic.
  */
 import { Octokit } from "@octokit/rest";
+import { type SearchBudgetTracker } from "./search-budget.js";
 import type { CheckResult, LinkedPR } from "./types.js";
 /**
  * Result of the existing-PR check, including metadata for the first linked PR
@@ -29,7 +30,7 @@ export declare function checkNoExistingPR(octokit: Octokit, owner: string, repo:
  * Results are cached per-repo for 15 minutes to avoid redundant Search API
  * calls when multiple issues from the same repo are vetted.
  */
-export declare function checkUserMergedPRsInRepo(octokit: Octokit, owner: string, repo: string): Promise<number | null>;
+export declare function checkUserMergedPRsInRepo(octokit: Octokit, owner: string, repo: string, tracker?: SearchBudgetTracker): Promise<number | null>;
 /**
  * Check whether an issue has been claimed by another contributor
  * by scanning recent comments for claim phrases.

package/dist/core/issue-eligibility.js CHANGED Viewed

@@ -9,7 +9,7 @@ import { paginateAll } from "./pagination.js";
 import { errorMessage, rethrowIfFatal } from "./errors.js";
 import { warn } from "./logger.js";
 import { getHttpCache, withInflightDedup, versionedCacheKey, } from "./http-cache.js";
-import { getSearchBudgetTracker } from "./search-budget.js";
+import { getSearchBudgetTracker, } from "./search-budget.js";
 function isLinkedPREvent(e) {
     return e.event === "cross-referenced" && !!e.source?.issue?.pull_request;
 }
@@ -161,7 +161,11 @@ const MERGED_PR_CACHE_TTL_MS = 15 * 60 * 1000;
  * Results are cached per-repo for 15 minutes to avoid redundant Search API
  * calls when multiple issues from the same repo are vetted.
  */
-export async function checkUserMergedPRsInRepo(octokit, owner, repo) {
+export async function checkUserMergedPRsInRepo(octokit, owner, repo,
+// Optional injected budget tracker. Defaults to the shared singleton so
+// existing callers keep the same global budget accounting; a host wanting
+// per-search isolation threads its own tracker down from IssueVetter.
+tracker = getSearchBudgetTracker()) {
     const cache = getHttpCache();
     const cacheKey = versionedCacheKey(`merged-prs:${owner}/${repo}`);
     // In-flight dedup: parallel vetting frequently hits several issues from
@@ -177,7 +181,6 @@ export async function checkUserMergedPRsInRepo(octokit, owner, repo) {
             return cached;
         }
         try {
-            const tracker = getSearchBudgetTracker();
             await tracker.waitForBudget();
             try {
                 // Use @me to search as the authenticated user