npm - agent-finance-cli - Versions diffs - 0.1.0 - Mend

agent-finance-cli 0.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (48) hide show

package/Cargo.lock +2632 -0
package/Cargo.toml +31 -0
package/LICENSE-APACHE +202 -0
package/LICENSE-MIT +21 -0
package/README.md +119 -0
package/bin/agent-finance.js +27 -0
package/npm/check-binary-links.js +50 -0
package/npm/check-package.js +39 -0
package/npm/create-platform-package.js +90 -0
package/npm/platform.js +33 -0
package/npm/postinstall.js +62 -0
package/npm/resolve-binary.js +38 -0
package/package.json +54 -0
package/skills/core-full.md +74 -0
package/skills/core.md +59 -0
package/skills/futures.md +18 -0
package/skills/history-indicators.md +42 -0
package/skills/price.md +40 -0
package/skills/providers.md +25 -0
package/skills/research-data.md +34 -0
package/src/app.rs +642 -0
package/src/cache.rs +67 -0
package/src/cli.rs +651 -0
package/src/history.rs +150 -0
package/src/http.rs +76 -0
package/src/indicators.rs +82 -0
package/src/lib.rs +15 -0
package/src/main.rs +4 -0
package/src/model.rs +347 -0
package/src/output.rs +544 -0
package/src/page_read.rs +443 -0
package/src/price.rs +255 -0
package/src/providers/binance_futures.rs +342 -0
package/src/providers/capabilities.rs +322 -0
package/src/providers/cnbc.rs +302 -0
package/src/providers/mod.rs +117 -0
package/src/providers/robinhood.rs +580 -0
package/src/providers/sec_edgar.rs +399 -0
package/src/providers/stooq/catalog.rs +159 -0
package/src/providers/stooq.rs +904 -0
package/src/providers/yahoo.rs +836 -0
package/src/research/fetchers.rs +111 -0
package/src/research/highlights.rs +345 -0
package/src/research/mod.rs +943 -0
package/src/research/tests.rs +42 -0
package/src/skills.rs +58 -0
package/src/stream.rs +356 -0
package/src/time.rs +21 -0

package/src/page_read.rs ADDED Viewed

@@ -0,0 +1,443 @@
+use anyhow::{Context, Result, anyhow};
+use scraper::{Html, Selector};
+use serde::Serialize;
+use url::Url;
+use wreq::{
+    Client,
+    header::{ACCEPT, CONTENT_TYPE},
+};
+use crate::cli::ReadUrlProvider;
+use crate::http::utc_now;
+#[derive(Debug, Clone, Serialize)]
+pub struct PageReadReport {
+    pub url: String,
+    pub provider: String,
+    pub fetched_at_utc: String,
+    pub source_url: String,
+    pub title: Option<String>,
+    pub word_count: usize,
+    pub char_count: usize,
+    pub truncated: bool,
+    pub content: String,
+    pub errors: Vec<PageReadError>,
+}
+#[derive(Debug, Clone, Serialize)]
+pub struct PageReadError {
+    pub provider: String,
+    pub error: String,
+}
+pub async fn read_url(
+    client: &Client,
+    url: &str,
+    provider: ReadUrlProvider,
+    max_chars: usize,
+) -> Result<PageReadReport> {
+    let normalized = normalize_url(url)?;
+    let providers = providers_for_url(provider, &normalized);
+    let mut errors = Vec::new();
+    for provider in providers {
+        match read_with_provider(client, &normalized, provider, max_chars).await {
+            Ok(mut report) => {
+                report.errors = errors;
+                return Ok(report);
+            }
+            Err(error) => errors.push(PageReadError {
+                provider: provider.label().to_string(),
+                error: format!("{error:#}"),
+            }),
+        }
+    }
+    Err(anyhow!(
+        "no URL reader provider returned usable content for {normalized}: {}",
+        errors
+            .iter()
+            .map(|error| format!("{}={}", error.provider, error.error))
+            .collect::<Vec<_>>()
+            .join("; ")
+    ))
+}
+async fn read_with_provider(
+    client: &Client,
+    url: &str,
+    provider: ReadUrlProvider,
+    max_chars: usize,
+) -> Result<PageReadReport> {
+    let source_url = provider_url(url, provider)?;
+    let response = client
+        .get(&source_url)
+        .header(ACCEPT, "text/markdown,text/plain,text/html,*/*")
+        .send()
+        .await
+        .with_context(|| format!("{} request failed", provider.label()))?;
+    let status = response.status();
+    let content_type = response
+        .headers()
+        .get(CONTENT_TYPE)
+        .and_then(|value| value.to_str().ok())
+        .map(str::to_string);
+    let body = response
+        .text()
+        .await
+        .with_context(|| format!("{} response body read failed", provider.label()))?;
+    if !status.is_success() {
+        return Err(anyhow!(
+            "{} returned HTTP {status}: {}",
+            provider.label(),
+            body.chars().take(500).collect::<String>()
+        ));
+    }
+    let extracted = match provider {
+        ReadUrlProvider::Direct => direct_body_to_content(&body, content_type.as_deref()),
+        ReadUrlProvider::Defuddle | ReadUrlProvider::Jina => ExtractedContent {
+            title: title_from_content(&body),
+            content: body,
+        },
+        ReadUrlProvider::Auto => unreachable!("auto is expanded before provider fetch"),
+    };
+    let mut content = extracted.content;
+    content = normalize_content(&content);
+    ensure_usable_content(provider, &content)?;
+    let title = extracted.title.or_else(|| title_from_content(&content));
+    let word_count = content.split_whitespace().count();
+    let char_count = content.chars().count();
+    let (content, truncated) = truncate_chars(&content, max_chars);
+    Ok(PageReadReport {
+        url: url.to_string(),
+        provider: provider.label().to_string(),
+        fetched_at_utc: utc_now(),
+        source_url,
+        title,
+        word_count,
+        char_count,
+        truncated,
+        content,
+        errors: Vec::new(),
+    })
+}
+fn providers_for_url(provider: ReadUrlProvider, url: &str) -> Vec<ReadUrlProvider> {
+    match provider {
+        ReadUrlProvider::Auto if is_sec_archive_url(url) => vec![
+            ReadUrlProvider::Jina,
+            ReadUrlProvider::Defuddle,
+            ReadUrlProvider::Direct,
+        ],
+        ReadUrlProvider::Auto => vec![
+            ReadUrlProvider::Direct,
+            ReadUrlProvider::Jina,
+            ReadUrlProvider::Defuddle,
+        ],
+        provider => vec![provider],
+    }
+}
+fn is_sec_archive_url(url: &str) -> bool {
+    Url::parse(url)
+        .ok()
+        .and_then(|url| {
+            let host_matches = url
+                .host_str()
+                .is_some_and(|host| host.eq_ignore_ascii_case("www.sec.gov"));
+            host_matches.then(|| url.path().starts_with("/Archives/"))
+        })
+        .unwrap_or(false)
+}
+fn provider_url(url: &str, provider: ReadUrlProvider) -> Result<String> {
+    match provider {
+        ReadUrlProvider::Direct => Ok(url.to_string()),
+        ReadUrlProvider::Defuddle => {
+            let parsed = Url::parse(url)?;
+            let host = parsed
+                .host_str()
+                .ok_or_else(|| anyhow!("URL has no host: {url}"))?;
+            let mut target = host.to_string();
+            if let Some(port) = parsed.port() {
+                target.push(':');
+                target.push_str(&port.to_string());
+            }
+            target.push_str(parsed.path());
+            if let Some(query) = parsed.query() {
+                target.push('?');
+                target.push_str(query);
+            }
+            Ok(format!("https://defuddle.md/{target}"))
+        }
+        ReadUrlProvider::Jina => Ok(format!("https://r.jina.ai/{url}")),
+        ReadUrlProvider::Auto => Err(anyhow!("auto does not have a single provider URL")),
+    }
+}
+fn normalize_url(url: &str) -> Result<String> {
+    let trimmed = url.trim();
+    let with_scheme = if trimmed.starts_with("http://") || trimmed.starts_with("https://") {
+        trimmed.to_string()
+    } else {
+        format!("https://{trimmed}")
+    };
+    Url::parse(&with_scheme).with_context(|| format!("invalid URL: {url}"))?;
+    Ok(with_scheme)
+}
+#[derive(Debug)]
+struct ExtractedContent {
+    content: String,
+    title: Option<String>,
+}
+fn direct_body_to_content(body: &str, content_type: Option<&str>) -> ExtractedContent {
+    if content_type
+        .map(|value| value.contains("text/html") || value.contains("application/xhtml"))
+        .unwrap_or_else(|| looks_like_html(body))
+    {
+        html_to_text(body)
+    } else {
+        ExtractedContent {
+            content: body.to_string(),
+            title: None,
+        }
+    }
+}
+fn html_to_text(body: &str) -> ExtractedContent {
+    let body = strip_html_tag_blocks(body, &["script", "style", "noscript"]);
+    let document = Html::parse_document(&body);
+    let title = title_from_html(&body);
+    let body_selector = Selector::parse("body").expect("valid body selector");
+    let mut text = String::new();
+    if let Some(title) = title.as_deref() {
+        text.push_str("# ");
+        text.push_str(title);
+        text.push_str("\n\n");
+    }
+    if let Some(body) = document.select(&body_selector).next() {
+        push_text_nodes(&mut text, body.text());
+    } else {
+        push_text_nodes(&mut text, document.root_element().text());
+    }
+    ExtractedContent {
+        content: text,
+        title,
+    }
+}
+fn ensure_usable_content(provider: ReadUrlProvider, content: &str) -> Result<()> {
+    let words = content.split_whitespace().count();
+    if words < 40 {
+        return Err(anyhow!(
+            "{} returned too little readable content: {words} words",
+            provider.label()
+        ));
+    }
+    if contains_blocked_marker(content) {
+        return Err(anyhow!(
+            "{} returned likely anti-bot or blocked content",
+            provider.label()
+        ));
+    }
+    Ok(())
+}
+fn push_text_nodes<'a>(output: &mut String, nodes: impl Iterator<Item = &'a str>) {
+    for text in nodes {
+        let text = text.trim();
+        if text.is_empty() {
+            continue;
+        }
+        if !output.ends_with([' ', '\n']) {
+            output.push(' ');
+        }
+        output.push_str(text);
+    }
+}
+fn contains_blocked_marker(content: &str) -> bool {
+    [
+        "access denied",
+        "captcha",
+        "cloudflare",
+        "checking your browser",
+        "please enable javascript",
+    ]
+    .iter()
+    .any(|needle| contains_ascii_case_insensitive(content, needle))
+}
+fn contains_ascii_case_insensitive(haystack: &str, needle: &str) -> bool {
+    haystack
+        .as_bytes()
+        .windows(needle.len())
+        .any(|window| window.eq_ignore_ascii_case(needle.as_bytes()))
+}
+fn title_from_html(body: &str) -> Option<String> {
+    let document = Html::parse_document(body);
+    let selector = Selector::parse("title").ok()?;
+    let title = document
+        .select(&selector)
+        .next()?
+        .text()
+        .collect::<Vec<_>>()
+        .join(" ");
+    let title = normalize_inline_text(&title);
+    (!title.is_empty()).then_some(title)
+}
+fn title_from_content(content: &str) -> Option<String> {
+    for line in content.lines().take(8) {
+        let line = line.trim();
+        if let Some(title) = line.strip_prefix("title:") {
+            return Some(title.trim().trim_matches('"').to_string());
+        }
+        if let Some(title) = line.strip_prefix("Title:") {
+            return Some(title.trim().to_string());
+        }
+        if let Some(title) = line.strip_prefix("# ") {
+            return Some(title.trim().to_string());
+        }
+    }
+    None
+}
+fn truncate_chars(content: &str, max_chars: usize) -> (String, bool) {
+    if max_chars == 0 {
+        return (content.to_string(), false);
+    }
+    let mut end = 0;
+    for (count, (index, character)) in content.char_indices().enumerate() {
+        if count >= max_chars {
+            return (content[..end].to_string(), true);
+        }
+        end = index + character.len_utf8();
+    }
+    (content.to_string(), false)
+}
+fn normalize_content(value: &str) -> String {
+    let mut output = Vec::new();
+    let mut previous_blank = false;
+    for line in value.lines() {
+        let line = normalize_inline_text(line);
+        let blank = line.is_empty();
+        if blank {
+            if !previous_blank {
+                output.push(String::new());
+            }
+        } else {
+            output.push(line);
+        }
+        previous_blank = blank;
+    }
+    output.join("\n").trim().to_string()
+}
+fn normalize_inline_text(value: &str) -> String {
+    value.split_whitespace().collect::<Vec<_>>().join(" ")
+}
+fn looks_like_html(body: &str) -> bool {
+    let lower = body
+        .chars()
+        .take(500)
+        .collect::<String>()
+        .to_ascii_lowercase();
+    lower.contains("<html") || lower.contains("<body") || lower.contains("<!doctype")
+}
+fn strip_html_tag_blocks(input: &str, tags: &[&str]) -> String {
+    let mut output = input.to_string();
+    for tag in tags {
+        loop {
+            let lower = output.to_ascii_lowercase();
+            let Some(start) = lower.find(&format!("<{tag}")) else {
+                break;
+            };
+            let Some(relative_end) = lower[start..].find(&format!("</{tag}>")) else {
+                break;
+            };
+            let end = start + relative_end + tag.len() + 3;
+            output.replace_range(start..end, " ");
+        }
+    }
+    output
+}
+#[cfg(test)]
+mod tests {
+    use super::*;
+    #[test]
+    fn defuddle_url_keeps_sec_archive_path_without_double_scheme() {
+        let url = "https://www.sec.gov/Archives/edgar/data/0001807794/000162828026014017/crdo.htm";
+        let provider_url = provider_url(url, ReadUrlProvider::Defuddle).expect("provider URL");
+        assert_eq!(
+            provider_url,
+            "https://defuddle.md/www.sec.gov/Archives/edgar/data/0001807794/000162828026014017/crdo.htm"
+        );
+    }
+    #[test]
+    fn direct_html_extracts_title_and_visible_text() {
+        let html = r#"
+            <html>
+              <head><title>Credo 10-Q</title></head>
+              <body><script>ignored()</script><h1>FORM 10-Q</h1><p>Revenue increased with hyperscale data center customers.</p></body>
+            </html>
+        "#;
+        let extracted = html_to_text(html);
+        assert_eq!(extracted.title.as_deref(), Some("Credo 10-Q"));
+        assert!(extracted.content.contains("# Credo 10-Q"));
+        assert!(extracted.content.contains("FORM 10-Q"));
+        assert!(
+            extracted
+                .content
+                .contains("Revenue increased with hyperscale data center customers.")
+        );
+        assert!(!extracted.content.contains("ignored()"));
+    }
+    #[test]
+    fn unusable_block_pages_are_rejected() {
+        let content = "
+            This page contains enough words to avoid the short-content guard and verify the blocked
+            marker path directly. The response keeps repeating filler words for a normal-looking
+            paragraph, but it still says Access Denied and asks for a Cloudflare captcha challenge
+            before any useful filing or article text becomes available to the reader.
+        ";
+        let error = ensure_usable_content(ReadUrlProvider::Direct, content).expect_err("blocked");
+        assert!(error.to_string().contains("anti-bot"));
+    }
+    #[test]
+    fn short_content_is_rejected_before_anti_bot_markers() {
+        let error = ensure_usable_content(ReadUrlProvider::Direct, "short readable page")
+            .expect_err("short");
+        assert!(error.to_string().contains("too little"));
+    }
+    #[test]
+    fn sec_archive_auto_prefers_reader_fallbacks_before_direct() {
+        let providers = providers_for_url(
+            ReadUrlProvider::Auto,
+            "https://www.sec.gov/Archives/edgar/data/0001807794/000162828026014017/crdo.htm",
+        );
+        assert_eq!(
+            providers,
+            vec![
+                ReadUrlProvider::Jina,
+                ReadUrlProvider::Defuddle,
+                ReadUrlProvider::Direct
+            ]
+        );
+    }
+}

package/src/price.rs ADDED Viewed

@@ -0,0 +1,255 @@
+use std::collections::BTreeMap;
+use chrono::{DateTime, Utc};
+use wreq::Client;
+use crate::cli::SessionMode;
+use crate::http::{change_pct, utc_now};
+use crate::model::{
+    PricePoint, PriceSummary, Quote, RegularBasis, SESSION_EXTENDED, SESSION_OVERNIGHT,
+    SESSION_POST, SESSION_PRE, SESSION_REGULAR,
+};
+use crate::providers::{self, binance_futures, cnbc, robinhood, yahoo};
+use crate::time::{now_local, utc_to_local};
+pub async fn fetch_price_summary(
+    client: &Client,
+    symbol: &str,
+    timezone: &str,
+    mode: SessionMode,
+    proxy_symbol: Option<&str>,
+) -> PriceSummary {
+    let normalized = symbol.trim().to_uppercase();
+    let fetched_at_utc = utc_now();
+    let fetched_at_local = now_local(timezone);
+    let mut errors = BTreeMap::new();
+    let mut sessions = Vec::new();
+    match yahoo::fetch_session_points(client, &normalized, timezone).await {
+        Ok(points) => sessions.extend(points),
+        Err(error) => {
+            errors.insert("yahoo-boats".to_string(), format!("{error:#}"));
+        }
+    }
+    if sessions.is_empty() {
+        match providers::fetch_quote_without_boats(client, &normalized, "fallback").await {
+            Ok(quote) => sessions.push(quote_to_point(
+                quote,
+                "Current price",
+                timezone,
+                Some("Yahoo/Stooq fallback".to_string()),
+            )),
+            Err(error) => {
+                errors.insert("auto".to_string(), format!("{error:#}"));
+            }
+        }
+    }
+    if matches!(mode, SessionMode::All) {
+        match cnbc::fetch_quote(client, &normalized).await {
+            Ok(quote) => sessions.push(quote_to_point(
+                quote,
+                "CNBC extended cross-check",
+                timezone,
+                Some("CNBC ExtendedMktQuote cross-check".to_string()),
+            )),
+            Err(error) => {
+                errors.insert("cnbc-extended".to_string(), format!("{error:#}"));
+            }
+        }
+        match robinhood::fetch_quote(client, &normalized).await {
+            Ok(quote) => sessions.push(quote_to_point(
+                quote,
+                "Robinhood extended cross-check",
+                timezone,
+                Some("Robinhood public quote cross-check".to_string()),
+            )),
+            Err(error) => {
+                errors.insert("robinhood".to_string(), format!("{error:#}"));
+            }
+        }
+    }
+    let proxy = if let Some(proxy_symbol) = proxy_symbol {
+        match binance_futures::fetch_quote(client, proxy_symbol).await {
+            Ok(quote) => Some(quote_to_point(
+                quote,
+                "Binance proxy price",
+                timezone,
+                Some("Proxy price is for price discovery and sentiment monitoring; it is not the stock or legal-equity price".to_string()),
+            )),
+            Err(error) => {
+                errors.insert(
+                    format!("binance-futures:{proxy_symbol}"),
+                    format!("{error:#}"),
+                );
+                None
+            }
+        }
+    } else {
+        None
+    };
+    let regular_basis = regular_basis(&sessions);
+    let current = choose_current(&sessions, mode).cloned();
+    PriceSummary {
+        symbol: normalized,
+        timezone: timezone.to_string(),
+        fetched_at_utc,
+        fetched_at_local,
+        current,
+        regular_basis,
+        sessions,
+        proxy,
+        errors,
+    }
+}
+pub fn quote_to_point(
+    quote: Quote,
+    label: &str,
+    timezone: &str,
+    note: Option<String>,
+) -> PricePoint {
+    PricePoint {
+        label: label.to_string(),
+        symbol: quote.symbol,
+        price: Some(quote.price),
+        currency: quote.currency,
+        provider: quote.provider,
+        session: quote.session,
+        market_time_local: utc_to_local(quote.market_time.as_deref(), timezone),
+        market_time_utc: quote.market_time,
+        change_pct: quote
+            .change_pct
+            .or_else(|| change_pct(quote.price, quote.previous_close)),
+        previous_close: quote.previous_close,
+        open: quote.open,
+        high: quote.high,
+        low: quote.low,
+        volume: quote.volume,
+        exchange: quote.exchange,
+        note,
+    }
+}
+fn choose_current(sessions: &[PricePoint], mode: SessionMode) -> Option<&PricePoint> {
+    match mode {
+        SessionMode::Regular => sessions
+            .iter()
+            .find(|point| has_session(point, SESSION_REGULAR)),
+        SessionMode::Extended => sessions
+            .iter()
+            .filter(|point| {
+                has_session(point, SESSION_PRE)
+                    || has_session(point, SESSION_POST)
+                    || has_session(point, SESSION_EXTENDED)
+            })
+            .max_by_key(|point| point_time(point))
+            .or_else(|| {
+                sessions
+                    .iter()
+                    .find(|point| has_session(point, SESSION_REGULAR))
+            }),
+        SessionMode::Overnight => sessions
+            .iter()
+            .find(|point| has_session(point, SESSION_OVERNIGHT))
+            .or_else(|| choose_current(sessions, SessionMode::Extended)),
+        SessionMode::Smart | SessionMode::All => sessions
+            .iter()
+            .max_by_key(|point| point_time(point))
+            .or_else(|| {
+                [
+                    SESSION_OVERNIGHT,
+                    SESSION_POST,
+                    SESSION_PRE,
+                    SESSION_EXTENDED,
+                    SESSION_REGULAR,
+                ]
+                .iter()
+                .find_map(|session| sessions.iter().find(|point| has_session(point, session)))
+            }),
+    }
+}
+fn regular_basis(sessions: &[PricePoint]) -> RegularBasis {
+    let regular = sessions
+        .iter()
+        .find(|point| has_session(point, SESSION_REGULAR));
+    let fallback = sessions.first();
+    let source = regular.or(fallback);
+    RegularBasis {
+        previous_close: source.and_then(|point| point.previous_close),
+        open: source.and_then(|point| point.open),
+        high: source.and_then(|point| point.high),
+        low: source.and_then(|point| point.low),
+        volume: source.and_then(|point| point.volume),
+    }
+}
+fn has_session(point: &PricePoint, expected: &str) -> bool {
+    point
+        .session
+        .as_deref()
+        .map(|session| session.eq_ignore_ascii_case(expected))
+        .unwrap_or(false)
+}
+fn point_time(point: &PricePoint) -> i64 {
+    point
+        .market_time_utc
+        .as_deref()
+        .and_then(|value| DateTime::parse_from_rfc3339(value).ok())
+        .map(|value| value.with_timezone(&Utc).timestamp())
+        .unwrap_or(0)
+}
+#[cfg(test)]
+mod tests {
+    use super::*;
+    fn point(label: &str, session: &str, utc: &str, price: f64) -> PricePoint {
+        PricePoint {
+            label: label.to_string(),
+            symbol: "CRDO".to_string(),
+            price: Some(price),
+            currency: Some("USD".to_string()),
+            provider: "fixture".to_string(),
+            session: Some(session.to_string()),
+            market_time_utc: Some(utc.to_string()),
+            market_time_local: None,
+            change_pct: None,
+            previous_close: Some(200.0),
+            open: None,
+            high: None,
+            low: None,
+            volume: None,
+            exchange: None,
+            note: None,
+        }
+    }
+    #[test]
+    fn smart_mode_uses_latest_observable_session_not_fixed_priority() {
+        let sessions = vec![
+            point("Regular", "regular", "2026-06-01T20:00:00Z", 226.1),
+            point("Overnight", "overnight", "2026-06-02T07:00:00Z", 206.5),
+        ];
+        let current = choose_current(&sessions, SessionMode::Smart).unwrap();
+        assert_eq!(current.session.as_deref(), Some("overnight"));
+        assert_eq!(current.price, Some(206.5));
+    }
+    #[test]
+    fn regular_mode_ignores_later_overnight_quote() {
+        let sessions = vec![
+            point("Regular", "regular", "2026-06-01T20:00:00Z", 226.1),
+            point("Overnight", "overnight", "2026-06-02T07:00:00Z", 206.5),
+        ];
+        let current = choose_current(&sessions, SessionMode::Regular).unwrap();
+        assert_eq!(current.session.as_deref(), Some("regular"));
+        assert_eq!(current.price, Some(226.1));
+    }
+}