npm - @tikomni/skills - Versions diffs - 1.0.3 → 1.0.4 - Mend

@tikomni/skills 1.0.3 → 1.0.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (9) hide show

package/skills/social-media-crawl/scripts/pipelines/run_douyin_creator_home.py CHANGED Viewed

@@ -250,6 +250,8 @@ def run_douyin_creator_home(
     normalized_profile["extract_trace"] = extract_trace
     normalized_works = [build_work_fact_card(work, platform="douyin") for work in works]
+    stage_status = raw.get("stage_status") if isinstance(raw.get("stage_status"), dict) else {}
+    error_reason = raw.get("error_reason")
     envelope = {
         "object_type": "creator",
         "platform": "douyin",
@@ -267,7 +269,7 @@ def run_douyin_creator_home(
         },
         "completeness": evaluate_collection(profile, normalized_works),
         "missing_fields": normalize_missing_fields(missing),
-        "error_reason": None,
+        "error_reason": error_reason,
         "extract_trace": extract_trace,
         "request_id": request_id,
         "card_write": {
@@ -278,6 +280,8 @@ def run_douyin_creator_home(
         },
         "collection_artifacts": collection_artifacts,
     }
+    if stage_status:
+        envelope["stage_status"] = stage_status
     envelope["output_persist"] = persist_output_envelope(
         envelope=envelope,
         storage_config=config,
@@ -285,10 +289,11 @@ def run_douyin_creator_home(
         fallback_identifier=str(profile.get("platform_author_id") or "author-home"),
     ) if persist_output else {"enabled": False, "skipped": True, "reason": "disabled_by_flag"}
-    progress.done(
+    final_event = progress.failed if envelope.get("error_reason") else progress.done
+    final_event(
         stage="author_home.workflow",
-        message="douyin author_home workflow finished",
-        data={"request_id": request_id, "works_count": len(normalized_works)},
+        message="douyin author_home workflow failed" if envelope.get("error_reason") else "douyin author_home workflow finished",
+        data={"request_id": request_id, "works_count": len(normalized_works), "error_reason": envelope.get("error_reason")},
     )
     return envelope

package/skills/social-media-crawl/scripts/pipelines/run_douyin_single_work.py CHANGED Viewed

@@ -28,7 +28,12 @@ from pathlib import Path
 from typing import Any, Dict, List, Optional
 from scripts.core.config_loader import config_get, load_tikomni_config
-from scripts.core.extract_pipeline import resolve_trace_error_context
+from scripts.core.extract_pipeline import (
+    build_attempted_route,
+    build_route_plan_entry,
+    build_stage_status,
+    resolve_trace_error_context,
+)
 from scripts.core.progress_report import ProgressReporter, build_progress_reporter
 from scripts.pipelines.douyin_video_type_matrix import normalize_douyin_video_type
 from scripts.pipelines.douyin_metadata import (
@@ -394,6 +399,11 @@ def _u1_fetch_one_video(
     app_timeout_ms: int,
     web_timeout_ms: int,
 ) -> Dict[str, Any]:
+    route_plan = [
+        build_route_plan_entry(route_label="app_v3", endpoint=APP_ENDPOINT, method="GET"),
+        build_route_plan_entry(route_label="web", endpoint=WEB_ENDPOINT, method="GET"),
+    ]
+    attempts: List[Dict[str, Any]] = []
     app_response = call_json_api(
         base_url=base_url,
         path=APP_ENDPOINT,
@@ -403,7 +413,24 @@ def _u1_fetch_one_video(
         params={"share_url": share_url},
     )
     app_response["_endpoint"] = APP_ENDPOINT
+    app_response["_route_label"] = "app_v3"
+    attempts.append(
+        build_attempted_route(
+            route_label="app_v3",
+            endpoint=APP_ENDPOINT,
+            response=app_response,
+            accepted=bool(app_response.get("ok")),
+            accept_reason="fetch_response_ok" if app_response.get("ok") else "response_not_ok",
+            fallback_reason="" if app_response.get("ok") else (
+                "primary_timeout_retry_exhausted" if app_response.get("timeout_retry_exhausted") else "primary_non_timeout_failure"
+            ),
+            extra={"response": app_response},
+        )
+    )
     if app_response.get("ok"):
+        app_response["_attempts"] = attempts
+        app_response["_route_plan"] = route_plan
+        app_response["_accept_reason"] = "fetch_response_ok"
         return app_response
     app_response["fallback_trigger_reason"] = (
@@ -418,8 +445,26 @@ def _u1_fetch_one_video(
         params={"share_url": share_url},
     )
     web_response["_endpoint"] = WEB_ENDPOINT
+    web_response["_route_label"] = "web"
     web_response["_app_failed"] = app_response
     web_response["fallback_trigger_reason"] = app_response.get("fallback_trigger_reason")
+    attempts.append(
+        build_attempted_route(
+            route_label="web",
+            endpoint=WEB_ENDPOINT,
+            response=web_response,
+            accepted=bool(web_response.get("ok")),
+            accept_reason="fetch_response_ok" if web_response.get("ok") else "response_not_ok",
+            fallback_reason="" if web_response.get("ok") else (
+                "fallback_timeout_retry_exhausted" if web_response.get("timeout_retry_exhausted") else "fallback_non_timeout_failure"
+            ),
+            extra={"response": web_response},
+        )
+    )
+    web_response["_attempts"] = attempts
+    web_response["_route_plan"] = route_plan
+    if web_response.get("ok"):
+        web_response["_accept_reason"] = "fetch_response_ok"
     return web_response
@@ -578,6 +623,7 @@ def _build_result(
     asr_source: str = "fallback_none",
     timings: Optional[Dict[str, int]] = None,
     missing_fields: Optional[List[Dict[str, str]]] = None,
+    stage_status: Optional[Dict[str, Any]] = None,
 ) -> Dict[str, Any]:
     summary_block = summarize_content(raw_content, source="douyin:single-video-low-quality")
     insights = list(summary_block.get("insights", []))
@@ -656,6 +702,8 @@ def _build_result(
         "endpoint_list": endpoint_list,
         "timings": dict(timings or {}),
     }
+    if isinstance(stage_status, dict):
+        payload["stage_status"] = dict(stage_status)
     return payload
@@ -830,41 +878,67 @@ def run_douyin_single_video(
     )
     timings["u1_total_ms"] = _elapsed_ms(u1_started_at)
-    app_failed = one_video_response.get("_app_failed")
-    if app_failed:
-        _emit_http_progress(progress, stage="single_video.fetch", response=app_failed, route_label="app_primary")
+    attempts = one_video_response.get("_attempts") or []
+    stage_status = build_stage_status(
+        stage="fetch",
+        status="succeeded" if one_video_response.get("ok") else "failed",
+        route_plan=list(one_video_response.get("_route_plan") or []),
+        attempted_routes=list(attempts),
+        chosen_route=str(one_video_response.get("_route_label") or ""),
+        accept_reason=str(one_video_response.get("_accept_reason") or ""),
+        fallback_reason=str(one_video_response.get("fallback_trigger_reason") or ""),
+        error_reason=None if one_video_response.get("ok") else "single_fetch_all_routes_failed",
+        all_routes_failed=not bool(one_video_response.get("ok")),
+    )
+    for index, attempt in enumerate(attempts, start=1):
+        response = attempt.get("response") if isinstance(attempt, dict) else None
+        endpoint = attempt.get("endpoint") if isinstance(attempt, dict) else None
+        label = attempt.get("route_label") if isinstance(attempt, dict) else None
+        if not isinstance(response, dict):
+            if attempt.get("skipped"):
+                trace.append(
+                    {
+                        "step": f"u1_fetch_one_video_attempt_{index}",
+                        "route_label": label,
+                        "endpoint": endpoint,
+                        "accept_reason": attempt.get("accept_reason"),
+                        "fallback_reason": attempt.get("fallback_reason"),
+                        "param_readiness": attempt.get("param_readiness"),
+                        "param_reason": attempt.get("param_reason"),
+                        "skipped": True,
+                    }
+                )
+            continue
+        _emit_http_progress(progress, stage="single_video.fetch", response=response, route_label=str(label or "route"))
+        step = "u1_fetch_one_video_effective" if index == len(attempts) else f"u1_fetch_one_video_attempt_{index}"
         trace.append(
             _trace_step(
-                step="u1_fetch_one_video_primary",
-                endpoint=APP_ENDPOINT,
-                response=app_failed,
-                extra={"timeout_ms": app_timeout},
+                step=step,
+                endpoint=endpoint,
+                response=response,
+                extra={
+                    "route_label": label,
+                    "attempt": index,
+                    "chosen_route": one_video_response.get("_route_label"),
+                    "accept_reason": attempt.get("accept_reason"),
+                    "fallback_reason": attempt.get("fallback_reason"),
+                    "app_timeout_ms": app_timeout,
+                    "web_timeout_ms": web_timeout,
+                },
             )
         )
-    _emit_http_progress(
-        progress,
-        stage="single_video.fetch",
-        response=one_video_response,
-        route_label="effective_route",
-    )
     trace.append(
-        _trace_step(
-            step="u1_fetch_one_video_effective",
-            endpoint=one_video_response.get("_endpoint"),
-            response=one_video_response,
-            extra={
-                "app_timeout_ms": app_timeout,
-                "web_timeout_ms": web_timeout,
-            },
-        )
+        {
+            "step": "u1_fetch_one_video_route_decision",
+            **stage_status,
+        }
     )
     if not one_video_response.get("ok"):
         error_ctx = resolve_trace_error_context(
             responses=[one_video_response],
             extract_trace=trace,
-            default_error_reason="u1_fetch_one_video_failed",
+            default_error_reason="single_fetch_all_routes_failed",
         )
         result = _build_result(
             source_input=source_input,
@@ -889,6 +963,7 @@ def run_douyin_single_video(
             u2_gate_reason="u1_failed",
             analysis_mode=analysis_mode,
             timings=timings,
+            stage_status={"fetch": stage_status},
         )
         if write_card:
             card_started_at = time.perf_counter()
@@ -945,6 +1020,7 @@ def run_douyin_single_video(
             u2_gate_reason="aweme_detail_missing",
             analysis_mode=analysis_mode,
             timings=timings,
+            stage_status={"fetch": stage_status},
         )
         if write_card:
             card_started_at = time.perf_counter()
@@ -1200,6 +1276,7 @@ def run_douyin_single_video(
         analysis_mode=analysis_mode,
         asr_source="u2" if raw_content else "fallback_none",
         timings=timings,
+        stage_status={"fetch": stage_status},
     )
     if write_card:

package/skills/social-media-crawl/scripts/pipelines/run_xiaohongshu_creator_home.py CHANGED Viewed

@@ -249,6 +249,8 @@ def run_xiaohongshu_creator_home(
     normalized_profile["request_id"] = request_id
     normalized_profile["extract_trace"] = extract_trace
     normalized_works = [build_work_fact_card(work, platform="xiaohongshu") for work in works]
+    stage_status = raw.get("stage_status") if isinstance(raw.get("stage_status"), dict) else {}
+    error_reason = raw.get("error_reason")
     envelope = {
         "object_type": "creator",
@@ -267,7 +269,7 @@ def run_xiaohongshu_creator_home(
         },
         "completeness": evaluate_collection(profile, normalized_works),
         "missing_fields": normalize_missing_fields(missing),
-        "error_reason": None,
+        "error_reason": error_reason,
         "extract_trace": extract_trace,
         "request_id": request_id,
         "card_write": {
@@ -278,6 +280,8 @@ def run_xiaohongshu_creator_home(
         },
         "collection_artifacts": collection_artifacts,
     }
+    if stage_status:
+        envelope["stage_status"] = stage_status
     envelope["output_persist"] = persist_output_envelope(
         envelope=envelope,
         storage_config=config,
@@ -285,10 +289,11 @@ def run_xiaohongshu_creator_home(
         fallback_identifier=str(profile.get("platform_author_id") or "author-home"),
     ) if persist_output else {"enabled": False, "skipped": True, "reason": "disabled_by_flag"}
-    progress.done(
+    final_event = progress.failed if envelope.get("error_reason") else progress.done
+    final_event(
         stage="author_home.workflow",
-        message="xiaohongshu author_home workflow finished",
-        data={"request_id": request_id, "works_count": len(normalized_works)},
+        message="xiaohongshu author_home workflow failed" if envelope.get("error_reason") else "xiaohongshu author_home workflow finished",
+        data={"request_id": request_id, "works_count": len(normalized_works), "error_reason": envelope.get("error_reason")},
     )
     return envelope