npm - @godscene/core - Versions diffs - 1.7.11 - Mend

@godscene/core 1.7.11

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (189) hide show

package/LICENSE +21 -0
package/README.md +9 -0
package/dist/es/agent/agent.mjs +767 -0
package/dist/es/agent/common.mjs +0 -0
package/dist/es/agent/execution-session.mjs +39 -0
package/dist/es/agent/index.mjs +6 -0
package/dist/es/agent/task-builder.mjs +343 -0
package/dist/es/agent/task-cache.mjs +212 -0
package/dist/es/agent/tasks.mjs +428 -0
package/dist/es/agent/ui-utils.mjs +101 -0
package/dist/es/agent/utils.mjs +167 -0
package/dist/es/ai-model/auto-glm/actions.mjs +237 -0
package/dist/es/ai-model/auto-glm/index.mjs +6 -0
package/dist/es/ai-model/auto-glm/parser.mjs +237 -0
package/dist/es/ai-model/auto-glm/planning.mjs +69 -0
package/dist/es/ai-model/auto-glm/prompt.mjs +220 -0
package/dist/es/ai-model/auto-glm/util.mjs +7 -0
package/dist/es/ai-model/connectivity.mjs +136 -0
package/dist/es/ai-model/conversation-history.mjs +193 -0
package/dist/es/ai-model/index.mjs +12 -0
package/dist/es/ai-model/inspect.mjs +395 -0
package/dist/es/ai-model/llm-planning.mjs +231 -0
package/dist/es/ai-model/prompt/common.mjs +5 -0
package/dist/es/ai-model/prompt/describe.mjs +64 -0
package/dist/es/ai-model/prompt/extraction.mjs +129 -0
package/dist/es/ai-model/prompt/llm-locator.mjs +49 -0
package/dist/es/ai-model/prompt/llm-planning.mjs +584 -0
package/dist/es/ai-model/prompt/llm-section-locator.mjs +42 -0
package/dist/es/ai-model/prompt/order-sensitive-judge.mjs +33 -0
package/dist/es/ai-model/prompt/playwright-generator.mjs +115 -0
package/dist/es/ai-model/prompt/ui-tars-planning.mjs +34 -0
package/dist/es/ai-model/prompt/util.mjs +57 -0
package/dist/es/ai-model/prompt/yaml-generator.mjs +201 -0
package/dist/es/ai-model/service-caller/codex-app-server.mjs +573 -0
package/dist/es/ai-model/service-caller/image-detail.mjs +4 -0
package/dist/es/ai-model/service-caller/index.mjs +648 -0
package/dist/es/ai-model/service-caller/request-timeout.mjs +47 -0
package/dist/es/ai-model/ui-tars-planning.mjs +247 -0
package/dist/es/common.mjs +382 -0
package/dist/es/device/device-options.mjs +0 -0
package/dist/es/device/index.mjs +340 -0
package/dist/es/dump/html-utils.mjs +290 -0
package/dist/es/dump/index.mjs +3 -0
package/dist/es/dump/screenshot-restoration.mjs +30 -0
package/dist/es/dump/screenshot-store.mjs +125 -0
package/dist/es/index.mjs +17 -0
package/dist/es/report-cli.mjs +149 -0
package/dist/es/report-generator.mjs +203 -0
package/dist/es/report-markdown.mjs +216 -0
package/dist/es/report.mjs +287 -0
package/dist/es/screenshot-item.mjs +120 -0
package/dist/es/service/index.mjs +272 -0
package/dist/es/service/utils.mjs +13 -0
package/dist/es/skill/index.mjs +35 -0
package/dist/es/task-runner.mjs +261 -0
package/dist/es/task-timing.mjs +10 -0
package/dist/es/tree.mjs +11 -0
package/dist/es/types.mjs +202 -0
package/dist/es/utils.mjs +232 -0
package/dist/es/yaml/builder.mjs +11 -0
package/dist/es/yaml/index.mjs +4 -0
package/dist/es/yaml/player.mjs +425 -0
package/dist/es/yaml/utils.mjs +100 -0
package/dist/es/yaml.mjs +0 -0
package/dist/lib/agent/agent.js +815 -0
package/dist/lib/agent/common.js +5 -0
package/dist/lib/agent/execution-session.js +73 -0
package/dist/lib/agent/index.js +76 -0
package/dist/lib/agent/task-builder.js +380 -0
package/dist/lib/agent/task-cache.js +264 -0
package/dist/lib/agent/tasks.js +471 -0
package/dist/lib/agent/ui-utils.js +153 -0
package/dist/lib/agent/utils.js +238 -0
package/dist/lib/ai-model/auto-glm/actions.js +271 -0
package/dist/lib/ai-model/auto-glm/index.js +64 -0
package/dist/lib/ai-model/auto-glm/parser.js +280 -0
package/dist/lib/ai-model/auto-glm/planning.js +103 -0
package/dist/lib/ai-model/auto-glm/prompt.js +257 -0
package/dist/lib/ai-model/auto-glm/util.js +44 -0
package/dist/lib/ai-model/connectivity.js +180 -0
package/dist/lib/ai-model/conversation-history.js +227 -0
package/dist/lib/ai-model/index.js +127 -0
package/dist/lib/ai-model/inspect.js +441 -0
package/dist/lib/ai-model/llm-planning.js +268 -0
package/dist/lib/ai-model/prompt/common.js +39 -0
package/dist/lib/ai-model/prompt/describe.js +98 -0
package/dist/lib/ai-model/prompt/extraction.js +169 -0
package/dist/lib/ai-model/prompt/llm-locator.js +86 -0
package/dist/lib/ai-model/prompt/llm-planning.js +621 -0
package/dist/lib/ai-model/prompt/llm-section-locator.js +79 -0
package/dist/lib/ai-model/prompt/order-sensitive-judge.js +70 -0
package/dist/lib/ai-model/prompt/playwright-generator.js +176 -0
package/dist/lib/ai-model/prompt/ui-tars-planning.js +71 -0
package/dist/lib/ai-model/prompt/util.js +103 -0
package/dist/lib/ai-model/prompt/yaml-generator.js +262 -0
package/dist/lib/ai-model/service-caller/codex-app-server.js +622 -0
package/dist/lib/ai-model/service-caller/image-detail.js +38 -0
package/dist/lib/ai-model/service-caller/index.js +716 -0
package/dist/lib/ai-model/service-caller/request-timeout.js +93 -0
package/dist/lib/ai-model/ui-tars-planning.js +281 -0
package/dist/lib/common.js +491 -0
package/dist/lib/device/device-options.js +18 -0
package/dist/lib/device/index.js +467 -0
package/dist/lib/dump/html-utils.js +366 -0
package/dist/lib/dump/index.js +58 -0
package/dist/lib/dump/screenshot-restoration.js +64 -0
package/dist/lib/dump/screenshot-store.js +165 -0
package/dist/lib/index.js +184 -0
package/dist/lib/report-cli.js +189 -0
package/dist/lib/report-generator.js +244 -0
package/dist/lib/report-markdown.js +253 -0
package/dist/lib/report.js +333 -0
package/dist/lib/screenshot-item.js +154 -0
package/dist/lib/service/index.js +306 -0
package/dist/lib/service/utils.js +47 -0
package/dist/lib/skill/index.js +69 -0
package/dist/lib/task-runner.js +298 -0
package/dist/lib/task-timing.js +44 -0
package/dist/lib/tree.js +51 -0
package/dist/lib/types.js +298 -0
package/dist/lib/utils.js +314 -0
package/dist/lib/yaml/builder.js +55 -0
package/dist/lib/yaml/index.js +79 -0
package/dist/lib/yaml/player.js +459 -0
package/dist/lib/yaml/utils.js +153 -0
package/dist/lib/yaml.js +18 -0
package/dist/types/agent/agent.d.ts +220 -0
package/dist/types/agent/common.d.ts +0 -0
package/dist/types/agent/execution-session.d.ts +36 -0
package/dist/types/agent/index.d.ts +9 -0
package/dist/types/agent/task-builder.d.ts +34 -0
package/dist/types/agent/task-cache.d.ts +49 -0
package/dist/types/agent/tasks.d.ts +70 -0
package/dist/types/agent/ui-utils.d.ts +14 -0
package/dist/types/agent/utils.d.ts +25 -0
package/dist/types/ai-model/auto-glm/actions.d.ts +78 -0
package/dist/types/ai-model/auto-glm/index.d.ts +6 -0
package/dist/types/ai-model/auto-glm/parser.d.ts +18 -0
package/dist/types/ai-model/auto-glm/planning.d.ts +12 -0
package/dist/types/ai-model/auto-glm/prompt.d.ts +27 -0
package/dist/types/ai-model/auto-glm/util.d.ts +13 -0
package/dist/types/ai-model/connectivity.d.ts +20 -0
package/dist/types/ai-model/conversation-history.d.ts +105 -0
package/dist/types/ai-model/index.d.ts +16 -0
package/dist/types/ai-model/inspect.d.ts +67 -0
package/dist/types/ai-model/llm-planning.d.ts +19 -0
package/dist/types/ai-model/prompt/common.d.ts +2 -0
package/dist/types/ai-model/prompt/describe.d.ts +1 -0
package/dist/types/ai-model/prompt/extraction.d.ts +7 -0
package/dist/types/ai-model/prompt/llm-locator.d.ts +3 -0
package/dist/types/ai-model/prompt/llm-planning.d.ts +10 -0
package/dist/types/ai-model/prompt/llm-section-locator.d.ts +3 -0
package/dist/types/ai-model/prompt/order-sensitive-judge.d.ts +2 -0
package/dist/types/ai-model/prompt/playwright-generator.d.ts +26 -0
package/dist/types/ai-model/prompt/ui-tars-planning.d.ts +2 -0
package/dist/types/ai-model/prompt/util.d.ts +33 -0
package/dist/types/ai-model/prompt/yaml-generator.d.ts +102 -0
package/dist/types/ai-model/service-caller/codex-app-server.d.ts +42 -0
package/dist/types/ai-model/service-caller/image-detail.d.ts +2 -0
package/dist/types/ai-model/service-caller/index.d.ts +60 -0
package/dist/types/ai-model/service-caller/request-timeout.d.ts +32 -0
package/dist/types/ai-model/ui-tars-planning.d.ts +72 -0
package/dist/types/common.d.ts +288 -0
package/dist/types/device/device-options.d.ts +155 -0
package/dist/types/device/index.d.ts +2565 -0
package/dist/types/dump/html-utils.d.ts +75 -0
package/dist/types/dump/index.d.ts +5 -0
package/dist/types/dump/screenshot-restoration.d.ts +8 -0
package/dist/types/dump/screenshot-store.d.ts +49 -0
package/dist/types/index.d.ts +21 -0
package/dist/types/report-cli.d.ts +36 -0
package/dist/types/report-generator.d.ts +88 -0
package/dist/types/report-markdown.d.ts +24 -0
package/dist/types/report.d.ts +52 -0
package/dist/types/screenshot-item.d.ts +67 -0
package/dist/types/service/index.d.ts +24 -0
package/dist/types/service/utils.d.ts +2 -0
package/dist/types/skill/index.d.ts +25 -0
package/dist/types/task-runner.d.ts +50 -0
package/dist/types/task-timing.d.ts +8 -0
package/dist/types/tree.d.ts +4 -0
package/dist/types/types.d.ts +684 -0
package/dist/types/utils.d.ts +45 -0
package/dist/types/yaml/builder.d.ts +2 -0
package/dist/types/yaml/index.d.ts +4 -0
package/dist/types/yaml/player.d.ts +34 -0
package/dist/types/yaml/utils.d.ts +9 -0
package/dist/types/yaml.d.ts +215 -0
package/package.json +130 -0

package/dist/es/ai-model/prompt/playwright-generator.mjs ADDED Viewed

@@ -0,0 +1,115 @@
+import { PLAYWRIGHT_EXAMPLE_CODE } from "@godscene/shared/constants";
+import { callAI, callAIWithStringResponse } from "../index.mjs";
+import { createEventCounts, createMessageContent, extractInputDescriptions, filterEventsByType, getScreenshotsForLLM, prepareEventSummary, processEventsForLLM, validateEvents } from "./yaml-generator.mjs";
+const generatePlaywrightTest = async (events, options, modelConfig)=>{
+    validateEvents(events);
+    const summary = prepareEventSummary(events, {
+        testName: options.testName,
+        maxScreenshots: options.maxScreenshots || 3
+    });
+    const playwrightSummary = {
+        ...summary,
+        waitForNetworkIdle: false !== options.waitForNetworkIdle,
+        waitForNetworkIdleTimeout: options.waitForNetworkIdleTimeout || 2000,
+        viewportSize: options.viewportSize || {
+            width: 1280,
+            height: 800
+        }
+    };
+    const screenshots = getScreenshotsForLLM(events, options.maxScreenshots || 3);
+    const promptText = `Generate a Playwright test using @godscene/web/playwright that reproduces this recorded browser session. The test should be based on the following events and follow the structure of the example provided. Make the test descriptive with appropriate assertions and validations.
+Event Summary:
+${JSON.stringify(playwrightSummary, null, 2)}
+Generated code should:
+1. Import required dependencies
+2. Set up the test with proper configuration
+3. Include a beforeEach hook to navigate to the starting URL
+4. Implement a test that uses Midscene AI methods (aiTap, aiInput, aiAssert, etc.)
+5. Include appropriate assertions and validations
+6. Follow best practices for Playwright tests
+7. Be ready to execute without further modification
+Important: Return ONLY the raw Playwright test code. Do NOT wrap the response in markdown code blocks (no \`\`\`typescript, \`\`\`javascript or \`\`\`). Start directly with the code content.`;
+    const messageContent = createMessageContent(promptText, screenshots, false !== options.includeScreenshots);
+    const systemPrompt = `You are an expert test automation engineer specializing in Playwright and Midscene.
+Your task is to generate a complete, executable Playwright test using @godscene/web/playwright that reproduces a recorded browser session.
+${PLAYWRIGHT_EXAMPLE_CODE}`;
+    const prompt = [
+        {
+            role: 'system',
+            content: systemPrompt
+        },
+        {
+            role: 'user',
+            content: messageContent
+        }
+    ];
+    const response = await callAIWithStringResponse(prompt, modelConfig);
+    if (response?.content && 'string' == typeof response.content) return response.content;
+    throw new Error('Failed to generate Playwright test code');
+};
+const generatePlaywrightTestStream = async (events, options, modelConfig)=>{
+    validateEvents(events);
+    const summary = prepareEventSummary(events, {
+        testName: options.testName,
+        maxScreenshots: options.maxScreenshots || 3
+    });
+    const playwrightSummary = {
+        ...summary,
+        waitForNetworkIdle: false !== options.waitForNetworkIdle,
+        waitForNetworkIdleTimeout: options.waitForNetworkIdleTimeout || 2000,
+        viewportSize: options.viewportSize || {
+            width: 1280,
+            height: 800
+        }
+    };
+    const screenshots = getScreenshotsForLLM(events, options.maxScreenshots || 3);
+    const promptText = `Generate a Playwright test using @godscene/web/playwright that reproduces this recorded browser session. The test should be based on the following events and follow the structure of the example provided. Make the test descriptive with appropriate assertions and validations.
+Event Summary:
+${JSON.stringify(playwrightSummary, null, 2)}
+Generated code should:
+1. Import required dependencies
+2. Set up the test with proper configuration
+3. Include a beforeEach hook to navigate to the starting URL
+4. Implement a test that uses Midscene AI methods (aiTap, aiInput, aiAssert, etc.)
+5. Include appropriate assertions and validations
+6. Follow best practices for Playwright tests
+7. Be ready to execute without further modification
+8. can't wrap this test code in markdown code block
+Important: Return ONLY the raw Playwright test code. Do NOT wrap the response in markdown code blocks (no \`\`\`typescript, \`\`\`javascript or \`\`\`). Start directly with the code content.`;
+    const messageContent = createMessageContent(promptText, screenshots, false !== options.includeScreenshots);
+    const systemPrompt = `You are an expert test automation engineer specializing in Playwright and Midscene.
+Your task is to generate a complete, executable Playwright test using @godscene/web/playwright that reproduces a recorded browser session.
+${PLAYWRIGHT_EXAMPLE_CODE}`;
+    const prompt = [
+        {
+            role: 'system',
+            content: systemPrompt
+        },
+        {
+            role: 'user',
+            content: messageContent
+        }
+    ];
+    if (options.stream && options.onChunk) return await callAI(prompt, modelConfig, {
+        stream: true,
+        onChunk: options.onChunk
+    });
+    {
+        const response = await callAIWithStringResponse(prompt, modelConfig);
+        if (response?.content && 'string' == typeof response.content) return {
+            content: response.content,
+            usage: response.usage,
+            isStreamed: false
+        };
+        throw new Error('Failed to generate Playwright test code');
+    }
+};
+export { createEventCounts, createMessageContent, extractInputDescriptions, filterEventsByType, generatePlaywrightTest, generatePlaywrightTestStream, getScreenshotsForLLM, prepareEventSummary, processEventsForLLM, validateEvents };

package/dist/es/ai-model/prompt/ui-tars-planning.mjs ADDED Viewed

@@ -0,0 +1,34 @@
+import { getPreferredLanguage } from "@godscene/shared/env";
+function getUiTarsPlanningPrompt() {
+    const preferredLanguage = getPreferredLanguage();
+    return `
+You are a GUI agent. You are given a task and your action history, with screenshots. You need to perform the next action to complete the task.
+## Output Format
+\`\`\`
+Thought: ...
+Action: ...
+\`\`\`
+## Action Space
+click(start_box='[x1, y1, x2, y2]')
+left_double(start_box='[x1, y1, x2, y2]')
+right_single(start_box='[x1, y1, x2, y2]')
+drag(start_box='[x1, y1, x2, y2]', end_box='[x3, y3, x4, y4]')
+hotkey(key='')
+type(content='xxx') # Use escape characters \\', \\\", and \\n in content part to ensure we can parse the content in normal python string format. If you want to submit your input, use \\n at the end of content.
+scroll(start_box='[x1, y1, x2, y2]', direction='down or up or right or left')
+wait() #Sleep for 5s and take a screenshot to check for any changes.
+finished(content='xxx') # Use escape characters \\', \\", and \\n in content part to ensure we can parse the content in normal python string format.
+## Note
+- Use ${preferredLanguage} in \`Thought\` part.
+- Write a small plan and finally summarize your next action (with its target element) in one sentence in \`Thought\` part.
+## User Instruction
+`;
+}
+const getSummary = (prediction)=>prediction.replace(/Reflection:[\s\S]*?(?=Action_Summary:|Action:|$)/g, '').trim();
+export { getSummary, getUiTarsPlanningPrompt };

package/dist/es/ai-model/prompt/util.mjs ADDED Viewed

@@ -0,0 +1,57 @@
+function extractXMLTag(xmlString, tagName) {
+    const lowerXmlString = xmlString.toLowerCase();
+    const lowerTagName = tagName.toLowerCase();
+    const closeTag = `</${lowerTagName}>`;
+    const openTag = `<${lowerTagName}>`;
+    const lastCloseIndex = lowerXmlString.lastIndexOf(closeTag);
+    if (-1 === lastCloseIndex) {
+        const lastOpenIndex = lowerXmlString.lastIndexOf(openTag);
+        if (-1 === lastOpenIndex) return;
+        const contentStart = lastOpenIndex + openTag.length;
+        const remaining = xmlString.substring(contentStart);
+        const nextTagIndex = remaining.indexOf('<');
+        const content = -1 === nextTagIndex ? remaining : remaining.substring(0, nextTagIndex);
+        return content.trim();
+    }
+    const searchArea = lowerXmlString.substring(0, lastCloseIndex);
+    const lastOpenIndex = searchArea.lastIndexOf(openTag);
+    if (-1 === lastOpenIndex) return;
+    const contentStart = lastOpenIndex + openTag.length;
+    const contentEnd = lastCloseIndex;
+    const content = xmlString.substring(contentStart, contentEnd);
+    return content.trim();
+}
+function parseSubGoalsFromXML(xmlContent) {
+    const subGoals = [];
+    const regex = /<sub-goal\s+index="(\d+)"\s+status="(pending|finished)"(?:\s*\/>|>([\s\S]*?)<\/sub-goal>)/gi;
+    let match;
+    match = regex.exec(xmlContent);
+    while(null !== match){
+        const index = Number.parseInt(match[1], 10);
+        const status = match[2];
+        const description = match[3]?.trim() || '';
+        subGoals.push({
+            index,
+            status,
+            description
+        });
+        match = regex.exec(xmlContent);
+    }
+    return subGoals;
+}
+function parseMarkFinishedIndexes(xmlContent) {
+    const indexes = [];
+    const regex = /<sub-goal\s+index="(\d+)"\s+status="finished"\s*\/>/gi;
+    let match;
+    match = regex.exec(xmlContent);
+    while(null !== match){
+        indexes.push(Number.parseInt(match[1], 10));
+        match = regex.exec(xmlContent);
+    }
+    return indexes;
+}
+const distanceThreshold = 16;
+function distance(point1, point2) {
+    return Math.sqrt((point1.x - point2.x) ** 2 + (point1.y - point2.y) ** 2);
+}
+export { distance, distanceThreshold, extractXMLTag, parseMarkFinishedIndexes, parseSubGoalsFromXML };

package/dist/es/ai-model/prompt/yaml-generator.mjs ADDED Viewed

@@ -0,0 +1,201 @@
+import { YAML_EXAMPLE_CODE } from "@godscene/shared/constants";
+import { callAI, callAIWithStringResponse } from "../index.mjs";
+const getScreenshotsForLLM = (events, maxScreenshots = 1)=>{
+    const eventsWithScreenshots = events.filter((event)=>event.screenshotBefore || event.screenshotAfter || event.screenshotWithBox);
+    const sortedEvents = [
+        ...eventsWithScreenshots
+    ].sort((a, b)=>{
+        if ('navigation' === a.type && 'navigation' !== b.type) return -1;
+        if ('navigation' !== a.type && 'navigation' === b.type) return 1;
+        if ('click' === a.type && 'click' !== b.type) return -1;
+        if ('click' !== a.type && 'click' === b.type) return 1;
+        return 0;
+    });
+    const screenshots = [];
+    for (const event of sortedEvents){
+        const screenshot = event.screenshotWithBox || event.screenshotAfter || event.screenshotBefore;
+        if (screenshot && !screenshots.includes(screenshot)) {
+            screenshots.push(screenshot);
+            if (screenshots.length >= maxScreenshots) break;
+        }
+    }
+    return screenshots;
+};
+const filterEventsByType = (events)=>({
+        navigationEvents: events.filter((event)=>'navigation' === event.type),
+        clickEvents: events.filter((event)=>'click' === event.type),
+        inputEvents: events.filter((event)=>'input' === event.type),
+        scrollEvents: events.filter((event)=>'scroll' === event.type)
+    });
+const createEventCounts = (filteredEvents, totalEvents)=>({
+        navigation: filteredEvents.navigationEvents.length,
+        click: filteredEvents.clickEvents.length,
+        input: filteredEvents.inputEvents.length,
+        scroll: filteredEvents.scrollEvents.length,
+        total: totalEvents
+    });
+const extractInputDescriptions = (inputEvents)=>inputEvents.map((event)=>({
+            description: event.elementDescription || '',
+            value: event.value || ''
+        })).filter((item)=>item.description && item.value);
+const processEventsForLLM = (events)=>events.map((event)=>({
+            type: event.type,
+            timestamp: event.timestamp,
+            url: event.url,
+            title: event.title,
+            elementDescription: event.elementDescription,
+            value: event.value,
+            pageInfo: event.pageInfo,
+            elementRect: event.elementRect
+        }));
+const prepareEventSummary = (events, options = {})=>{
+    const filteredEvents = filterEventsByType(events);
+    const eventCounts = createEventCounts(filteredEvents, events.length);
+    const startUrl = filteredEvents.navigationEvents.length > 0 ? filteredEvents.navigationEvents[0].url || '' : '';
+    const clickDescriptions = filteredEvents.clickEvents.map((event)=>event.elementDescription).filter((desc)=>Boolean(desc)).slice(0, 10);
+    const inputDescriptions = extractInputDescriptions(filteredEvents.inputEvents).slice(0, 10);
+    const urls = filteredEvents.navigationEvents.map((e)=>e.url).filter((url)=>Boolean(url)).slice(0, 5);
+    const processedEvents = processEventsForLLM(events);
+    return {
+        testName: options.testName || 'Automated test from recorded events',
+        startUrl,
+        eventCounts,
+        urls,
+        clickDescriptions,
+        inputDescriptions,
+        events: processedEvents
+    };
+};
+const createMessageContent = (promptText, screenshots = [], includeScreenshots = true)=>{
+    const messageContent = [
+        {
+            type: 'text',
+            text: promptText
+        }
+    ];
+    if (includeScreenshots && screenshots.length > 0) {
+        messageContent.unshift({
+            type: 'text',
+            text: 'Here are screenshots from the recording session to help you understand the context:'
+        });
+        screenshots.forEach((screenshot)=>{
+            messageContent.push({
+                type: 'image_url',
+                image_url: {
+                    url: screenshot
+                }
+            });
+        });
+    }
+    return messageContent;
+};
+const getYamlLanguageInstruction = (language)=>{
+    const normalizedLanguage = language?.trim();
+    if (!normalizedLanguage) return '';
+    return `
+Language requirement:
+- Write all human-readable YAML content in ${normalizedLanguage}.
+- Keep YAML keys, field names, and Midscene API names unchanged.`;
+};
+const createYamlPrompt = ({ yamlSummary, screenshots, language })=>{
+    const prompt = [
+        {
+            role: 'system',
+            content: `You are an expert in RPA智能助手 YAML test generation. Generate clean, accurate YAML following these rules: ${YAML_EXAMPLE_CODE}`
+        },
+        {
+            role: 'user',
+            content: `Generate YAML test for RPA智能助手 automation from recorded browser events.
+Event Summary:
+${JSON.stringify(yamlSummary, null, 2)}
+Convert events:
+- navigation → target.url
+- click → aiTap with element description
+- input → aiInput with value and locate
+- scroll → aiScroll with appropriate direction
+- Add aiAssert for important state changes${getYamlLanguageInstruction(language)}
+Important: Return ONLY the raw YAML content. Do NOT wrap the response in markdown code blocks (no \`\`\`yaml or \`\`\`). Start directly with the YAML content.`
+        }
+    ];
+    if (screenshots.length > 0) {
+        prompt.push({
+            role: 'user',
+            content: 'Here are screenshots from the recording session to help you understand the context:'
+        });
+        prompt.push({
+            role: 'user',
+            content: screenshots.map((screenshot)=>({
+                    type: 'image_url',
+                    image_url: {
+                        url: screenshot
+                    }
+                }))
+        });
+    }
+    return prompt;
+};
+const validateEvents = (events)=>{
+    if (!events.length) throw new Error('No events provided for test generation');
+};
+const generateYamlTest = async (events, options, modelConfig)=>{
+    try {
+        validateEvents(events);
+        const summary = prepareEventSummary(events, {
+            testName: options.testName,
+            maxScreenshots: options.maxScreenshots || 3
+        });
+        const yamlSummary = {
+            ...summary,
+            includeTimestamps: options.includeTimestamps || false
+        };
+        const screenshots = getScreenshotsForLLM(events, options.maxScreenshots || 3);
+        const prompt = createYamlPrompt({
+            yamlSummary,
+            screenshots,
+            language: options.language
+        });
+        const response = await callAIWithStringResponse(prompt, modelConfig);
+        if (response?.content && 'string' == typeof response.content) return response.content;
+        throw new Error('Failed to generate YAML test configuration');
+    } catch (error) {
+        throw new Error(`Failed to generate YAML test: ${error}`);
+    }
+};
+const generateYamlTestStream = async (events, options, modelConfig)=>{
+    try {
+        validateEvents(events);
+        const summary = prepareEventSummary(events, {
+            testName: options.testName,
+            maxScreenshots: options.maxScreenshots || 3
+        });
+        const yamlSummary = {
+            ...summary,
+            includeTimestamps: options.includeTimestamps || false
+        };
+        const screenshots = getScreenshotsForLLM(events, options.maxScreenshots || 3);
+        const prompt = createYamlPrompt({
+            yamlSummary,
+            screenshots,
+            language: options.language
+        });
+        if (options.stream && options.onChunk) return await callAI(prompt, modelConfig, {
+            stream: true,
+            onChunk: options.onChunk
+        });
+        {
+            const response = await callAIWithStringResponse(prompt, modelConfig);
+            if (response?.content && 'string' == typeof response.content) return {
+                content: response.content,
+                usage: response.usage,
+                isStreamed: false
+            };
+            throw new Error('Failed to generate YAML test configuration');
+        }
+    } catch (error) {
+        throw new Error(`Failed to generate YAML test: ${error}`);
+    }
+};
+export { createEventCounts, createMessageContent, extractInputDescriptions, filterEventsByType, generateYamlTest, generateYamlTestStream, getScreenshotsForLLM, prepareEventSummary, processEventsForLLM, validateEvents };