oc-browser-relay 1.0.25 → 1.0.26
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/package.json
CHANGED
|
@@ -1,6 +1,6 @@
|
|
|
1
1
|
{
|
|
2
2
|
"name": "oc-browser-relay",
|
|
3
|
-
"version": "1.0.
|
|
3
|
+
"version": "1.0.26",
|
|
4
4
|
"description": "Expose a local ChromeAgent/Relay Tool API to OpenClaw as agent tools.",
|
|
5
5
|
"main": "index.js",
|
|
6
6
|
"openclaw": {
|
|
@@ -37,6 +37,7 @@
|
|
|
37
37
|
"javascript-obfuscator": "^5.3.0"
|
|
38
38
|
},
|
|
39
39
|
"dependencies": {
|
|
40
|
+
"@mixmark-io/domino": "^2.2.0",
|
|
40
41
|
"@types/adm-zip": "^0.5.8",
|
|
41
42
|
"adm-zip": "^0.5.17",
|
|
42
43
|
"iconv-lite": "^0.7.2"
|
|
@@ -1,6 +1,6 @@
|
|
|
1
1
|
---
|
|
2
2
|
name: oc-browser-relay-article
|
|
3
|
-
description: 通过本地 ChromeAgent Relay 的 OpenClaw 插件工具采集任意 http/https 网页文章内容,返回页面 HTML
|
|
3
|
+
description: 通过本地 ChromeAgent Relay 的 OpenClaw 插件工具采集任意 http/https 网页文章内容,返回页面 HTML 并保存为 Markdown。适用于所有网页文章,包括微信公众号、知乎、掘金、36氪、medium、博客、新闻页等任意网页。仅在用户明确给出网页链接,并要求获取正文、保存文章或导出文章时使用;不用于平台后台经营数据、商品详情采集或小红书搜索结果。
|
|
4
4
|
---
|
|
5
5
|
|
|
6
6
|
# 文章采集技能
|
|
@@ -31,16 +31,19 @@ description: 通过本地 ChromeAgent Relay 的 OpenClaw 插件工具采集任
|
|
|
31
31
|
|
|
32
32
|
- `url` 必填,必须是有效 `http/https` 链接
|
|
33
33
|
- `saveToFile` 默认 `true`
|
|
34
|
-
- 默认保存为 Markdown 到 workspace `articles
|
|
35
|
-
-
|
|
34
|
+
- 默认保存为 Markdown 到 workspace `articles/article_<timestamp>.md`
|
|
35
|
+
- `savePath` 可选,支持用户自定义保存路径(**仅支持 Markdown**):
|
|
36
|
+
- **只传目录路径**,文件名由工具自动生成(标题+时间后缀),不要自行拼接文件名
|
|
37
|
+
- 可为绝对路径或相对路径(相对路径基于 workspace)
|
|
38
|
+
- 用户未指定时,**不要擅自推断或编造路径**,直接使用默认路径
|
|
39
|
+
- 仅当用户在本轮对话中明确给出保存目录时才传入 `savePath`
|
|
36
40
|
- `returnHostPatterns` 仅在用户明确要求采集后切回原页面时使用
|
|
37
41
|
|
|
38
42
|
规则:
|
|
39
43
|
|
|
40
44
|
- `get_article` 适用于所有 http/https 网页,不限于微信公众号,任何公开网页均可采集
|
|
41
45
|
- 采集完成后直接告知文件保存路径,不要对内容进行分析、总结、解读或提出建议
|
|
42
|
-
-
|
|
43
|
-
- 只有用户明确给出 `.html/.htm` 保存路径,或明确要求”保存原始 HTML”时,才保存 HTML 文件
|
|
46
|
+
- **只保存 Markdown 格式**,不支持保存 HTML 或其他格式;即使用户要求保存 HTML,也说明当前只支持 Markdown
|
|
44
47
|
- 导出 Markdown 时,保持原文标题层级(`#` `##` `###`),不要把正文段落套进代码块,不要用反引号包裹普通文字
|
|
45
48
|
- 图片链接保留为 `` 格式,不要转成 HTML `<img>` 标签
|
|
46
49
|
- 如果采集到的内容结构混乱,只提取正文主体部分,去掉导航栏、侧边栏、广告等干扰元素
|
|
@@ -53,22 +53,19 @@ description: 通过本地 ChromeAgent Relay 的 OpenClaw 插件工具处理小
|
|
|
53
53
|
|
|
54
54
|
### 搜索帖子
|
|
55
55
|
|
|
56
|
-
用户说“搜帖子”“找对标”“抓样本”“看别人怎么写”时,使用 `xiaohongshu_search_notes
|
|
56
|
+
用户说“搜帖子”“找对标”“抓样本”“看别人怎么写”时,使用 `xiaohongshu_search_notes`。该工具始终会采集笔记详情(标题、正文、图片、评论、互动数据等),不再提供"只抓列表"的模式。
|
|
57
57
|
|
|
58
58
|
常用参数:
|
|
59
59
|
|
|
60
60
|
- `keyword`
|
|
61
61
|
- `targetCount`
|
|
62
62
|
- `filters`
|
|
63
|
-
- `detailTargetCount`
|
|
64
63
|
- `randomizeOrder`
|
|
65
64
|
- `saveToCsv`
|
|
66
65
|
|
|
67
66
|
规则:
|
|
68
67
|
|
|
69
|
-
- 用户要正文、详情、评论、互动数据时,设置 `detailTargetCount`
|
|
70
68
|
- 用户没有明确说抓多少篇时,固定使用 `targetCount=25`
|
|
71
|
-
- 用户没有明确要求详情、正文、评论或互动数据时,不要补 `detailTargetCount`
|
|
72
69
|
- 不要根据上一轮搜索条数、历史导出结果或“多抓一点”的模糊印象,擅自把默认 25 改成更大值
|
|
73
70
|
- 用户要导出时,优先用 `saveToCsv`
|
|
74
71
|
- 优先用 `filters`,不要退回旧简写参数
|