OpenClaw是一款开源的自托管个人 AI 助手,它允许用户通过 WhatsApp、Telegram 等常用通讯软件远程控制自己的电脑执行任务。它不仅具备长期记忆,还能通过"插件技能"自主处理回复邮件、管理日程、甚至执行复杂的自动化脚本和代码操作,被誉为拥有"手"的 Claude。
可以做的事情:
| 分类 | 说明 |
|---|---|
| 系统与文件管理 | 自动分类/整理文件夹中的杂乱文件;通过 Shell 执行复杂的命令行任务;读取本地文档并进行摘要或数据提取。 |
| 办公与效率 | 邮件自动化:自动清理收件箱(曾有用户一天清理6000封)、起草和回复邮件;日程管理:自动识别聊天内容并添加到日历,处理会议冲突。 |
| 网页自动化 | 浏览器接管:代替你填写网页表单、抓取数据、登录已记录账号的网站进行操作(支持 Extension Relay 模式)。 |
| 主动与监控 | Heartbeat 心跳机制:主动向你推送消息。例如:监控股价波动、服务器宕机提醒、每日早晨发送当天的天气和日程简报。 |
| 第三方集成 | 连接 Notion、Trello、GitHub 等工具;控制 Philips Hue 等智能家居硬件;通过 WhatsApp/Telegram 远程操作电脑。 |
| ✅ 优点 | ⚠️ 缺点 |
|---|---|
| 隐私可控:软件本地运行,数据存储在本地 Markdown 文件中,不经过云端第三方服务器。 | 安全风险:给予了 AI 极高的系统权限。如果下载了恶意的社区 Skills,可能会导致数据泄露或系统被控。 |
| 主动性强:具备"心跳"机制,是少数能主动找用户沟通的 AI(Proactive),而非被动等待提问。 | 资源与成本:运行 headless 浏览器非常吃内存;如果使用 Claude 等高端模型 API,Token 消耗成本较高。 |
| 全平台接入:无需学习新界面,通过你最常用的 WhatsApp、Telegram 等通讯软件即可实现远程控制。 | 配置门槛:虽然有"对话式配置",但要实现复杂、稳定的自动化,仍需要一定的技术调试基础。 |
| 生态丰富:社区已贡献 500+ 个开源技能,功能扩展极快。 | 不稳定性:AI 偶尔会误解指令或陷入死循环,执行关键任务时需要人工二次确认。 |
系统必须是 Win10、Win11,在电脑系统中查看。
在 Windows 中安装 Clawdbot,官方强烈建议使用 WSL2。Clawdbot 的核心功能和许多"技能"(Skills,如浏览器自动化、Shell 执行等)是在 Linux 环境下开发的。在原生 Windows 环境下,可能会遇到文件权限、路径识别或部分插件无法运行的问题。
使用命令检查电脑是否安装 WSL,方式:Win+R 打开运行窗口,输入 cmd 回车,在命令行窗口中输入:
wsl --list --verbose
如下图所示,就是已经安装,并且正在运行:
如果显示的不是如上图所示,那么就执行以下命令来安装 WSL(注意安装过程要开启VPN):
wsl --install
如果执行下载命令没有下载,则会出现下面两种情况(左图和右图),分别解决:
dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart
dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart
然后执行以下命令设置 WSL 2 作为默认版本:
wsl --set-default-version 2
完成上述步骤后再回到前面执行下载命令。
访问官网:https://www.python.org/downloads/,点击 "Or get the standalone installer for Python 3.14.3" 下载 Python 安装包。双击下载的 .exe 文件进行安装:
验证安装(Win+R → cmd):
python --version
官网下载:https://nodejs.org/zh-cn/,安装 LTS 版本(长期支持版)。双击下载的 .msi 文件直接安装,注意勾选 "Automatically install the necessary tools" 并确保 "Add to PATH" 被选中。
node -v
npm -v
成功之后需要"放行Node.js",管理员打开 PowerShell,执行以下命令,系统会问你是否要更改执行策略,请输入 A(代表"全是"),然后按回车:
Set-ExecutionPolicy RemoteSigned
官网下载:https://git-scm.com/install/windows,点击最上面的蓝字即可。下载好之后双击安装,一路默认,注意勾选 Add Git to PATH。
git --version
在 Windows 电脑上以管理员身份打开终端(Win+X → 终端管理员),执行以下命令切换到国内加速源:
npm config set registry https://registry.npmmirror.com
注意:这行命令执行后通常不会有任何提示,直接跳出新的一行就是成功了。然后执行以下命令安装 OpenClaw(安装的时候可能会失败,多试几次,直到出现配置页面):
iwr -useb https://openclaw.ai/install.ps1 | iex
如下图所示就是安装成功,开始进行配置(方向键选择,回车键确定):
此时电脑会打开另外一个终端(原来的终端可以关闭),并且浏览器会自动打开对话窗口,此时就已经安装完成。此时是无法对话的,配置大模型请看第三项。
macOS 系统必须是 11.0 以上,在电脑系统中查看。
/bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"
(这一步的意思是将下载源切换到国内,运行之后会让你选择,你就选择1.清华即可。之后还需要输入开机密码和几项选择,你就根据提示选择即可。最后完成之后重启终端。)
验证安装:
brew -v
OpenClaw 官方明确要求 Node.js 版本必须 ≥ 22。如果你之前安装过老版本(如 Node 18),需要进行升级。
brew install node@22
验证安装(确保输出的 Node 版本为 v22.x.x 或以上):
node --version
npm --version
如果你是 M 系列芯片(Apple Silicon)的 Mac:
echo 'export PATH="/opt/homebrew/opt/node@22/bin:$PATH"' >> ~/.zshrc
source ~/.zshrc
如果你是较老的 Intel 芯片的 Mac:
echo 'export PATH="/usr/local/opt/node@22/bin:$PATH"' >> ~/.zshrc
验证(它应该输出对应路径):
which node
开启电脑的 VPN 软件(Clash),打开终端执行代码(注意端口号要改成你 VPN 的端口号,关闭终端失效):
export https_proxy=http://127.0.0.1:7897 http_proxy=http://127.0.0.1:7897 all_proxy=socks5://127.0.0.1:7897
npm config set strict-ssl false
curl -fsSL https://openclaw.ai/install.sh | bash
成功之后会进入配置页面,具体参考 Windows 系统的安装配置。
| 命令 | 说明 |
|---|---|
openclaw gateway | 服务启动 |
openclaw dashboard | 打开对话界面(先启动服务) |
openclaw gateway install | 安装网关为系统服务(仅需执行1次) |
openclaw gateway start | 启动后台服务(常驻运行,关闭终端也不影响) |
openclaw onboard | 重新配置全部服务 |
openclaw config | 轻量改单项配置,不用全量重置 |
openclaw status | 故障排查 |
openclaw gateway stop | 彻底关服务 |
openclaw gateway restart | 重启服务 |
openclaw logs --follow | 核心排错命令,AI不回复、报401等错误必用 |
openclaw doctor --fix | 自动修复命令 |
openclaw browser profiles | 查询浏览器模式 |
openclaw skills list | 查询安装的 Skills |
npm i -g openclaw@latest | 更新版本 |
执行官方卸载命令,打开 CMD 输入以下命令回车:
openclaw uninstall
清理剩余 CLI 文件:
npm uninstall -g openclaw
OpenClaw 采用"本地优先+多源路由"架构,支持以下四大类模型:
通过 Ollama 或 LM Studio:支持 Qwen3-Coder (7B/14B)、Llama 3.3、DeepSeek-R1-Distill 等。
首先我们需要开通阿里云百炼服务,打开阿里云官网,在大模型菜单中选择百炼平台,然后鼠标悬停右上角头像,点击充值,先充值再使用,如果你是第一次用,可能还需要实名认证。
然后在阿里云百炼平台开通套餐,开通之后有套餐专属 API Key,复制它。
然后我们打开 OpenClaw 根目录下的 JSON 文件,通过修改代码的方式去配置,在 C盘 → 用户 → 你的用户名 → .openclaw 中找到 openclaw.json 文件,先复制一份作为备份。然后打开该文件,添加以下代码:
"models": {
"mode": "merge",
"providers": {
"bailian": {
"baseUrl": "https://coding.dashscope.aliyuncs.com/v1",
"apiKey": "这里粘贴你的API Key",
"api": "openai-completions",
"models": [
{
"id": "qwen3.5-plus",
"name": "qwen3.5-plus",
"reasoning": false,
"input": ["text", "image"],
"cost": { "input": 0, "output": 0, "cacheRead": 0, "cacheWrite": 0 },
"contextWindow": 1000000,
"maxTokens": 65536
},
{
"id": "qwen3-max-2026-01-23",
"name": "qwen3-max-2026-01-23",
"input": ["text"],
"contextWindow": 262144
},
{
"id": "qwen3-coder-next",
"name": "qwen3-coder-next"
},
{
"id": "qwen3-coder-plus",
"name": "qwen3-coder-plus"
}
]
}
}
}
然后往下滑,找到 agents 模块,添加以下代码并修改默认模型:
"bailian/qwen3.5-plus": {},
"bailian/qwen3-max-2026-01-23": {},
"bailian/qwen3-coder-next": {},
"bailian/qwen3-coder-plus": {},
"bailian/MiniMax-M2.5": {},
"bailian/glm-5": {},
"bailian/glm-4.7": {},
"bailian/kimi-k2.5": {}
Command+Shift+.,打开隐藏文件夹。首先你需要在电脑中安装 Ollama(自行安装),并且配置以下几种官方推荐的大模型。安装好之后先在 Ollama 客户端对话一下,确保可以正确运行:
qwen3-coder
glm-4.7
gpt-oss:20b
gpt-oss:120b
然后打开 openclaw.json 文件,添加以下代码:
"ollama": {
"baseUrl": "http://127.0.0.1:11434/v1",
"apiKey": "123",
"auth": "api-key",
"authHeader": true,
"models": [{
"id": "gpt-oss:20b",
"name": "gpt-oss:20b",
"input": ["text"],
"contextWindow": 40000,
"maxTokens": 40000,
"compat": { "maxTokensField": "max_tokens" },
"cost": { "input": 0, "output": 0, "cacheRead": 0, "cacheWrite": 0 }
}]
}
然后往下滑找到 agents 模块,添加:
"ollama/gpt-oss:20b": { "alias": "gpt-oss:20b" }
在 OpenClaw 中安装第三方技能(Skills)只需要在终端中输入一行代码即可,软件会自动下载技能到 openclaw > workspace 文件夹中(Skills 文件夹相当于全局技能,workspace 文件夹相当于临时技能),使用的就是标准的 Skills 结构。
以下推荐几个好用的 Skills 网站:
进入网站之后,找到你需要的 Skills,复制代码,然后在本地电脑运行即可。安装代码如下(如果失败也可以手动下载压缩包到 Skills 文件夹解压):
npx clawhub@latest install xxx
OpenClaw 飞书官方插件使用指南(公开版)
执行以下命令安装飞书插件。如果执行命令时报错,可在命令行前增加 sudo 重新执行:
npx -y @larksuite/openclaw-lark-tools install
根据界面提示信息,选择新建机器人。通过飞书客户端扫描二维码,选择一键创建飞书机器人。
在飞书中向机器人发送 /feishu start,若返回版本号信息,代表安装成功。
开启流式推理:
openclaw config set channels.feishu.streaming true
将微信更新到最新版,点击右下角我的 → 设置 → 插件,就可以看到 ClawBot 插件,点击详情,就可以看到代码和扫一扫。
复制代码在电脑终端安装,他会生成一个二维码,扫码连接即可。
将 OpenClaw(龙虾)接入微信群聊,取决于你使用的具体产品版本。目前主要有两种主流方式:一种是使用企业微信中转(官方推荐,稳定且功能全),另一种是使用个人微信插件(有封号风险,限制多)。
http://你的公网IP:18789/wework/bot(端口 18789 是 OpenClaw 默认的企业微信服务端口,请确保服务器防火墙已放行该端口)。http://localhost:8080 或你的服务器 IP)。npx -y @tencent-weixin/openclaw-weixin-cli@latest install
| 方案 | 推荐度 | 群聊支持 | 封号风险 |
|---|---|---|---|
| 企业微信 | ⭐⭐⭐⭐⭐ 最推荐 | ✅ 支持 | ✅ 无风险 |
| 微信 ClawBot 插件 | ⭐⭐ 不推荐 | ❌ 不支持 | ⚠️ 有风险 |
用户电脑的"下载"或"桌面"文件夹长期堆积大量文件名混乱、格式杂乱的文件(如:PDF、安装包、截图等)。手动整理极其耗时。OpenClaw 利用其原生文件系统访问权限,可以根据文件内容(而非仅看后缀名)自动分类、智能重命名并归档。
日常办公与创作中,用户经常面临高频但零碎的文件处理需求:如音视频(格式转换、裁剪、合并、分离音轨、压缩、生成 GIF),传统方式需要下载多种第三方软件,甚至面临充值付费或广告骚扰。OpenClaw 借助本地化环境与插件生态,通过自然语言指令即可智能调用底层专业工具,实现"一站式、零门槛"的自动化文件处理。
音视频处理核心:需要在电脑上安装开源多媒体框架 FFmpeg,并将其路径添加至系统环境变量。
仅安装好依赖是不够的,我们还需要创建一个说明书,告诉 OpenClaw 如何使用该依赖。在对话框输入:
我已经在系统里配置好了 FFmpeg 环境变量。现在请你为自己创建一个名为 FFmpegMaster 的 Skill:
1. 无需额外脚本:直接利用系统的 ffmpeg 命令。配置 SKILL.md:在你的 skills 目录下创建 ffmpeg_master 文件夹,并编写 SKILL.md,告诉你自己具备处理音视频(格式转换、剪辑、合并、压缩、提取音频、生成GIF)的能力。
2. 安全准则:在执行命令前,先检查输入文件是否存在;如果用户没指定输出文件名,请根据操作自动起一个(如 xxx_trimmed.mp4)。
3. 完成:以后我所有的多媒体处理需求,你都优先调用这个 Skill 来执行。
在办公和社交场景中,用户常积压大量需要二次加工的图片:如"手机拍摄的合同需要转成高清PDF"、"几十张产品图需要统一缩小尺寸并加水印"、"网页截图里的文字需要提取出来"。OpenClaw + 多模态大模型 + ImageMagick,让用户通过一句话就能实现图片的批量处理与内容提取。功能包括:格式转换、调整大小、裁剪、压缩、旋转、添加效果和滤镜。
图片自动化处理脚本安装:ImageMagick
创建 Skills,在对话框输入:
我已经在电脑里安装好了 ImageMagick 环境,并配置好了环境变量。现在请你为自己创建一个名为 ImageWizard 的新 Skill:
1. 配置 SKILL.md:在你的 skills 目录下创建 image_wizard 文件夹,描述你具备处理图片(转换格式、调整大小、裁剪、压缩、批量处理、制作GIF)的能力。
2. 执行逻辑:直接调用系统命令 magick。
3. 任务目标:以后只要我让你处理图片,你就根据我的需求自动生成 magick 命令并执行。处理完成后,请告诉我文件保存的路径。
在数字化办公中,大量核心信息往往被"锁"在非文本格式中:如纸质文档的扫描件、无法复制内容的 PDF 报告、甚至是视频里的字幕和网页上的图片内容。OpenClaw 通过集成 PaddleOCR 2.8.1(工业级视觉引擎),赋予了 AI 极其强大的"读图"能力。
安装本地图片 OCR 工具:PaddleOCR(文字识别)
创建 Skills(注意虚拟环境路径要正确):
我现在需要你为自己创建一个名为 PaddleOCR 的核心视觉技能。
该技能是你的"视觉引擎",主要用于:图片文字提取、截图分析、扫描版 PDF 识别以及屏幕元素的语义定位。
在 skills 目录下创建 PaddleOCR 文件夹,编写 ocr_engine.py 脚本,使用 PaddleOCR(use_angle_cls=True, lang="ch") 初始化。
在日常办公、内容创作中,常常需要将文本内容转化为自然流畅的语音,通过 OpenClaw 结合阿里云语音合成(TTS)服务,可实现一键将文本转换为高质量语音,支持多音色、多语言、语速与音量自定义。
.env 文件,内容如下:
# 阿里云语音合成 TTS 配置
ALIYUN_APP_KEY=你的AppKey
ALIYUN_ACCESS_KEY_ID=你的AccessKeyId
ALIYUN_ACCESS_KEY_SECRET=你的AccessKeySecret
通过 OpenClaw + SenseVoiceSmall 模型,可以实现全自动、高精度、带标点的音视频转文字,大幅提升工作效率。
OpenClaw 借助本地 Python 环境与强大的处理库,只需一句话,即可实现文档的"零手工"自动化处理、生成与修改。
基础环境配置:打开终端执行以下命令:
pip install python-docx openpyxl python-pptx pdfplumber
我现在需要你为自己创建一个名为 DocMaster 的 Skill:
1. 无需额外脚本:直接利用 Python 脚本执行能力。配置 SKILL.md 描述你具备处理 Word(生成/修改)、Excel(数据提取/汇总)、PPT(创建/拆分)、PDF(提取文字与表格/转换格式)的能力。
2. 安全准则:在处理文档前,先确认目标文件路径是否存在;生成新文档时,如果用户没指定文件名,请根据内容自动起一个描述性的名称。
3. 完成:以后我所有的文档自动化处理需求,你都优先调用这个 Skill,通过编写并运行临时 Python 脚本来完成。
OpenClaw 借助原生的 browser 技能,让你可以通过自然语言直接指挥 AI 模拟鼠标点击、键盘输入和页面分析。
安装好 OpenClaw 之后,默认的浏览器模式是插件中继模式,我们需要将模型改成内置独立浏览器模式:
openclaw config set browser.defaultProfile "openclaw"
openclaw browser profiles
此时最好重启 OpenClaw。
| 项目 | 操作 | 说明 |
|---|---|---|
| 基础控制 | start | 启动浏览器 |
close | 关闭浏览器/标签页 | |
navigate | 打开指定网址 | |
focus | 聚焦到某个标签页 | |
tabs | 管理多个标签页 | |
click | 点击元素(支持单击/双击/右键) | |
| 页面交互 | type | 输入文本(支持慢速模拟真人打字) |
fill | 填充表单字段 | |
press | 按键盘按键(Enter、Tab、Ctrl+C 等) | |
hover | 鼠标悬停 | |
drag | 拖拽元素 | |
select | 选择下拉菜单选项 | |
resize | 调整浏览器窗口大小 | |
wait | 等待特定条件(如元素出现/消失) | |
| 内容获取 | snapshot | 获取页面结构化快照(带元素引用 ID) |
screenshot | 截取屏幕截图(支持全屏/指定区域) | |
console | 获取浏览器控制台日志 | |
pdf | 将页面保存为 PDF | |
| 其他功能 | upload | 上传文件 |
dialog | 处理弹窗(确认/取消) | |
evaluate | 执行 JavaScript 代码 | |
profiles | 管理浏览器配置文件 |
通过集成 yt-dlp 和 gallery-dl,OpenClaw 变身为"万能下载器"。用户只需提供链接,OpenClaw 即可自动识别平台、解析最高画质、调用 FFmpeg 合并音视频。
# 安装视频下载工具 (支持 YouTube、B站、抖音、小红书、视频号等上千个站点)
pip install yt-dlp -i https://pypi.tuna.tsinghua.edu.cn/simple
# 安装图片/相册下载工具 (支持各大图片站、社交媒体图片集)
pip install gallery-dl -i https://pypi.tuna.tsinghua.edu.cn/simple
通过安全地配置 QQ 邮箱独立授权码,并结合底层的 SMTP/IMAP 协议,打通 AI 与传统电子邮件系统之间的壁垒。获取 QQ 邮箱授权码后,创建 .env 文件:
QQ_MAIL_AUTH_CODE=这里填你获取的16位授权码
AGENT_EMAIL_ADDR=你的QQ号@qq.com
AGENT_SMTP_SERVER=smtp.qq.com
AGENT_IMAP_SERVER=imap.qq.com
然后创建邮件 Skills 技能,使用 Python 原生的 smtplib、imaplib 和 email 库实现收发邮件功能(发信 SMTP_SSL 端口 465,收信 IMAP4_SSL 端口 993)。
OpenClaw 可以变身为你的"私人情报秘书",每天定时前往指定网站抓取最新资讯,通过大模型进行深度摘要和翻译,并准时推送到你面前。创建定时任务:每天早上8点自动访问 36氪 AI 板块,筛选 5 条最值得关注的内容,生成中文摘要并通过飞书推送。
会议录音 → 结构化纪要(30秒内完成),自动生成行动项表格并主动追踪。OpenClaw 独有的主动提醒功能:到期自动提醒责任人,未回复自动升级提醒给上级。Agent 还会记住"哪些人经常延期",下次会议自动给他们设置更早的提醒。
适合行业:零售、餐饮、电商、制造。每周一早上8点自动生成销售对比、异常预警、归因分析和下周建议行动。老板直接看到的是"像分析师写的"文字报告,而不是枯燥的表格。
系统自动追踪对标账号的最新动态,获取视频的标题、播放量、点赞量、评论量,汇总成数据报表并发送邮件通知。调用能力:浏览器自动化、网络资源下载、文档自动处理、邮件自动化。
内容创作者只需提供一个搜索词,系统就能自动下载视频 → 提取音频 → 音频转文字 → 大模型分析爆款框架 → 仿写全新文案 → 保存为 Word 文档。
将超长视频快速裁剪成适合抖音、Shorts、视频号发布的多个"高光短视频"(切片)。通过静音检测、固定时长分割或金句识别进行精准裁剪。
DESIGN.md 概念由谷歌 Stitch 引入。使用一个普通的 markdown 文件来描述设计图案、颜色、排版、间距、组件,交给 AI 代理生成一致的用户界面。
当你打开对话页面,出现以下的提示,就说明服务出现了错误。解决方案:
先关闭 OpenClaw 服务,打开终端运行:
openclaw dashboard
然后就会出现秘钥。随后我们再次运行 OpenClaw 服务,打开 Overview 菜单,将秘钥填进去,点击连接即可。
解决办法:使用管理员模式打开终端,然后运行 OpenClaw。
原因:Node.js 无法正确读取系统的根证书链,导致它认为接口"不安全"。
验证步骤一(终端运行):
curl -I https://ark.cn-beijing.volces.com/api/coding/v3
只要返回带有 HTTP/2 404 或 HTTP/2 401 的信息,就说明 Mac 系统的物理网络是通的。
验证步骤二(终端运行):
node -e "fetch('https://ark.cn-beijing.volces.com/api/coding/v3').then(res => console.log('✅ Node 网络畅通,状态:', res.status)).catch(err => console.error('❌ Node 报错,根因代码:', err.cause ? err.cause.code : err.message))"
解决方案:强行指定 Node.js 使用其内置的权威证书包(Bundled CA):
echo 'export NODE_OPTIONS="--use-bundled-ca"' >> ~/.zshrc
source ~/.zshrc