普通的 AI 机器人只能对话,但 Clawdbot (Molt) 能让你的 AI 拥有“手”和“耳朵”。
通过集成 Chrome 浏览器,它能帮你自动化操作网页;通过集成 Whisper,它能听懂你的语音条;通过配置 Telegram 流式输出,它能像真人一样逐字回复。
本文将带你在服务器上完成这一整套“全能型”配置。
🛠️ 1. 基础环境与安装
⚠️ 前置要求: 务必使用 64 位 Ubuntu 系统。其他系统可能涉及复杂的依赖构建,不建议新手尝试。
一键安装核心组件
官方提供了一键安装脚本,会自动配置 Node.js 环境及 Clawdbot 核心组件:
curl -fsSL [https://molt.bot/install.sh](https://molt.bot/install.sh) | bash
提示: 安装完成后,请运行
clawdbot version确保安装成功。关于本体的详细运行参数,可参考官方文档,此处不再赘述。
🤖 2. 配置 Telegram 机器人
让 Clawdbot 接管你的 Telegram Bot,实现基础对话功能。
Step 1: 获取 Token
- 在 Telegram 中搜索并私聊 @BotFather。
- 发送
/newbot指令,按照引导创建一个新机器人。 - 复制生成的 API Token。
Step 2: 写入配置
使用 config.patch 命令将 Token 注入配置(无需手动修改复杂的文件):
Bash
# ⚠️ 请将 YOUR_BOT_TOKEN 替换为你真实的 Token
clawdbot gateway config.patch '{"channels": {"telegram": {"enabled": true, "botToken": "YOUR_BOT_TOKEN"}}}'
配置完成后,Gateway 服务会自动重启以应用更改。
🌊 3. 开启“打字机”流式输出 (Stream Mode)
默认情况下,机器人是一次性把回复发出来的。开启流式输出后,消息会逐字/逐句跳出,体验极佳。
Step 1: 修改 Clawdbot 配置
启用 partial 模式:
Bash
clawdbot gateway config.patch '{"channels": {"telegram": {"streamMode": "partial"}}}'
Step 2: BotFather 关键设置 (易错点)
流式输出依赖 Telegram 的 Threaded Mode,这步必须在 BotFather 的小程序界面操作,指令操作无效。
- 打开 @BotFather 的聊天窗口。
- 点击输入框左侧的
Menu或直接点击下方的 Apps/小程序 按钮进入管理界面。 - 选中你的机器人 -> 点击 Bot Settings。
- 找到 Threaded Mode 开关,将其设置为 ON。
最后,建议重启一下网关确保生效:
Bash
clawdbot gateway restart
🌐 4. 赋予联网能力:Chrome 浏览器集成
这是让 AI 变身 Agent 的关键一步。
Step 1: 安装原生 Chrome
Bash
# 下载安装包
wget [https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb](https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb)
# 安装
sudo dpkg -i google-chrome-stable_current_amd64.deb
# ⚠️ 如果报错依赖缺失,执行以下修复命令
sudo apt --fix-broken install -y
Step 2: 在 Clawdbot 中启用浏览器
我们需要指定 Chrome 路径并开放 CDP 控制端口。复制以下整段命令执行:
Bash
clawdbot gateway config.patch '{"browser":{"enabled":true,"controlUrl":"[http://127.0.0.1:18791](http://127.0.0.1:18791)","executablePath":"/usr/bin/google-chrome-stable","headless":true,"noSandbox":true,"defaultProfile":"clawd","profiles":{"clawd":{"cdpPort":18800,"color":"#FF4500"}}}}'
🐛 5. 进阶技巧:远程登录与调试
机器人需要登录微信网页版或 GitHub 怎么办?由于服务器是无头模式(Headless),我们需要把服务器的浏览器画面“映射”到本地来操作。
Step 1: 建立 SSH 隧道
在你的本地电脑(Mac/Windows 终端)执行以下命令,将服务器的调试端口转发到本地:
Bash
# 将 your_server_ip 替换为你的服务器 IP
# 18800 是 Clawdbot 配置文件里默认的 CDP 端口
ssh -L 9222:localhost:18800 root@your_server_ip
Step 2: 本地 Chrome 接入
- 打开本地 Chrome 浏览器,在地址栏输入:
chrome://inspect/#devices - 点击 Configure...,确保列表里包含
localhost:9222。 - 等待几秒,你应该能在下方 Remote Target 中看到 Clawdbot 正在运行的页面。
- 点击 inspect,即可弹出一个窗口,像操作本地浏览器一样去扫码登录你的账号了!
🎙️ 6. 赋予听觉:Whisper 语音识别
让机器人能直接听懂你的语音消息。
Step 1: 环境准备
Bash
# 1. 安装 ffmpeg (音频处理必需)
sudo apt update && sudo apt install ffmpeg -y
# 2. 安装 OpenAI Whisper (确保 pip 已安装)
pip install -U openai-whisper
Step 2: 集成配置
编辑配置文件 ~/.clawdbot/clawdbot.json,在 tools 节点下添加音频处理配置。
💡 极客玩法: 你甚至可以把下面这段 JSON 发给已经连上浏览器的 Clawdbot,让它自己去修改配置文件。
JSON
{
"tools": {
"media": {
"audio": {
"enabled": true,
"models": [
{
"type": "cli",
"command": "/usr/local/bin/whisper",
"args": [
"--model", "base",
"--output_format", "txt",
"{{MediaPath}}"
],
"timeoutSeconds": 120
}
]
}
}
}
}
配置完成后,当你给机器人发送语音条时,它会自动调用 Whisper 转录成文字并进行回复。
常用管理指令速查
- 查看状态:
clawdbot gateway status - 重启网关:
clawdbot gateway restart - 查看日志:
clawdbot logs
现在,你的 Clawdbot 已经是一个全副武装的 AI 助理了,快去试试吧!