首页 / 正文

打造你的私人贾维斯:Molt/Clawdbot 全能部署指南(语音交互+流式输出+浏览器自动化)

Mooko
发布于 2026-01-30 · 5分钟阅读
973 浏览
0 点赞 暴击点赞!

普通的 AI 机器人只能对话,但 Clawdbot (Molt) 能让你的 AI 拥有“手”和“耳朵”。

通过集成 Chrome 浏览器,它能帮你自动化操作网页;通过集成 Whisper,它能听懂你的语音条;通过配置 Telegram 流式输出,它能像真人一样逐字回复。

本文将带你在服务器上完成这一整套“全能型”配置。


🛠️ 1. 基础环境与安装

⚠️ 前置要求: 务必使用 64 位 Ubuntu 系统。其他系统可能涉及复杂的依赖构建,不建议新手尝试。

一键安装核心组件

官方提供了一键安装脚本,会自动配置 Node.js 环境及 Clawdbot 核心组件:

curl -fsSL [https://molt.bot/install.sh](https://molt.bot/install.sh) | bash

提示: 安装完成后,请运行 clawdbot version 确保安装成功。关于本体的详细运行参数,可参考官方文档,此处不再赘述。


🤖 2. 配置 Telegram 机器人

让 Clawdbot 接管你的 Telegram Bot,实现基础对话功能。

Step 1: 获取 Token

  1. 在 Telegram 中搜索并私聊 @BotFather
  2. 发送 /newbot 指令,按照引导创建一个新机器人。
  3. 复制生成的 API Token

Step 2: 写入配置

使用 config.patch 命令将 Token 注入配置(无需手动修改复杂的文件):

Bash

# ⚠️ 请将 YOUR_BOT_TOKEN 替换为你真实的 Token
clawdbot gateway config.patch '{"channels": {"telegram": {"enabled": true, "botToken": "YOUR_BOT_TOKEN"}}}'

配置完成后,Gateway 服务会自动重启以应用更改。


🌊 3. 开启“打字机”流式输出 (Stream Mode)

默认情况下,机器人是一次性把回复发出来的。开启流式输出后,消息会逐字/逐句跳出,体验极佳。

Step 1: 修改 Clawdbot 配置

启用 partial 模式:

Bash

clawdbot gateway config.patch '{"channels": {"telegram": {"streamMode": "partial"}}}'

Step 2: BotFather 关键设置 (易错点)

流式输出依赖 Telegram 的 Threaded Mode,这步必须在 BotFather 的小程序界面操作,指令操作无效。

  1. 打开 @BotFather 的聊天窗口。
  2. 点击输入框左侧的 Menu 或直接点击下方的 Apps/小程序 按钮进入管理界面。
  3. 选中你的机器人 -> 点击 Bot Settings
  4. 找到 Threaded Mode 开关,将其设置为 ON

最后,建议重启一下网关确保生效:

Bash

clawdbot gateway restart

🌐 4. 赋予联网能力:Chrome 浏览器集成

这是让 AI 变身 Agent 的关键一步。

Step 1: 安装原生 Chrome

Bash

# 下载安装包
wget [https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb](https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb)

# 安装
sudo dpkg -i google-chrome-stable_current_amd64.deb

# ⚠️ 如果报错依赖缺失,执行以下修复命令
sudo apt --fix-broken install -y

Step 2: 在 Clawdbot 中启用浏览器

我们需要指定 Chrome 路径并开放 CDP 控制端口。复制以下整段命令执行:

Bash

clawdbot gateway config.patch '{"browser":{"enabled":true,"controlUrl":"[http://127.0.0.1:18791](http://127.0.0.1:18791)","executablePath":"/usr/bin/google-chrome-stable","headless":true,"noSandbox":true,"defaultProfile":"clawd","profiles":{"clawd":{"cdpPort":18800,"color":"#FF4500"}}}}'

🐛 5. 进阶技巧:远程登录与调试

机器人需要登录微信网页版或 GitHub 怎么办?由于服务器是无头模式(Headless),我们需要把服务器的浏览器画面“映射”到本地来操作。

Step 1: 建立 SSH 隧道

在你的本地电脑(Mac/Windows 终端)执行以下命令,将服务器的调试端口转发到本地:

Bash

# 将 your_server_ip 替换为你的服务器 IP
# 18800 是 Clawdbot 配置文件里默认的 CDP 端口
ssh -L 9222:localhost:18800 root@your_server_ip

Step 2: 本地 Chrome 接入

  1. 打开本地 Chrome 浏览器,在地址栏输入:chrome://inspect/#devices
  2. 点击 Configure...,确保列表里包含 localhost:9222
  3. 等待几秒,你应该能在下方 Remote Target 中看到 Clawdbot 正在运行的页面。
  4. 点击 inspect,即可弹出一个窗口,像操作本地浏览器一样去扫码登录你的账号了!

🎙️ 6. 赋予听觉:Whisper 语音识别

让机器人能直接听懂你的语音消息。

Step 1: 环境准备

Bash

# 1. 安装 ffmpeg (音频处理必需)
sudo apt update && sudo apt install ffmpeg -y

# 2. 安装 OpenAI Whisper (确保 pip 已安装)
pip install -U openai-whisper

Step 2: 集成配置

编辑配置文件 ~/.clawdbot/clawdbot.json,在 tools 节点下添加音频处理配置。

💡 极客玩法: 你甚至可以把下面这段 JSON 发给已经连上浏览器的 Clawdbot,让它自己去修改配置文件。

JSON

{
  "tools": {
    "media": {
      "audio": {
        "enabled": true,
        "models": [
          {
            "type": "cli",
            "command": "/usr/local/bin/whisper",
            "args": [
              "--model", "base",
              "--output_format", "txt",
              "{{MediaPath}}"
            ],
            "timeoutSeconds": 120
          }
        ]
      }
    }
  }
}

配置完成后,当你给机器人发送语音条时,它会自动调用 Whisper 转录成文字并进行回复。


常用管理指令速查

  • 查看状态: clawdbot gateway status
  • 重启网关: clawdbot gateway restart
  • 查看日志: clawdbot logs

现在,你的 Clawdbot 已经是一个全副武装的 AI 助理了,快去试试吧!