首页 / 正文

Opus 4.8 写作实测:人味回来了,Skill 遵守也更稳了

Mooko
发布于 2026-05-29 · 5分钟阅读
274 浏览
0 点赞 暴击点赞!

Opus 4.8 写作实测:人味回来了,Skill 遵守也更稳了

如果你最近在用 Opus 4.8 写文章、改文案、跑 Skill,大概率会有一个很直观的感觉:

它说话没那么“AI”了。

尤其是跟 Opus 4.7 比,4.8 在写作语气、措词合理性、指令遵守上,明显舒服很多。它不像 4.7 那样容易写出一堆正确但没温度的话,也不太爱把句子堆得又长又满。

更接近谁?

我的感受是:写作质感已经重新向 4.6 靠拢。

这篇不搞玄学吹捧,咱们直接聊怎么用、适合哪些场景、怎么测,以及有哪些坑别踩。


一句话结论

Opus 4.8 更适合这些任务:

  • 写公众号、博客、教程、评测文
  • 改掉 AI 味,让文字更像真人
  • 按固定风格输出内容
  • 跑 Skill,尤其是规则比较多的 Skill
  • 做复杂写作任务,比如“有结构、有观点、有语气”的文章

但编程方面,暂时没有明显感觉到它比 4.7 强一截。

如果你主要写代码,不急着换。
如果你主要写内容,可以认真试试 4.8。✍️


4.8 最大变化:写作更像人说话

4.7 写作时经常有一个毛病:

它知道自己要表达什么,可表达方式很“规整”。

比如它会写:

该工具能够有效帮助用户优化工作流程,提高生产效率,并在多个场景中发挥重要作用。

这句话没错。

但你要是发到公众号,读者可能三秒划走。

4.8 的好处是,它更愿意换成这种表达:

如果你每天都要整理资料、写周报、改方案,这类工具能帮你少做不少重复活。省下来的时间,够你早点关电脑去吃饭。

意思差不多,但读起来完全不是一个味儿。

一个像产品白皮书。
一个像真人在跟你解释。

这就是 4.8 最明显的进步。


措词更合理:少了“硬凑高级感”

很多 AI 写作翻车,不是观点错,而是措词太假。

常见问题有几个:

  • 动不动就“赋能”“构建”“打造闭环”
  • 一句话塞四五个抽象词
  • 每段都像年终总结
  • 看着很满,读完没印象

4.8 在这块收敛了不少。

它更容易选择普通人会用的词。比如:

| 场景 | 生硬写法 | 更自然的写法 | |---|---|---| | 介绍工具 | 该工具可显著提升内容生产效率 | 用它写初稿,会快很多 | | 写教程 | 用户需完成以下配置流程 | 你按下面几步配好就行 | | 写评测 | 该模型具备较强的语义理解能力 | 它更能听懂你到底想要什么 | | 写建议 | 建议用户结合自身需求进行选择 | 写文章就选它,写代码可以再观望 |

你会发现,好的 AI 写作不是堆辞藻。

是把话说清楚,说得像人。


Skill 遵守更严:这点很关键

如果你经常用 Skill,4.8 的变化会更明显。

它对规则的遵守更稳。

比如你在 Skill 里规定:

  • 标题必须短
  • 每段不超过 3 行
  • 禁止使用某些词
  • 必须输出 JSON
  • 每篇都要包含避坑清单
  • 风格要口语化

4.7 有时候会“理解了,但没完全执行”。

它可能前半段还行,写着写着又回到老毛病:长句、官腔、模板味。

4.8 更像一个守规矩的写手。你给它框,它更愿意待在框里。

这对做自动化内容流特别重要。

比如你每天要批量生成:

  • 小红书笔记
  • SEO 博客
  • AI 工具教程
  • 商品详情页
  • 视频脚本
  • 邮件营销文案

模型不守格式,你后面就要人工擦屁股。

模型守格式,你能少改很多。

这才是真省时间。


推荐用法:让 4.8 写出更有“人味”的文章

你可以直接套下面这个 Prompt。

通用写作 Prompt

你是一个资深内容作者,不要写成说明书,也不要写成官方公告。

写作要求:
- 像朋友聊天一样写
- 短句为主
- 每段不超过 3 行
- 多用具体场景,少用抽象词
- 允许有观点、有吐槽、有情绪
- 不要堆概念
- 不要使用营销黑话
- 读者看完能立刻照做

主题:{你的主题}
目标读者:{读者是谁}
输出格式:Markdown
文章结构:
- 标题
- 导语
- 核心结论
- 具体步骤
- 示例
- 避坑清单

这个 Prompt 适合写教程、评测、经验贴。

别把要求写得太虚。

比如别说:

请写得自然一点。

这句话太空了。

你要告诉它什么叫自然:

像朋友聊天一样写,每段不超过 3 行,多用具体场景,少用抽象词。

模型更容易执行。


如果你想测试 4.8 和 4.7 的区别,可以这样做

别只问一句“帮我写一篇文章”。

太粗糙,测不出东西。

建议用同一个题目、同一个 Prompt、同一套评分标准来测。

测试题目

请写一篇《普通人如何用 AI 做个人知识库》的教程。
目标读者是上班族,不懂技术。
要求内容口语化,有具体步骤,有避坑清单。

评分维度

你可以从这几个点看:

  • 是否像真人写的
  • 有没有废话
  • 句子是不是太长
  • 是否有具体场景
  • 教程能不能照做
  • 有没有遵守格式要求
  • 有没有出现官腔、套话、空话

简单打分表

| 维度 | 评分标准 | |---|---| | 人味 | 像不像真人在讲经验 | | 措词 | 有没有翻译腔和官腔 | | 结构 | 小标题是否清晰 | | 可执行性 | 读者能不能照着做 | | 规则遵守 | 是否按要求输出 | | 修改成本 | 你要不要大改 |

真正好用的模型,不是第一眼看起来多华丽。

是你复制出来之后,少改两遍。


适合 4.8 的典型场景

1. 写 AI 教程

比如你要写:

  • 如何用 ChatGPT 做日报
  • 如何用 Claude 写公众号
  • 如何用 NotebookLM 整理资料
  • 如何用 Cursor 改代码

4.8 能把步骤讲得更顺。

不会每段都像产品说明书。

2. 改文案的人味

你可以把一段 AI 味很重的文字丢给它:

请把下面这段文字改得更像真人写的。
要求:短句、口语化、有一点观点,不要营销腔。

{原文}

它在“去 AI 味”这块很适合。

尤其适合改公众号、知乎回答、短视频口播稿。

3. 固定栏目批量生产

如果你有固定模板,比如:

  • 每周 AI 工具推荐
  • 每日模型更新解读
  • 产品功能教程
  • 行业新闻点评

可以把结构写进 Skill,让 4.8 按规则稳定输出。

它现在对 Skill 的遵守更好,批量内容的稳定性会高一些。


编程方面:别急着下结论

写代码这块,目前没感觉到 4.8 有特别明显的优势。

不是说它不行。

而是没有那种“一用就知道强很多”的差距。

如果你的主要任务是:

  • 写业务代码
  • 查 Bug
  • 重构项目
  • 补测试用例
  • 解释报错

建议你自己拿真实项目测。

别用太简单的题。

比如“写一个 Todo List”没啥意义,很多模型都能写。

更好的测试方式是:

这是一个真实项目中的报错和相关代码。
请你定位问题,说明原因,并给出最小修改方案。
不要重写整个文件。

看它能不能:

  • 找到真正的问题
  • 不乱改代码
  • 给出可运行方案
  • 解释清楚风险
  • 不编不存在的 API

这比刷算法题更接近日常开发。


我的建议:按任务选模型

别迷信“新版本一定全面更强”。

模型升级经常是某些能力变好,某些风格变化。

目前可以这样选:

| 任务 | 建议 | |---|---| | 写文章 | 优先试 Opus 4.8 | | 改 AI 味 | Opus 4.8 很合适 | | 跑 Skill | Opus 4.8 更稳 | | 写品牌文案 | Opus 4.8 值得测 | | 编程 | 继续对比,别盲换 | | 批量内容生产 | 用 4.8 跑小样测试 |

如果你每天要写内容,4.8 的价值很直接。

它可能帮你少删几段套话,少改几句官腔。

别小看这点。

写过稿的人都知道,最烦的不是从零写。

是改一篇“看似完整,但全是废话”的稿子。😅


避坑清单

用 Opus 4.8 写作时,注意这几个点:

  • 不要只说“写得自然”,要定义什么叫自然
  • 不要一次塞太多风格要求,容易互相打架
  • 不要让它写太宽泛的主题,越具体越好
  • 不要完全相信第一版,至少让它自查一轮
  • 跑 Skill 前,先用 3 到 5 个样本测稳定性
  • 写代码别只测玩具题,要用真实项目片段
  • 输出格式很重要时,明确告诉它“只输出指定格式”

可以加一句自查指令:

写完后请自查:是否有空话、长句、官腔、格式错误。发现就直接改掉,不要解释。

这句很实用。

能减少不少后期修改。


可直接复制的 4.8 写作模板

你是一个有经验的中文内容作者。

请围绕「{主题}」写一篇教程文章。

目标读者:{读者人群}
使用场景:{具体场景}

写作要求:
- 像真人分享经验,不要像说明书
- 短句为主,每段不超过 3 行
- 多用“你”“咱们”
- 多写具体场景,少写抽象概念
- 有明确观点,不要两边都说
- 给出可执行步骤
- 包含示例和避坑清单
- Markdown 格式输出

文章结构:
# 标题
导语
## 核心结论
## 适合谁用
## 操作步骤
## 示例
## 避坑清单
## 使用建议

{主题}{读者人群}{具体场景} 换成你的内容就能用。

比如:

主题:如何用 AI 写周报
读者人群:每天被周报折磨的职场人
具体场景:周五下班前 30 分钟,要快速整理本周工作内容

这样写出来的文章,会比“请写一篇 AI 周报教程”靠谱很多。


结论

Opus 4.8 最大的亮点,不是“更会写漂亮话”。

而是更懂正常人怎么说话。

它在人味、措词、Skill 遵守上,比 4.7 更顺手,也更接近 4.6 那种舒服的写作质感。

如果你做内容,值得切过去测一轮。

如果你写代码,可以先观望,用真实项目再判断。

一句话:

写作党可以冲,编程党先别急。

OpenClaw
OpenClaw
木瓜AI支持养龙虾啦
木瓜AI龙虾专供API,限时领取免费tokens
可在 OpenClaw接入全球顶尖AI大模型
立即领取