Opus 4.8 写作实测：人味回来了，Skill 遵守也更稳了

如果你最近在用 Opus 4.8 写文章、改文案、跑 Skill，大概率会有一个很直观的感觉：

它说话没那么“AI”了。

尤其是跟 Opus 4.7 比，4.8 在写作语气、措词合理性、指令遵守上，明显舒服很多。它不像 4.7 那样容易写出一堆正确但没温度的话，也不太爱把句子堆得又长又满。

更接近谁？

我的感受是：写作质感已经重新向 4.6 靠拢。

这篇不搞玄学吹捧，咱们直接聊怎么用、适合哪些场景、怎么测，以及有哪些坑别踩。

一句话结论

Opus 4.8 更适合这些任务：

写公众号、博客、教程、评测文
改掉 AI 味，让文字更像真人
按固定风格输出内容
跑 Skill，尤其是规则比较多的 Skill
做复杂写作任务，比如“有结构、有观点、有语气”的文章

但编程方面，暂时没有明显感觉到它比 4.7 强一截。

如果你主要写代码，不急着换。
如果你主要写内容，可以认真试试 4.8。✍️

4.8 最大变化：写作更像人说话

4.7 写作时经常有一个毛病：

它知道自己要表达什么，可表达方式很“规整”。

比如它会写：

该工具能够有效帮助用户优化工作流程，提高生产效率，并在多个场景中发挥重要作用。

这句话没错。

但你要是发到公众号，读者可能三秒划走。

4.8 的好处是，它更愿意换成这种表达：

如果你每天都要整理资料、写周报、改方案，这类工具能帮你少做不少重复活。省下来的时间，够你早点关电脑去吃饭。

意思差不多，但读起来完全不是一个味儿。

一个像产品白皮书。
一个像真人在跟你解释。

这就是 4.8 最明显的进步。

措词更合理：少了“硬凑高级感”

很多 AI 写作翻车，不是观点错，而是措词太假。

常见问题有几个：

动不动就“赋能”“构建”“打造闭环”
一句话塞四五个抽象词
每段都像年终总结
看着很满，读完没印象

4.8 在这块收敛了不少。

它更容易选择普通人会用的词。比如：

| 场景 | 生硬写法 | 更自然的写法 | |---|---|---| | 介绍工具 | 该工具可显著提升内容生产效率 | 用它写初稿，会快很多 | | 写教程 | 用户需完成以下配置流程 | 你按下面几步配好就行 | | 写评测 | 该模型具备较强的语义理解能力 | 它更能听懂你到底想要什么 | | 写建议 | 建议用户结合自身需求进行选择 | 写文章就选它，写代码可以再观望 |

你会发现，好的 AI 写作不是堆辞藻。

是把话说清楚，说得像人。

Skill 遵守更严：这点很关键

如果你经常用 Skill，4.8 的变化会更明显。

它对规则的遵守更稳。

比如你在 Skill 里规定：

标题必须短
每段不超过 3 行
禁止使用某些词
必须输出 JSON
每篇都要包含避坑清单
风格要口语化

4.7 有时候会“理解了，但没完全执行”。

它可能前半段还行，写着写着又回到老毛病：长句、官腔、模板味。

4.8 更像一个守规矩的写手。你给它框，它更愿意待在框里。

这对做自动化内容流特别重要。

比如你每天要批量生成：

小红书笔记
SEO 博客
AI 工具教程
商品详情页
视频脚本
邮件营销文案

模型不守格式，你后面就要人工擦屁股。

模型守格式，你能少改很多。

这才是真省时间。

推荐用法：让 4.8 写出更有“人味”的文章

你可以直接套下面这个 Prompt。

通用写作 Prompt

你是一个资深内容作者，不要写成说明书，也不要写成官方公告。

写作要求：
- 像朋友聊天一样写
- 短句为主
- 每段不超过 3 行
- 多用具体场景，少用抽象词
- 允许有观点、有吐槽、有情绪
- 不要堆概念
- 不要使用营销黑话
- 读者看完能立刻照做

主题：{你的主题}
目标读者：{读者是谁}
输出格式：Markdown
文章结构：
- 标题
- 导语
- 核心结论
- 具体步骤
- 示例
- 避坑清单

这个 Prompt 适合写教程、评测、经验贴。

别把要求写得太虚。

比如别说：

请写得自然一点。

这句话太空了。

你要告诉它什么叫自然：

像朋友聊天一样写，每段不超过 3 行，多用具体场景，少用抽象词。

模型更容易执行。

如果你想测试 4.8 和 4.7 的区别，可以这样做

别只问一句“帮我写一篇文章”。

太粗糙，测不出东西。

建议用同一个题目、同一个 Prompt、同一套评分标准来测。

测试题目

请写一篇《普通人如何用 AI 做个人知识库》的教程。
目标读者是上班族，不懂技术。
要求内容口语化，有具体步骤，有避坑清单。

评分维度

你可以从这几个点看：

是否像真人写的
有没有废话
句子是不是太长
是否有具体场景
教程能不能照做
有没有遵守格式要求
有没有出现官腔、套话、空话

简单打分表

| 维度 | 评分标准 | |---|---| | 人味 | 像不像真人在讲经验 | | 措词 | 有没有翻译腔和官腔 | | 结构 | 小标题是否清晰 | | 可执行性 | 读者能不能照着做 | | 规则遵守 | 是否按要求输出 | | 修改成本 | 你要不要大改 |

真正好用的模型，不是第一眼看起来多华丽。

是你复制出来之后，少改两遍。

适合 4.8 的典型场景

1. 写 AI 教程

比如你要写：

如何用 ChatGPT 做日报
如何用 Claude 写公众号
如何用 NotebookLM 整理资料
如何用 Cursor 改代码

4.8 能把步骤讲得更顺。

不会每段都像产品说明书。

2. 改文案的人味

你可以把一段 AI 味很重的文字丢给它：

请把下面这段文字改得更像真人写的。
要求：短句、口语化、有一点观点，不要营销腔。

{原文}

它在“去 AI 味”这块很适合。

尤其适合改公众号、知乎回答、短视频口播稿。

3. 固定栏目批量生产

如果你有固定模板，比如：

每周 AI 工具推荐
每日模型更新解读
产品功能教程
行业新闻点评

可以把结构写进 Skill，让 4.8 按规则稳定输出。

它现在对 Skill 的遵守更好，批量内容的稳定性会高一些。

编程方面：别急着下结论

写代码这块，目前没感觉到 4.8 有特别明显的优势。

不是说它不行。

而是没有那种“一用就知道强很多”的差距。

如果你的主要任务是：

写业务代码
查 Bug
重构项目
补测试用例
解释报错

建议你自己拿真实项目测。

别用太简单的题。

比如“写一个 Todo List”没啥意义，很多模型都能写。

更好的测试方式是：

这是一个真实项目中的报错和相关代码。
请你定位问题，说明原因，并给出最小修改方案。
不要重写整个文件。

看它能不能：

找到真正的问题
不乱改代码
给出可运行方案
解释清楚风险
不编不存在的 API

这比刷算法题更接近日常开发。

我的建议：按任务选模型

别迷信“新版本一定全面更强”。

模型升级经常是某些能力变好，某些风格变化。

目前可以这样选：

| 任务 | 建议 | |---|---| | 写文章 | 优先试 Opus 4.8 | | 改 AI 味 | Opus 4.8 很合适 | | 跑 Skill | Opus 4.8 更稳 | | 写品牌文案 | Opus 4.8 值得测 | | 编程 | 继续对比，别盲换 | | 批量内容生产 | 用 4.8 跑小样测试 |

如果你每天要写内容，4.8 的价值很直接。

它可能帮你少删几段套话，少改几句官腔。

别小看这点。

写过稿的人都知道，最烦的不是从零写。

是改一篇“看似完整，但全是废话”的稿子。😅

避坑清单

用 Opus 4.8 写作时，注意这几个点：

不要只说“写得自然”，要定义什么叫自然
不要一次塞太多风格要求，容易互相打架
不要让它写太宽泛的主题，越具体越好
不要完全相信第一版，至少让它自查一轮
跑 Skill 前，先用 3 到 5 个样本测稳定性
写代码别只测玩具题，要用真实项目片段
输出格式很重要时，明确告诉它“只输出指定格式”

可以加一句自查指令：

写完后请自查：是否有空话、长句、官腔、格式错误。发现就直接改掉，不要解释。

这句很实用。

能减少不少后期修改。

可直接复制的 4.8 写作模板

你是一个有经验的中文内容作者。

请围绕「{主题}」写一篇教程文章。

目标读者：{读者人群}
使用场景：{具体场景}

写作要求：
- 像真人分享经验，不要像说明书
- 短句为主，每段不超过 3 行
- 多用“你”“咱们”
- 多写具体场景，少写抽象概念
- 有明确观点，不要两边都说
- 给出可执行步骤
- 包含示例和避坑清单
- Markdown 格式输出

文章结构：
# 标题
导语
## 核心结论
## 适合谁用
## 操作步骤
## 示例
## 避坑清单
## 使用建议

把 {主题}、{读者人群}、{具体场景} 换成你的内容就能用。

比如：

主题：如何用 AI 写周报
读者人群：每天被周报折磨的职场人
具体场景：周五下班前 30 分钟，要快速整理本周工作内容

这样写出来的文章，会比“请写一篇 AI 周报教程”靠谱很多。

结论

Opus 4.8 最大的亮点，不是“更会写漂亮话”。

而是更懂正常人怎么说话。

它在人味、措词、Skill 遵守上，比 4.7 更顺手，也更接近 4.6 那种舒服的写作质感。

如果你做内容，值得切过去测一轮。

如果你写代码，可以先观望，用真实项目再判断。

一句话：

写作党可以冲，编程党先别急。