Guide · 使用教程
ElevenLabs 配音工作流教程:从脚本到可发布 AI 旁白
这篇教程讲清楚如何用 ElevenLabs 制作可发布旁白:选择套餐、准备脚本、挑选声音、克隆授权声音、导出音频,并控制 credits 成本。
这篇教程会完成什么
这篇教程会带你用 ElevenLabs 完成一条可发布的 AI 旁白工作流。目标不是随便生成一段声音,而是从脚本整理、声音选择、语气调整、成本控制到导出复核,建立一套可以反复使用的流程。
ElevenLabs 很适合播客、有声书、视频旁白、课程配音和产品演示。如果你是第一次使用,建议先从短脚本开始,不要一上来就生成几十分钟音频。
开始前需要准备
你需要准备一段清晰脚本、目标语言、旁白风格说明,以及最终使用场景。比如“面向 B2B 产品介绍,语气专业、语速中等、不要太夸张”。
如果要使用声音克隆,还必须准备授权音频。不要上传没有授权的人声,也不要克隆公众人物、同事或客户的声音。声音克隆是高风险能力,授权和用途必须清楚。
第一步:选择合适套餐
如果只是测试声音质量,免费版即可。如果要商用或稳定制作内容,Starter 或 Creator 更合理。Creator 更适合需要专业声音克隆和较长内容制作的人。Pro 以上适合高频创作、团队和 API 场景。
不要只看月费,要看 credits。长视频、课程和有声书会快速消耗额度。正式项目开始前,先用一段 1 分钟脚本估算平均消耗,再推算整批内容成本。
第二步:整理脚本
AI 语音的质量很大程度取决于脚本。建议把长句拆短,避免一口气读太多修饰语。数字、缩写、英文品牌名最好提前确认读法。
例如,“API、TTS、SLA” 这类缩写,在不同声音里读法可能不同。正式生成前,可以先用一小段测试音频检查发音。
第三步:选择声音和语气
ElevenLabs 有大量声音可选。不要只按“好听”挑声音,而要按场景选。课程旁白需要稳定清晰,广告需要情绪和节奏,有声书需要长时间耐听,产品演示需要可信和克制。
建议每个项目先选 3 到 5 个候选声音,用同一段脚本生成试听,再让团队比较。不要每一段内容都换声音,否则品牌一致性会变差。
第四步:使用声音克隆
即时声音克隆适合快速测试,专业声音克隆适合长期品牌声音。无论哪种,都要确保音频清晰、噪声少、授权明确。
克隆后不要直接大批量生成。先用不同语气和不同长度的文本测试,看声音是否稳定,是否容易出现发音错误、情绪过度或语速异常。
第五步:生成并复核音频
生成音频后,至少检查四点:发音是否正确,停顿是否自然,情绪是否符合场景,音量和音质是否适合后期剪辑。
如果是视频旁白,还要检查节奏是否能和画面配合。AI 语音听起来好,不代表它一定适合视频时间轴。必要时把脚本拆成更短片段,逐段生成和剪辑。
第六步:控制成本
成本控制有三个关键:脚本长度、模型选择、返工次数。脚本越长,credits 消耗越高;反复试错也会消耗额度。
建议先生成小样,确认声音和语气后再批量生成。团队项目可以建立“声音规范”:固定声音、语速、风格、发音表和禁用表达。这样可以减少返工。
常见错误
第一,直接复制长文生成。长文最好先拆段,否则节奏难控制。第二,不检查发音。品牌名和技术词最容易出错。第三,不算 credits。生成前不估算,项目后期容易超支。第四,忽略授权。声音克隆一定要有明确授权。
什么时候该换别的工具
如果你需要完整视频编辑和团队审片流程,Murf 可能更适合。如果你只是做低成本内部语音通知,可以测试 OpenAI TTS 或更便宜的替代方案。如果你需要实时语音 Agent,要重点比较延迟、稳定性和电话集成能力。
FAQ
ElevenLabs 的关键是先小样、后批量。只要脚本、声音、授权和成本都控制好,它可以显著提高旁白制作效率。
常见问题
- ElevenLabs 适合做长视频旁白吗?
- 适合,但建议按段生成,逐段检查发音、停顿和节奏,再进入视频剪辑流程。
- 声音克隆需要注意什么?
- 必须确认授权,音频要清晰,先用小样测试稳定性,不要直接大批量生成。
- 怎么减少 credits 浪费?
- 先用短脚本测试声音和语气,确认后再批量生成;同时建立发音表和固定声音规范。