TTS 在线生成语音

本文详细介绍了利用文本转语音（TTS）技术在线生成语音素材的过程，并对文本配置、变量插入及发音规则进行了全面阐述。

功能概述

TTS 功能用于将文本内容实时转换为标准音频文件，适用于动态话术场景（如账单金额通知、个性化称呼）。用户可灵活配置固定文本与参数变量，系统将其合成后纳入素材库，供外呼任务直接调用。

功能入口

登录呼叫中心控制台，在左侧导航栏选择 语音 > 语音素材 > ~~TTS~~ 文本生成语音，进入管理页面。

功能介绍

创建 TTS 语音

在 TTS 文本生成语音页面，点击新建按钮；

在弹出窗口中填写以下信息：

语音名称：必填项，建议包含业务场景与版本（如“双11促销通知_男声版”），1–20 个字符；

文本类型：必选项，支持两种模式：
- 固定文本：直接输入全程不变的播报内容；
- 参数文本：输入包含变量的模板文本，实际呼叫时由系统动态替换；

语言选择：必选项，下拉选择合成语音的语种及音色（如“中文普通话-女性”、“英文-男性”）；

文本内容编辑区：在此区域输入具体话术；插入变量：点击工具栏 { } 图标，可选择预设变量（如 {name}、{amount}），用于动态替换；插入停顿：点击工具栏 ⏸ 图标，可在语句间插入指定时长的停顿（如 0.5s, 1s），优化听感；朗读方式：下拉选择语速（正常/快速/慢速）及语调风格（严肃/亲切/激昂）；

备注：可选，用于说明适用渠道或特殊发音要求，最多 100 个字符；

点击生成并保存完成创建。

⚠️ 格式要求：文本长度：单次生成不超过 500 个字符（含变量占位符）；变量规范：变量名需与外呼数据表头严格一致，否则无法替换；特殊符号：不支持复杂数学公式或特殊表情符号，系统将自动过滤或报错；生成时长：合成后的音频时长不得超过 60 秒。

编辑 TTS 语音信息

在 TTS 语音列表中，找到目标条目，点击操作列的编辑；

在编辑窗口中，可修改：

语音名称文本内容（含变量、停顿设置）语言选择及朗读方式描述信息

点击确认保存更改并重新合成音频。

⚠️ 注意：修改文本内容或朗读方式后，系统将重新生成音频文件，原音频将被覆盖。若该素材正被运行中的任务引用，新任务将立即生效，正在进行的通话不受影响。

试听 TTS 语音

在 TTS 语音列表中，点击目标条目操作列的播放按钮；

系统将在页面内嵌播放器中播放最新合成的录音；

可通过播放器控制暂停、播放速度以及下载。

💡 建议：在插入变量后，务必使用“试听”功能中的“样本数据预览”模式，输入测试数据确认变量替换是否准确、停顿位置是否自然。

删除 TTS 语音

在 TTS 语音列表中，点击目标条目操作列的删除；

在弹出的确认对话框中，点击确认；

若删除成功，条目将从列表中移除。

⚠️ 重要：仅当该 TTS 语音未被任何自动外呼或预测式外呼任务引用时，才允许删除。若已被使用，系统将提示：“该语音素材正在被使用，无法删除”。