Skip to main content

TTS 在线生成语音

本文详细介绍了利用文本转语音(TTS)技术在线生成语音素材的过程,并对文本配置、变量插入及发音规则进行了全面阐述。

功能概述

TTS 功能用于将文本内容实时转换为标准音频文件,适用于动态话术场景(如账单金额通知、个性化称呼)。用户可灵活配置固定文本与参数变量,系统将其合成后纳入素材库,供外呼任务直接调用。

功能入口

登录呼叫中心控制台,在左侧导航栏选择 语音 > 语音素材 > TTS 文本生成语音,进入管理页面。

功能介绍

创建 TTS 语音

在 TTS 文本生成语音页面,点击 新建 按钮;

在弹出窗口中填写以下信息:

  • 语音名称:必填项,建议包含业务场景与版本(如“双11促销通知_男声版”),1–20 个字符;

  • 文本类型:必选项,支持两种模式:

    • 固定文本:直接输入全程不变的播报内容;
    • 参数文本:输入包含变量的模板文本,实际呼叫时由系统动态替换;

  • 语言选择:必选项,下拉选择合成语音的语种及音色(如“中文普通话-女性”、“英文-男性”);

文本内容编辑区: 在此区域输入具体话术; 插入变量:点击工具栏 { } 图标,可选择预设变量(如 {name}、{amount}),用于动态替换; 插入停顿:点击工具栏 ⏸ 图标,可在语句间插入指定时长的停顿(如 0.5s, 1s),优化听感; 朗读方式:下拉选择语速(正常/快速/慢速)及语调风格(严肃/亲切/激昂);

  • 备注:可选,用于说明适用渠道或特殊发音要求,最多 100 个字符;

  • 点击 生成并保存 完成创建。

⚠️ 格式要求: 文本长度:单次生成不超过 500 个字符(含变量占位符); 变量规范:变量名需与外呼数据表头严格一致,否则无法替换; 特殊符号:不支持复杂数学公式或特殊表情符号,系统将自动过滤或报错; 生成时长:合成后的音频时长不得超过 60 秒。

编辑 TTS 语音信息

在 TTS 语音列表中,找到目标条目,点击操作列的 编辑;

在编辑窗口中,可修改:

语音名称 文本内容(含变量、停顿设置) 语言选择及朗读方式 描述信息

点击 确认 保存更改并重新合成音频。

⚠️ 注意:修改文本内容或朗读方式后,系统将重新生成音频文件,原音频将被覆盖。若该素材正被运行中的任务引用,新任务将立即生效,正在进行的通话不受影响。

试听 TTS 语音

在 TTS 语音列表中,点击目标条目操作列的 播放 按钮;

系统将在页面内嵌播放器中播放最新合成的录音;

可通过播放器控制暂停、播放速度以及下载。

💡 建议:在插入变量后,务必使用“试听”功能中的“样本数据预览”模式,输入测试数据确认变量替换是否准确、停顿位置是否自然。

删除 TTS 语音

在 TTS 语音列表中,点击目标条目操作列的 删除;

在弹出的确认对话框中,点击 确认;

若删除成功,条目将从列表中移除。

⚠️ 重要:仅当该 TTS 语音 未被任何自动外呼或预测式外呼任务引用时,才允许删除。若已被使用,系统将提示:“该语音素材正在被使用,无法删除”。