Skip to main content

TTS 在线生成语音

本文详细介绍了利用文本转语音(TTS)技术在线生成语音素材的过程,并对文本配置、变量插入及发音规则进行了全面阐述。

功能概述

TTS 功能用于将文本内容实时转换为标准音频文件,适用于动态话术场景(如账单金额通知、个性化称呼)。用户可灵活配置固定文本与参数变量,系统将其合成后纳入素材库,供外呼任务直接调用。

功能入口

登录呼叫中心控制台,在左侧导航栏选择 语音 > 语音素材 > 生成语音,进入管理页面。

功能介绍

创建 TTS 语音

在 TTS 文本生成语音页面,点击 新建 按钮;

在弹出窗口中填写以下信息:

  • 语音名称:必填项,建议包含业务场景与版本(如“双11促销通知_男声版”),1–20 个字符;

  • 文本类型:必选项,支持两种模式:

    • 固定文本:直接输入全程不变的播报内容;
    • 参数文本:输入包含变量的模板文本,实际呼叫时由系统动态替换;
  • 语言选择:必选项,下拉选择合成语音的语种及音色(如“中文普通话-女性”、“英文-男性”);

  • 文本内容编辑区:

    在此区域输入具体话术;

    • 插入变量:点击工具栏 插入 按钮,可选择预设变量(如 {name}、{amount}),用于动态替换;
    • 插入停顿:点击工具栏 ⏸ 图标,可在语句间插入指定时长的停顿(如 0.5s, 1s),优化听感;
    • 朗读方式:针对选中变量或文本段,下拉选择以下五种读法规则之一:
      • 默认:按常规文本语境自然朗读;
      • 号码:将数字串作为整体号码朗读(常用于电话号码、卡号等,保持连贯性);
      • 字母逐个读出:将字符串中的字母或数字拆解为单个字符依次朗读(如“ABC123”读作“A、B、C、一、二、三”),常用于验证码或序列号;
      • 日期格式:自动识别并规范播报年月日(如“20231001”读作“二零二三年十月一日”);
      • 货币金额:自动转换为大写金额或规范读法(如“100.50”读作“一百元五角”);
  • 备注:可选,用于说明适用渠道或特殊发音要求,最多 100 个字符;

  • 点击 生成并保存 完成创建。

⚠️ 格式要求:

文本长度:单次生成不超过 500 个字符(含变量占位符);

变量规范:变量名需与外呼数据表头严格一致,否则无法替换;

特殊符号:不支持复杂数学公式或特殊表情符号,系统将自动过滤或报错;

生成时长:合成后的音频时长不得超过 60 秒。

编辑 TTS 语音信息

在 TTS 语音列表中,找到目标条目,点击操作列的 编辑;

在编辑窗口中,可修改:

语音名称 文本内容(含变量、停顿设置) 语言选择及朗读方式 描述信息

点击 确认 保存更改并重新合成音频。

⚠️ 注意:修改文本内容或朗读方式后,系统将重新生成音频文件,原音频将被覆盖。若该素材正被运行中的任务引用,新任务将立即生效,正在进行的通话不受影响。

试听 TTS 语音

在 TTS 语音列表中,点击目标条目操作列的 播放 按钮;

系统将在页面内嵌播放器中播放最新合成的录音;

可通过播放器控制暂停、播放速度以及下载。

💡 建议:在插入变量后,务必使用“试听”功能中的“样本数据预览”模式,输入测试数据确认变量替换是否准确、停顿位置是否自然。

删除 TTS 语音

在 TTS 语音列表中,点击目标条目操作列的 删除;

在弹出的确认对话框中,点击 确认;

若删除成功,条目将从列表中移除。

⚠️ 重要:仅当该 TTS 语音 未被任何自动外呼或预测式外呼任务引用时,才允许删除。若已被使用,系统将提示:“该语音素材正在被使用,无法删除”。