Skip to main content

TTS 在线生成语音

本文详细介绍了利用文本转语音(TTS)技术在线生成语音素材的过程,并对文本配置、变量插入及特殊格式读法进行了全面阐述。

功能概述

TTS 功能用于将文本内容实时转换为标准音频文件,适用于动态话术场景(如账单金额通知、验证码播报)。用户可灵活配置固定文本与参数变量,支持在保存前实时试听,合成后的音频纳入素材库供外呼任务调用。

功能入口

登录呼叫中心控制台,在左侧导航栏选择 语音 > 语音素材 > 生成语音,进入管理页面。

功能介绍

创建 TTS 语音

在 TTS 文本生成语音页面,点击 添加 按钮;

在弹出窗口中填写以下信息:

  • 语音名称:必填项,建议包含业务场景与版本(如“双11促销通知_男声版”),1–20 个字符;

  • 文本类型:必选项,支持两种模式:

    • 固定文本:直接输入全程不变的播报内容;
    • 参数文本:输入包含变量的模板文本,实际呼叫时由系统动态替换;
  • 语言选择:必选项,下拉选择目标国家/地区语言(如“中文(中国)”、“英文(美国)”、“日文(日本)”等),系统将据此加载对应的发音引擎;

  • 文本内容编辑区:

    在此区域输入具体话术;

    • 插入变量:点击工具栏 插入 按钮,可选择预设变量(如 {name}、{amount}),用于动态替换;
    • 插入停顿:点击工具栏 ⏸ 图标,可在语句间插入指定时长的停顿(如 0.5s, 1s),优化听感;
    • 朗读方式:针对选中变量或文本段,下拉选择以下五种读法规则之一:
      • 默认:按常规文本语境自然朗读;
      • 号码:将数字串作为整体号码朗读(常用于电话号码、卡号等,保持连贯性);
      • 字母逐个读出:将字符串中的字母或数字拆解为单个字符依次朗读(如“ABC123”读作“A、B、C、一、二、三”),常用于验证码或序列号;
      • 日期格式:自动识别并规范播报年月日(如“20231001”读作“二零二三年十月一日”);
      • 货币金额:自动转换为大写金额或规范读法(如“100.50”读作“一百元五角”);
  • 实时试听(重要):

    • 在点击保存前,可点击编辑区下方的 试听 按钮;
    • 系统将根据当前配置的文本、变量样例、停顿及朗读方式即时合成语音并播放;
    • 用户可反复调整参数并试听,直至效果满意;

确认无误后,点击 生成并保存 完成创建。

⚠️ 格式要求:

文本长度:单次生成不超过 500 个字符(含变量占位符);

变量规范:变量名需与外呼数据表头严格一致,否则无法替换;

特殊符号:不支持复杂数学公式或特殊表情符号,系统将自动过滤或报错;

生成时长:合成后的音频时长不得超过 60 秒。

查看与播放已生成语音

在 TTS 语音列表中,点击目标条目操作列的 播放语音 按钮;

系统将播放该条目最终生成并保存的音频文件;

可通过播放器控制暂停、调节音量以及下载音频文件。

删除 TTS 语音

在 TTS 语音列表中,点击目标条目操作列的 删除

在弹出的确认对话框中,点击 确认

若删除成功,条目将从列表中移除。

⚠️ 重要:仅当该 TTS 语音 未被任何自动外呼或预测式外呼任务引用时,才允许删除。若已被使用,系统将提示:“该语音素材正在被使用,无法删除”。