语音组成架构师:“看到”你的声音

两年前的经历让孙涛至今难以忘怀。“有一位抗美援朝的老战士,很怀念已经过世的老排长。” 语音合成架构师孙涛就和同事录制了一些老排长在世时的声音,并通过语音合成技术把老排长留给老战士的信读给他听,老人顿时泪流满面。
 
语音合成广泛应用于播报、客服、导航、虚拟主播、虚拟主持人等等。语音合成有三大关键因素:文本内容、发音人音色和说话的韵律节奏。发音人音色的不同在于喉咙。每个人的喉咙结构比较固定,如果把它比喻成一个乐器,文本内容和韵律节奏更像是乐谱。语音合成相当于只要掌握了乐器(喉咙)的基本结构,想要合成什么样的语句,只要提供乐谱(文本内容和韵律节奏)就可以了。
 
“只要收集你说的9句话,就能复刻你的声音”。语音合成架构师孙涛自信地对中工网记者说。每天,孙涛要处理大量采集来的声音。看着高低不平的声波,就像看着即将亮相的乐谱,人工智能是“演奏家”,而他,就是那个“作曲家”。
【声明】:芜湖站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

相关文章