一家名为“华丽琴鸟”(Lyrebird)的加拿大初创公司发明了一套人工智能系统,用户只需使用一段长约1分钟的录音,便可合成讲话者的声音。该人工智能系统可利用语音模仿算法仿制某人的声音,还能声情并茂地朗读各类文本,虽然这一语音复制技术听上去挺有趣,但也可能产生严重后果,因为使用者可用其假冒他人身份。
该初创公司以蒙特利尔大学博士生们研发的深度学习模型为基础。公司名为“华丽琴鸟”,这是一种原产澳大利亚的鸟类,可同时模仿20种不同生物的声音。
该公司使用人工智能系统,将一段语音中的个人特征压缩成一段独特的编码。研发人员称,将该编码输入算法后,不到半秒钟便可生成1000个句子,该算法不仅能合成语音,还能对声音进行控制,赋予其愤怒、同情或紧张等情感,官网上以特朗普、奥巴马和希拉里的声音为例,演示了该技术的准确程度。
研发人员称,这一技术可得到广泛运用,如充当个人助理、用名人的声音阅读有声书、或为残疾人合成“演讲”等,在动漫电影和视频游戏中也将有用武之地, “‘华丽琴鸟’是首家利用一小段录音、便可准确复制他人声音的公司。这样的技术可引发严重的社会问题。”研究人员在官网上写道。
“录音常被视作强有力的证据,许多国家的司法系统尤其看重这一点。而不法分子可利用我们发明的技术轻易操纵录音,从而破坏了录音作为证据的可信度。”研发人员承认,该技术可能导致危险后果,如“通过窃取他人身份误导外交官、或进行欺诈等”,该团队认为,等到该技术对公众开放之后,录音便不应被视作验明正身的证据。
该公司表示,这一技术目前仍处在研发阶段,且未提及具体发布时间及费用。