coqui(二)-基于character的文本到序列

Db1x 16121

text_to_sequence

对每个拼音的字母建模

_symbols, _ = make_symbols**tp)

返回两个值,这里只要_symbols不要phone

注:参数前面加上* 号 ,意味着参数的个数不止一个

带一个星号(*)参数的函数传入的参数存储为一个元组(tuple)→2,3,4)

带两个(*)号则是表示字典(dict)→{a:2, b:3}

sequence += _symbols_to_sequence_clean_texttext, cleaner_names))

中间经过了clearn清洗了文本

_symbols_to_sequence 结果如下

然后每个token之间插入一个blank 148

经过text = np.asarray 将上面的变成数组

经__getitem__

没对应上的原因:数据边加载边训练 加载的进程和训练的进程一起运行,打印的东西会错乱

当batchsize为1时,先加载了7组数据

然后运行到代码的生成batch的部分,将上面的数据,按顺序迭代训练,batch的数据就是模型输入的x

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注