my first repository is to learn how to build fithub repository.
wav.scp text
aishell_cmvn 计算脚本: utils/compute_cmvn.sh
字典前三位:
三个特殊的字符,其余的字典如果是char就是把数据中的char都放到字典中。
zh_token_list 是根据aishell 制作的纯中文字典
4 层conformer encoder 2层decoder 50小时aishell wer=26% 一轮1~2分钟 100小时 wer=17% 一轮3~4分钟 1000小时 wer=5%