Mandarin speech recognition (MSR) --> dialect speech recognition (DSR)
- 先前的延迟环动态连接策略是基于说话人识别任务做的,是稀疏度优化的特例,不能表明该策略的普适性,需要补充一些标准公开数据集的实验及数据分析;
- 稀疏连接对分布式系统的重要性(待开展);
为什么Fit-DNN的识别性能高于DRC?本文试着从动力系统角度给出分析。相比于DRC,Fit-DNN有了更多的延迟环,且都带有反馈模块,动力系统处理信息的能力(IPC)会因此变强吗?
我们基于NARMA10任务考察IPC,因为该任务需要线性与非线性信息处理能力,考察得比较全面。
全局误差比局部残差低1阶。我们通常所说的数值方法的阶数,指的就是采用这个数值方法的全局误差的阶数。
基于动力系统的储油池计算,Mackey-Glass system适用于电子实现,Ikeda system适用于光电实现;基于口述数字识别数据集 Free Spoken Digit Dataset (FSDD)
- [x] 实现MG/Ikeda-based的DRC框架
- [x] Lyon耳蜗模型 VS MFCC
主要工作节点:
- [x] Fit-RNN的实现:前后向传播的修改
- [x] 与Fit-DNN的对比:为什么不直接在输入端考虑前后帧?
- [x] 修改非线性函数后对比:sin>tanh
- [x] 与Reservoir Computing的比较
- [x] Lyon VS MFCC:MFCC
- [x] 基于Ikeda的DRC
- [x] 三个模型的对比:长语音、短语音
请注意,本文的回答不保证准确性,Chat GPT没有权威验证!