中文命名实体识别的傅立叶卷积网络.docx
《中文命名实体识别的傅立叶卷积网络.docx》由会员分享,可在线阅读,更多相关《中文命名实体识别的傅立叶卷积网络.docx(5页珍藏版)》请在第一文库网上搜索。
1、其中,k0, N-1,对于每个k,离散傅立叶变换将原始输入表示为之和。傅里叶子层将输入沿着序列长度和词向量维数两个维度进行离散傅立叶变换。对于结果我们仅保留实数部分。同时,如果保Transformer中的前馈神经网络,则FTCN-encoder模块将退化成无卷积神经网络参与的FTNN-encoder模块。FTCN-encoder模块的特征提取能力更强,且可以通过设置各子层的连接方式,选择ResNet连接或Concat连接。而FTNN-encoder模块的连接方式则更适合ResNet连接,模型参数量过大且难以收敛。2.2BiLSTM 模块长短期记忆网络是一种特殊的RNN网络,在动态捕获序列特征和
2、保存记忆信息的基础上引入门控机制和记忆单元。用于缓解长序列遗忘问题的三个门控机制分别为遗忘门、输入门和输出门,这种门控机制通过对记忆单元的信息进行有效遗忘和记忆,能够学习到长期依赖并解决了不同长度输入和RNN容易产生梯度消失和爆炸的问题。BiLSTM是对长短期记忆网络的一种优化改进,使用正向和反向长短期记忆网络来提取隐藏的前向语义信息和后向语义信息,实现对上下文数据的充分利用。2. 3CRF模块数两个维度进行离散傅立叶变换。对于结果我们仅保留实数部分。同时,如果保Transformer中的前馈神经网络,则FTCN-encoder模块将退化成无卷积神经网络参与的FTNN-encoder模块。FT
3、CN-encoder模块的特征提取能力更强,且可以通过设置各子层的连接方式,选择ResNet连接或Concat连接。而FTNN-encoder模块的连接方式则更适合ResNet连接,模型参数量过大且难以收敛。2.2BiLSTM 模块长短期记忆网络是一种特殊的RNN网络,在动态捕获序列特征和保存记忆信息的基础上引入门控机制和记忆单元。用于缓解长序列遗忘问题的三个门控机制分别为遗忘门、输入门和输出门,这种门控机制通过对记忆单元的信息进行有效遗忘和记忆,能够学习到长期依赖并解决了不同长度输入和RNN容易产生梯度消失和爆炸的问题。BiLSTM是对长短期记忆网络的一种优化改进,使用正向和反向长短期记忆网
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中文 命名 实体 识别 傅立叶 卷积 网络
