8 Eric Huang’s Model 在Bengio的神经网络结构的基础上,Eric Huang提出了引入文档的全局信息引神经网络语言模型,结构类似于Bengio的网络结构。
8.1 模型结构 相比Bengio的模型,Eric Huang引入了词的全局信息,在原本的网络结构中加入了子网络,形成如下图所示结构。
图5 Eric Huang的网络结构图
其中,,代表局部的得分,代表全局的得分。的计算公式为,
为当前词的Context中个词向量的拼接,为激活函数(逐个元素使用),比如为对网络中的参数。
相应的,的计算公式,
其中,为文章中包含的词向量的加权平均,权值公式可以有多种形式,Eric Huang采用IDF加权的方式。
8.2 参数求解 Eric Huang采用[C&W, 2007]中的求解方法,从词表中随机采样一个替换当前词,构造如下损失函数(类似于Ranking问题)
求解过程采用了min-batch L-BFGS。