首页
|
新闻
|
新品
|
文库
|
方案
|
视频
|
下载
|
商城
|
开发板
|
数据中心
|
座谈新版
|
培训
|
工具
|
博客
|
论坛
|
百科
|
GEC
|
活动
|
主题月
|
电子展
注册
登录
论坛
博客
搜索
帮助
导航
默认风格
uchome
discuz6
GreenM
»
DSP技术
» 神经网络语言模型详解(转)(3)
返回列表
回复
发帖
发新话题
发布投票
发布悬赏
发布辩论
发布活动
发布视频
发布商品
神经网络语言模型详解(转)(3)
发短消息
加为好友
yuyang911220
当前离线
UID
1029342
帖子
9914
精华
0
积分
4959
阅读权限
90
在线时间
286 小时
注册时间
2014-5-22
最后登录
2017-7-24
论坛元老
UID
1029342
性别
男
1
#
打印
字体大小:
t
T
yuyang911220
发表于 2016-9-10 08:27
|
只看该作者
神经网络语言模型详解(转)(3)
网络语言
,
结构图
,
模型
,
拼接
,
信息
8 Eric Huang’s Model 在Bengio的神经网络结构的基础上,Eric Huang提出了引入文档的全局信息引神经网络语言模型,结构类似于Bengio的网络结构。
8.1 模型结构 相比Bengio的模型,Eric Huang引入了词的全局信息,在原本的网络结构中加入了子网络,形成如下图所示结构。
图5 Eric Huang的网络结构图
其中,,代表局部的得分,代表全局的得分。的计算公式为,
为当前词的Context中个词向量的拼接,为激活函数(逐个元素使用),比如为对网络中的参数。
相应的,的计算公式,
其中,为文章中包含的词向量的加权平均,权值公式可以有多种形式,Eric Huang采用IDF加权的方式。
8.2 参数求解 Eric Huang采用[C&W, 2007]中的求解方法,从词表中随机采样一个替换当前词,构造如下损失函数(类似于Ranking问题)
求解过程采用了min-batch L-BFGS。
9 word2vec word2vec是word embedding中最为人知的模型,其原因(能想到的)有,(1)模型简单,训练速度快;(2)代码和数据开源,容易复现;(3)Google出品(作者在Google实习期间工作,但代码很难读)。
word2vec由Tim Mikolov的三篇论文引出(虽然有一篇是讲Recurrent NN),项目开源(
https://code.google.com/p/word2vec/
),训练速度快(单机跑缺省数据集,仅20+min)。 word2vec代码中包含了两个模型CBOW(Continue BOW)和Skip-Gram。
9.1 CBOW CBOW模型见下图,
图6 CBOW模型结构
类似于[Bengio, 2003]中的模型,CBOW的优化目标是:给定词序列,最大化下式,
其中,采用log-linear(Softmax)模型用于正确分类当前词。在求解上式梯度时,每步的计算量与词表大小成正比,十分耗时,需要借助其他方法近似求解。
9.2 Skip-Gram Skip-Gram结构图见下图
图7 Skip-Gram模型结构
Skip-Gram中优化的目标:给定词序列,最大化下式,
其中,c是上下文的大小,采用softmax方程,
和为对应的输入和输出词向量,上式中梯度()的计算复杂度正比于词表的大小,处理方法同CBOW。
9.3 参数求解 (1)Hierarchical Softmax
同Section 4中Hierarchical NNLM[Bengio, 2006],基于tf-idf构建Huffman树,简单快速。
(2)Noise Constractive Estimation
在section 4中提到了如何快速近似求解partition function的问题,Gutmann在AISTAT(理论的会议,如无基础误入,坑!)和ICANN上介绍一种新的近似求解方法-NCE,最终在 JMLR上发表一篇长文来详细阐述其思想。此方法思想后续,本博客会撰文专门解释。
收藏
分享
评分
继承事业,薪火相传
回复
引用
订阅
TOP
返回列表
电源与功率管理
模拟电路
测试测量
电商论坛
Pine A64
资料下载
方案分享
FAQ
行业应用
消费电子
便携式设备
医疗电子
汽车电子
工业控制
热门技术
智能可穿戴
3D打印
智能家居
综合设计
示波器技术
存储器
电子制造
计算机和外设
软件开发
分立器件
传感器技术
无源元件
资料共享
PCB综合技术
综合技术交流
EDA
MCU 单片机技术
ST MCU
Freescale MCU
NXP MCU
新唐 MCU
MIPS
X86
ARM
PowerPC
DSP技术
嵌入式技术
FPGA/CPLD可编程逻辑
模拟电路
数字电路
富士通半导体FRAM 铁电存储器“免费样片”使用心得
电源与功率管理
LED技术
测试测量
通信技术
3G
无线技术
微波在线
综合交流区
职场驿站
活动专区
在线座谈交流区
紧缺人才培训课程交流区
意见和建议