当前位置: 首页 > news >正文

赛扶做网站/什么推广平台好

赛扶做网站,什么推广平台好,建设网站需要什么软件,b2b网站品牌介绍这是由谷歌的三位大神用seq2seq模型实现的基于神经网络的机器翻译(英法互译),基本的方法还是encoder-decoder,作为seq2seq的经典必读论文,本文与其他工作相比主要有创新点有: 利用了多层的LSTM(本文中是4层…

这是由谷歌的三位大神用seq2seq模型实现的基于神经网络的机器翻译(英法互译),基本的方法还是encoder-decoder,作为seq2seq的经典必读论文,本文与其他工作相比主要有创新点有:

  1. 利用了多层的LSTM(本文中是4层)。实验表明使用LSTM对长句子的翻译来说效果很好,主要是因为LSTM本身具有长期依赖的优势。
  2. 与attention不一样,它又回归到原始模型,在编码端将输入句子编码成一个固定的维度的向量。作者说这样可以迫使模型学习捕捉句子的意思,尽管句子的表达方式不同。
  3. 最重要的一点是,实验发现将句子逆序输入可以明显改善LSTM模型的表现。 一个猜测的解释(因为作者也不知道具体的原因)是这样做可以减小“minimal time lag”(最短时间间隔),举例,输入是“ABC”,对应输出是“XYZ”,“A”与对应的“X”的间隔是3,“B”和“C”与其对应的间隔也是3,所以最短时间间隔是3。如果将输入逆序,以“CAB”作为输入,“A”与“X”的间隔是1,最短时间间隔就减小为1。于是作者猜测将输入逆序虽然没有减少源句子(输入)与目标句子(输出)的平均间隔,但是源句子与目标句子是前几个词的距离减少了,于是句子的“最短时间间隔”减少了。通过后向传播可以更快地在源句子和目标句子之间“建立通信”,整体的性能也有了显着的改善。

实验

实验设置

  • 4层LSTM,每层1000个单元
  • 词向量维度是1000维
  • 输入词典大小是160,000,输出词典大小是80,000
  • LSTM的初始参数服从[-0.08,0.08]的均匀分布
  • 用随机梯度下降算法,没有momentum,开始学习率为0.7,5 epochs之后,每个epoch之后学习率降低一半。
  • batch是128
  • 每次training batch 之后,计算s=||g||2, g 是梯度除以128,如果s > 5, 令 g = 5g/s。
  • 不同的句子长度不同,为了降低计算量,一个batch中的句子的长度差不多相同。
  • 用8个GPU同时进行处理

实验结果分析

实验结果除了与其他系统进行比较之外,主要围绕着上面的三个创新点进行分析。

处理长句子的性能

LSTM模型在长句子上表现很好,通过下面两幅图可以看出来,左图x轴代笔句子长度,从图中可以看出对于句子长度小于35的句子,LSTM模型的分数都比baseline要高。右图x轴代笔词频度排名,排名越高说明越不常用,从图中可以看出对于词频排名在2500之前的词,LSTM模型要比baseline好。

这里写图片描述

将输入编码成一个固定维度的向量

该图示显示了在处理图中的短语之后获得的LSTM隐藏状态的二维PCA投影。短语通过意义聚类,在这些示例中,其主要是词序的函数,用词袋模型的话难以捕捉。注意到这两个集群具有相似的内部结构。
这里写图片描述

逆序输入

LSTM在测试集上的perplexity 从5.8降到4.7, BLEU从 25.9升到 30.6。

http://www.lbrq.cn/news/1073593.html

相关文章:

  • 合肥做网站哪家公司好/html网页制作模板
  • 网站中的关键词seo设置/最新热点新闻
  • 青浦b2c网站制作价格/人力资源培训网
  • 石狮市建设局网站/seo推广怎么收费
  • 网站建设的目标是/美国疫情最新数据消息
  • 石家庄专门做网站的公司/搜索引擎营销怎么做
  • 百度收录网站左侧图片/海南百度推广中心
  • 企业官方网站建设方案/百度sem竞价推广电子书
  • 做调查问卷赚钱网站有哪些/网络营销买什么好
  • 专门型网站/搜索引擎优化的简写是
  • 阿里云如何上传网站/武汉seo优化分析
  • 这是我做的网站吗/优化服务内容
  • 自助外贸英文网站建设/百度关键词优化手段
  • 深圳红杉树装修公司电话/手机流畅优化软件
  • 宣传 网站建设方案/南宁百度首页优化
  • 白名单 网站/网站友情链接怎么弄
  • 网站建设工具品牌有/河南网站关键词优化代理
  • 昭通网站开发公司/免费网站alexa排名查询
  • 网站管理设置/东莞关键词排名seo
  • 怎么给网站制作二维码/宁波好的seo外包公司
  • 网站备案繁琐工作/标题优化怎么做
  • 企业名录搜索软件有哪些/aso优化报价
  • 鼓楼做网站公司哪家好/seo怎么做优化
  • 用html做简单网页/seo服务运用什么技术
  • 西宁解封最新通知/杭州关键词优化外包
  • 网站文件夹 安全设置/正规引流推广公司
  • 党建设计素材免费下载的网站/百度风云榜游戏
  • 网站备案 自己的服务器/怎么样做一个自己的网站
  • 做积分网站/推广普通话宣传周
  • 网站怎么做推广知乎/seo关键词有话要多少钱
  • GitLab 代码管理平台部署及使用
  • [创业之路-535]:软件需要原型验证、产品需要原型验证、商业模式也需要原型验证
  • 【学习笔记】MySQL技术内幕InnoDB存储引擎——第8章 备份与恢复
  • linux eval命令的使用方法介绍
  • Qt Quick 3D 基础与应用
  • Redis深度剖析:从基础到实战(上)