当前位置: 首页 > news >正文

做网站的图片大小是多少/开发定制软件公司

做网站的图片大小是多少,开发定制软件公司,想设计一个自己的logo,赣州星亚网络传媒有限公司动机传统的 ACE 事件抽取任务依赖于人工标注的数据,耗费大量的人力并且数据量有限,数据量不足给事件抽取带来了阻碍。传统的事件抽取不能解决 role overlap 角色重叠的问题。 PLMEE 模型通过对不同的角色分别进行 augument prediction 论元预测解决了角色…

动机

传统的 ACE 事件抽取任务依赖于人工标注的数据,耗费大量的人力并且数据量有限,数据量不足给事件抽取带来了阻碍。传统的事件抽取不能解决 role overlap 角色重叠的问题。 PLMEE 模型通过对不同的角色分别进行 augument prediction 论元预测解决了角色重叠问题。另外,论文提出了一种利用 BERT 生成训练数据的方法,并证明有效。在 ACE2005 数据集上,超过了 state-of-the-art 的结果,将触发词分类和论元分类的 F1 值分别提高到了 81.1 和 58.9 。

亮点

PLMEE 的亮点主要包括:

( 1 )解决了一个论元扮演多个角色即角色重叠问题,通过对不同的角色构建多个分类器的方式。例如“ The explosion killed thebomber and three shopers ”在这句话中, bomber 既是 Attacker 也是 Victim 。

( 2 )提出了利用 BERT 生成训练数据的方法,并证明方法有效。

概念及模型

  • 事件抽取

事件抽取分为触发词抽取、论元抽取、论元范围检测、损失函数重写

1. 触发词抽取

e55b9bb8a38fceca4358c77220de23d9.png

将触发词抽取建模为多分类问题,在 BERT 后添加 MLP 做分类,用 cross-entropy 作为损失函数。

2. 论元抽取

21cb10976a1f687941d06524aa208cfd.png

对于每一个 token 有多组二分类器,每个分类器决定改 token 是否为对应 role 的开头或结尾。通过这种方式,一个 token/argument 可以是多个 role ,可解决 role overlap 问题。

3. 论元范围检测

17072a366df83c29787effbfc065fcc5.png

利用一个有限自动机,进行短语的检测,可以表示成下图:

0bc1717029e79b9360c3881bedcf96fd.png

尽可能的选择概率更高的 token 作为 argument 的开头和结尾。并且可以为一个 role 检测出多个 argument 。

4. 损失函数重写

按照 TF-IDF 的方式,计算不同 role 的重要程度,作为 weight 。

196c88da24a5ee598ec966102c401c54.png

r 表示 role ,即角色。 v 代表某一事件类型, V 代表所有事件类型集合。

对 RF-IEF 规范化,得到 I(r, v) 代表对于事件 v 角色 r 的重要程度。

3848f49fefa217c383d20ce7f4aabcef.png

Ls 表示 start ,即论元开头的 loss ; Le 表示 end 的损失。两者求和为最终的损失函数。

  • 事件生成
d773d973796e8289b29c6cd591d16a76.png

首先在数据集中进行论元收集,将角色相同并且上下文相似的 token/phrase 构成集合,如上图框中示例。

对于句子,对其中的 argument 论元,在构建的相似集合中随机选择进行替换。

对于触发词和论元以外的词,即附加词,利用 bert 进行 [mask] 遮掩,利用 BERT 预测的结果作为替换。

2c11e70854287fdc6452bf7ee03ccc08.png

最后得到打分函数,用于筛选生成数据。

理论分析

实验

1. 实验结果

作者采用了相较于以往方法更严苛的评判标准。

但是实验的结果依然是极好的,对于 Trigger Identification 触发词检测和 Trigger Classification 触发词分类甚至提升了 10%

619dc11ac03e4cfcd16baf8661c01cf5.png

1. 触发词只有类型和范围均检测正确,才认为结果正确

2. 论元只有范围正确,并且所有的 role overlap 重叠角色均被检测出来,才认为结果正确。

总结

本文利用预训练语言模型,对事件抽取证明有极大的提高,说明 BERT 得到的 embedding 蕴含的语义信息是非常有意义的。另外,采用 BERT 生成数据也是一种不错的思路。对于 role overlap 等问题,论文提出了一种基于多分类器的改进方式。

http://www.lbrq.cn/news/1402885.html

相关文章:

  • 摄影网站模板源码/公司推广方案
  • 北京住房和城乡建设部网站官网/软文大全
  • 珠宝商城网站设计/网站seo优化发布高质量外链
  • 做浏览单的网站有哪些/免费com域名注册永久
  • 政府网站建设怎么谈需求/营销型网站有哪些平台
  • 网站建设有哪些企业/推手平台哪个靠谱
  • 中国装修第一网/企业网站优化服务公司
  • 江苏省建筑工程网/兰州seo快速优化报价
  • 响应式门户网站/关联词有哪些五年级
  • 做商城网站需要办理什么/国外seo比较好的博客网站
  • 小兵cms个人网站模板/seo发包软件
  • 37岁转行做外贸真的很难吗/seo优化专员工作内容
  • 网站/陕西网站建设制作
  • 个人网页制作免费下载/河南网站建设优化技术
  • 正能量网站入口免费安全/营销网站优化推广
  • 做快递网站制作/如何推广网址链接
  • 衍艺武汉网站设计公司/百度推广员工工资怎么样
  • 做宣传册参考的网站/陕西省人民政府
  • 东海建设局网站/丈哥seo博客
  • 十堰哪里有做网站的/广州:推动优化防控措施落地
  • 商业网站网页/品牌广告视频
  • 哈尔滨市建设厅网站/百度百度一下你就知道主页
  • 蒲县网站建设/360公司官网首页
  • 网站开发工程师职位要求/百度seo推广计划类型包含
  • 网站建设工作 方案/关键词排名网络推广
  • 盘锦公司做网站/廊坊百度快照优化
  • 网站开发周期价格/网站搜索排名靠前
  • 域名不变 新网站/网络推广招聘
  • 北京互联网网站建设/站优云网络公司
  • wordpress flashfxp/福州短视频seo获客
  • 【机器学习】什么是损失景观(Loss Landscape)?
  • 学习嵌入式的第二十一天——数据结构——链表
  • 瑞萨e2studio:HardwareDebug配置项详解
  • Android Cutout(屏幕挖孔)详解
  • 决策树学习报告
  • 规避(EDR)安全检测--避免二进制文件落地