当前位置: 首页 > news >正文

网站建设外包价格/百度手机快速排名点击软件

网站建设外包价格,百度手机快速排名点击软件,h5可以做网站吗,建设厅科技中心网站首页【DL-CV】反向传播&#xff0c;&#xff08;随机&#xff09;梯度下降<前篇---后篇>【DL-CV】神经网络的补充 在介绍线性分类器的时候&#xff0c;提到了激活函数&#xff0c;还提到线性分类器的输出要经过激活函数才能作为下一层网络的输入。为什么呢&#xff1f;本文将…

【DL-CV】反向传播,(随机)梯度下降<前篇---后篇>【DL-CV】神经网络的补充

在介绍线性分类器的时候,提到了激活函数,还提到线性分类器的输出要经过激活函数才能作为下一层网络的输入。为什么呢?本文将对这一问题进行解疑并介绍多种多种激活函数。

引入激活函数

假如神经网络只由多个线性分类组器合而成,那无论怎样组合,他们对数据的操作永远都是线性变换而已,复杂度有限,只能实现线性分类而不能实现非线性分类,但现实中的数据往往不是线性可分的。为了解决这个问题,就要给神经网络引入非线性因素,提高神经网络模型的表达能力(学习更复杂的映射)。激活函数就是用来引入这个非线性因素的,下面介绍几种常见的激活函数及其优缺点(正负号表示)。

Sigmoid

其数学公式及其图像如下
clipboard.png

它把输入压缩到(0,1)区间内,有两端饱和的特性,对于很大的正数它输出趋近与1,对于绝对值很小的负数它输出趋近于0。
这个函数曾经非常流行,但是由于其缺点(主要是两边饱和)饱受诟病,现在没什么人用了

  • (-)梯度消失:当输入过大或过小时,由图可知局部梯度几乎为0,经过链式法则后梯度也几乎为0,你会失去梯度流的反馈,使权重几乎不更新
  • (-)非零中心:sigmoid的输出均大于零(不是零均值),即给下一层神经元的x都大于零,$\sigma(W*x+b)$,假如这里的x全是正数,那么经过反向传播${∂L\over ∂W}会全正或全负$,于是所有权重值都会往一个方向更新,这样训练效率非常低。

tanh

其数学公式及其图像如下(双曲正切)
clipboard.png

形状和sigmoid很像,也是两端饱和,不同的是它把输入压缩到(-1,1)区间内。

  • (+)以零为中心
  • (-)梯度消失

比sigmoid好了一点,没有非零中心的问题

ReLU

其数学公式及其图像如下
clipboard.png

就是个取最大值得函数,当输入为负数,输出为0;当输入为正数,输出还是这个数

  • (+)在正区间不会饱和(一个优势):在正区间梯度可传递
  • (+)计算成本低
  • (+)使用ReLU之后,权重收敛速度比sigmoid/tanh快(约6倍)
  • (-)非零中心
  • (-)在负区间梯度消失:某些权重永远不会更新,我们称这种情况叫“dead ReLU”。导致这种情况频发的原因主要有权重初始化不好或学习率太高

虽然有“dead ReLU”的情况发生,但这并不阻碍它成为优秀的激活函数,实际应用中其表现不错,是非常常用的激活函数

Leaky ReLU(LReLU)

其数学公式及其图像如下
clipboard.png

ReLU的变种,负区间不再是0,而是给它一个很小的斜率(上图是0.01,也可以是其他常数)

  • (+)ReLU的优点
  • (+)不会出现梯度消失的情况

关于其效果没有清晰的定论,有的实验表现好,有些则不好


其实还可以把那个斜率当作可以反向传播和学习的参数α,然后就变成了Parametric ReLU(PReLU)激活函数
$$f(x)=max(\alpha x,x)$$

ELU

其数学公式及其图像如下
clipboard.png

全名指数线性单元Exponential Linear Units,α是一个可调整的参数,它控制着ELU负值部分在何时饱和

  • (+)ReLU的优点
  • (+)输出均值接近零
  • (+)负饱和机制,使模型对噪音有更强的鲁棒性

关于其详细介绍可看此论文,或者看看论文导读

Maxout

这个函数有点奇,我觉得它直接改变了原有MLP网络的结构,以至于形成了maxout网络,其本身就集成了激活函数的功能。
$$f(x)=max_{j\in [1,k]}z_{j}$$
k是需人为设定的参数,k=1,网络就类相当于普通的MLP网络;k>1,就变身成maxout网络了。这个函数的原理如下图,笔者文字表达欠佳,需作图才能展示出来。如果想了解更多可上网搜“maxout激活函数”
图片描述

选择

在同一个模型中,激活函数不会混搭使用,选定一个就用一个。一般最好的经验法则是使用ReLU函数,但是要谨慎的调节学习率。像LReLU,PReLU,ELU,Maxout这些函数则实验性强一点(实用性弱一点),但也可以试下。tanh和sigmoid就em....,算了吧。


除了这里介绍的6个外,还有一些其他的激活函数(如有着丧心病狂证明的SeLU),感兴趣的可以去查一下

http://www.lbrq.cn/news/1591309.html

相关文章:

  • 广州做网站 timhi/网络营销平台的主要功能
  • 上传到网站/苏州企业网站关键词优化
  • 建设路第3小学网站电话/贴吧推广400一个月
  • 怎么创建公司网站空间/运用搜索引擎营销的案例
  • 专业的微网站哪家好/快速网站排名提升工具
  • 广州易网外贸网站建设/最近三天的新闻大事国内
  • 虚拟网站建设/企业网站建设公司
  • 网站开发需要用到哪些软件有哪些/营业推广方式
  • 营销型网站设计特点/太原网站建设优化
  • 做购物网站哪家公司好/北京seo收费
  • mac做网站/商业计划书
  • 网络文化经营许可证申请/seo外链友情链接
  • 专业做商铺的网站/百度指数工具
  • 影视播放网站建设/免费网站大全下载
  • 我国政府门户网站的建设情况/关键词指数查询
  • 美橙网站注册/网上商城建设
  • vue开发自适应网站/长春关键词优化排名
  • 长沙网站免费建站/青岛百度整站优化服务
  • 哈尔滨网站设计公司/个人网页在线制作
  • 举例说明/站外seo推广
  • 网站建设 软文/seo引擎
  • wordpress汉字/seo推广培训课程
  • 福建网站开发企业/网站查找工具
  • 怎样推广公司的网站/疫情防控最新政策
  • 怎么用模板建网站/百度推广登录入口
  • 无锡公共工程建设中心网站/整站seo免费咨询
  • 装修客户资源在哪里找/搜索引擎优化的各种方法
  • 中山市政府网站建设/营销策略范文
  • 开源cms建站/seo优化报告
  • 网站版面做的很好的公司/网站外链平台
  • 超全的软件测试项目平台,10多个项目部署在线上环境,浏览器直接访问
  • SQL注入攻击基础
  • 2025年08月 GitHub 热门项目推荐
  • Shader开发(七)创建第一个Shader项目
  • Excel商业智能分析报表 【销售管理分析仪】
  • Java 实现poi方式读取word文件内容