当前位置: 首页 > news >正文

杭州大型网站建设/公司网络营销策划书

杭州大型网站建设,公司网络营销策划书,婚纱网站建设 最开始,稷山做网站我们知道训练模型时经常会有一些误差,我们要想弥补这些误差,首先要搞清楚这些误差是怎么产生的。 误差的分解 假设我们要预测的模型为 yf(x),但是通常数据都会有一些噪音,我们的数据集为yf(x)noise,通常我们会假设数据…

我们知道训练模型时经常会有一些误差,我们要想弥补这些误差,首先要搞清楚这些误差是怎么产生的。

 

误差的分解

假设我们要预测的模型为 y=f(x),但是通常数据都会有一些噪音,我们的数据集为y=f(x)+noise,通常我们会假设数据服从正态分布,也就是噪音会均分分布在曲线两侧,所以噪音和为0。

假设有测试数据 x,yD为其在数据集中的label(有噪声的label),y为其真实的label(无噪声的label),f(x;D)为训练集上得到的模型对x的预测值,

那么模型的误差为  E[(f(x;D)-yD)2],即预测值与数据集中的label的差的平方,即均方差,

此外,我们知道模型在不同训练集上学到的模型很可能不同,即使数据属于同一个分布,也就是说不同的数据集得到的模型对x预测会得到不同的f(x;D),

那么在不同训练集上得到的模型的预测期望为  f(x)=E(f(x;D)),E代表期望

  在不同训练集上得到的模型的预测方差为  var=E[(f(x;D)-f(x))2],也就是预测值的离散程度,

最终在不同训练集上得到的模型的预测偏差为  bias=f(x)-y,也就是预测值与真实值之间的差叫偏差,

  

首先对误差进行分解

记 E[(yD-y)] 为噪声,通常我们默认会忽略噪声,认为数据质量可以,或者说数据服从正态分布,噪声均值为0,所以 E[(yD-y)]=0

我们发现误差是由方差、偏差和噪音三部分组成的。

好了,重新来认识下这三部分

方差是不同数据集上学到的模型对同一样本进行预测的值的方差,其反映了数据对模型的扰动影响;

偏差是不同数据集上学到的模型对同一样本进行预测的均值和真实值之间的差,其反映了模型的“准度”,即模型的拟合能力,

噪音反映了数据的质量,它决定了模型所能达到的极限,也就是模型期望泛化误差的下界

所以模型的好坏是由 算法本身的能力、数据的充分性和数据的质量来决定的。

通常我们认为数据不存在噪声,所以要想提高模型的准度,就需要较小的方差,较小的偏差。

 

偏差与方差的窘境

偏差是模型的拟合能力,我们知道,模型在不同的训练阶段有不同的拟合能力,如欠拟合,过拟合等,

当模型欠拟合时,模型从数据身上只学到很少的东西甚至什么也没学到,那么它受数据的影响就很小,方差就很小,而欠拟合时偏差很大,

当模型过拟合时,模型从数据身上学到了很多东西,包括一些特殊样本,那么它受数据的影响就很大,方差就很大,而过拟合时偏差很小,

所以偏差和方差是冲突的。

用一张图来表示两者之间的关系

 

其中红色代表真实值,蓝色代表预测值

左上角:低偏差低方差,蓝色离红色很近,低偏差,蓝色很集中,低方差

右上角:低偏差高方差,蓝色离红色很近,低偏差,蓝色很分散,高方差

左下角:高偏差低方差,同理

右下角:高偏差高方差

 

为了降低模型的误差,我们需要对两者进行权衡

 

可以看到偏差和方差随着训练程度的加深,会在某个地方相交,这个地方就是两者权衡后的最佳方案,此时泛化误差最小。

 

总结

1. 模型越简单,稳定性越好,在测试集上的表现稳定,但不能代表表现好,

2. 模型越复杂,稳定性越差,在训练集上表现很好,但在测试集上基本表现糟糕

3. 这种现象是因为我们用有限的数据来估计无限的总体,两者之间总会有一些差异。

当我们更相信这些训练样本,而忽视对模型的先验知识,就会提高模型的训练样本上的准确度,减少偏差;这样得到的模型泛化能力差,过拟合,降低在真实数据上的表现

如果我们更相信先验知识,在学习模型的过程中对模型增加多种限制,就可以降低模型的方差,提高模型的稳定性;但是会增加偏差

 

参数调节

偏差和方差可以用来调参,控制模型的训练程度。

高偏差低方差-欠拟合
增加模型复杂度
增加特征
降低正则化
增加学习次数

低偏差高方差-过拟合
降低模型复杂度
增加训练实例
增加正则化
减少特征

 

 

参考资料:

https://blog.csdn.net/ld326/article/details/79532847

转载于:https://www.cnblogs.com/yanshw/p/10684929.html

http://www.lbrq.cn/news/1243459.html

相关文章:

  • 网站解析怎么做/河南网站建站推广
  • 免费炫酷企业网站源码/网站制作哪家公司好
  • 外贸网站怎么推广/138ip查询网域名解析
  • 可以做免费广告的网站/注册网站流程和费用
  • 报考二级建造师证需要什么条件/黑帽seo技术论坛
  • 国务院关于新时期政府网站建设/seo专员工作容易学吗
  • 苏州网络推广苏州网站建设/网络推广及销售
  • 昆明电子商务网站建设/产品软文
  • 湖北网站建设软件有哪些/国内免费顶级域名注册
  • 长沙好的网站建设/客服网站搭建
  • 免费虚拟主机的好处/搜索关键词优化排名
  • 微信公众号微网站建设/优化工作流程
  • 营销推广方案怎么写/seo综合查询是什么
  • 播放视频网站怎么做/东莞疫情最新消息今天新增病例
  • 网站怎么做发送邮件的超链接/快抖霸屏乐云seo
  • 做网站贵吗/国内seo工具
  • 企业为什么要建设网站/免费拓客软件排行榜
  • cms做网站后台/百度资源站长平台
  • 我想在阿里巴巴上给别人做网站/天津seo排名收费
  • 个人做网站 用什么语言/小网站搜什么关键词
  • 营销型网站建设电子书/百度刷自己网站的关键词
  • 做西点网站/谷歌优化方法
  • 网站制作经费预算表/app拉新推广平台渠道
  • 网站转微信小程序开发/网站权重查询工具
  • 青岛网上注册公司官网/讯展网站优化推广
  • jsp网站建设项目/磁力最好用的搜索引擎
  • 腾云公司做网站/培训心得体会总结
  • 福田做商城网站建设哪家技术好/2021年网络营销案例
  • 厦门网站设计开发网页公司/网站代运营多少钱一个月
  • 福州seo推广公司/青岛seo精灵
  • .env 文件
  • ffmpeg命令和ffplay命令详解
  • 除数博弈(动态规划)
  • 原生JS使用svg-pan-zoom库平移和缩放svg
  • U-Net vs. 传统CNN:为什么医学图像分割需要跳过连接?
  • MySQL 性能与优化