当前位置: 首页 > news >正文

浦东网站建设公司/阿里指数app下载

浦东网站建设公司,阿里指数app下载,深圳网站建设收费,互联网+创新创业大赛项目计划书EM算法的基本理解 为什么要用EM算法(最大期望算法)? 在机器学习中,我们观察样本,建立模型,然后训练,进行预测。这是一个正常的流程,但是我们想一个问题,现实生活中一定有…

EM算法的基本理解

 

为什么要用EM算法(最大期望算法)?

在机器学习中,我们观察样本,建立模型,然后训练,进行预测。这是一个正常的流程,但是我们想一个问题,现实生活中一定有很多因素使我们无法观测的,也就是隐含数据?怎么办?

EM算法。。。

如果,只有模型而没有模型参数,那么
1、先猜想隐含数据(EM算法的E步)。
2、接着基于观察数据和猜测的隐含数据一起来极大化对数似然,求解我们的模型参数(EM算法的M步)。
由于我们之前的隐藏数据是猜测的,所以此时得到的模型参数一般还不是我们想要的结果。不过没关系,我们基于当前得到的模型参数,继续猜测隐含数据(EM算法的E步),然后继续极大化对数似然,求解我们的模型参数(EM算法的M步)。以此类推,不断的迭代下去,直到模型分布参数基本无变化,算法收敛,找到合适的模型参数。

要学习EM算法(最大期望算法),首先要了解的是极大似然估计。。。

1、极大似然估计

总的来说:极大似然估计就是用来估计模型参数的统计学方法。

举个例子:
        给定一组样本,并且他是高斯模型,怎么确定参数 \mu 和 \sigma


高斯分布的概率密度函数:

根据上面 MLE 得出的
代入每一个 x_i 的高斯概率结果得到

通过取 log 对数对上式进行化简:

这时候我们得到目标函数:

下面就是考虑如何调整 \mu 和 \sigma 来使得目标函数最大。

与我们高斯模型矩估计结果一致。

那么,现在引入我们的话题,随机变量无法直接(完全)观察到,怎么办?
例如:

高斯混合模型GMM

首先还是根据极大似然估计的理论建立目标函数:

\pi _k 相当于每一个高斯模型的权重,总的 P 到最后最大是 1


也就是 \pi 决定每个高斯模型的重要性。

EM算法

取对数似然函数

这时候引入 Jensen 不等式

由于对数函数是凹函数,所以有:f(E(x)) \geq E(f(x))\;\; 如果f(x) 是凹函数

为了寻找最大的下界,那么我们使上式中的等号成立:
 (1)
进一步,由于 Q_i(z^{(i)}) 是一种分布的概率,所以加和为 1
 (2)
由上式(1)和(2)得到:

所以,推到EM算法的过程:

如果 Q_i(z^{(i)}) = P( z^{(i)}|x^{(i)};\theta)),那么 就是我们隐藏数据对数似然的下界,那么就要极大化这个似然函数。

在固定参数 \theta 后,使下界拉升的 Q(z) 的计算公式,解决了 Q(z) 如何选择的问题。这一步就是E步,建立 C 的下界。接下来的 M 步,就是在给定 Q(z) 后,调整 \theta ,去极大化 V 的下界 J

所以:
        初始化分布参数 \theta; 重复以下步骤直到收敛:        

        1、E 步骤:根据参数初始值或上一次迭代的模型参数来计算出隐性变量的后验概率,其实就是隐性变量的期望。作为隐藏变量的现估计值:

    

        2、M 步骤:将似然函数最大化以获得新的参数值:

    

EM的算法流程:

        现在我们总结下EM算法的流程。
        输入:观察数据 x=(x^{(1)},x^{(2)},...x^{(m)}),联合分布 p(x,z ;\theta), 条件分布 p(z|x; \theta), 最大迭代次数 J

    1) 随机初始化模型参数 \theta 的初值 \theta^{0}

    2) for j  from 1 to J 开始 EM 算法迭代:

      a) E 步:计算联合分布的条件概率期望:
                                    Q_i(z^{(i)}) = P( z^{(i)}|x^{(i)},\theta^{j}))

                                   L(\theta, \theta^{j}) = \sum\limits_{i=1}^m\sum\limits_{z^{(i)}}Q_i(z^{(i)})log{P(x^{(i)},z^{(i)};\theta)}

      b) M 步:极大化 L(\theta, \theta^{j}),得到 \theta^{j+1}

                                  \theta^{j+1} = arg \max \limits_{\theta}L(\theta, \theta^{j})

      c) 如果 \theta^{j+1} 已收敛,则算法结束。否则继续回到步骤 a) 进行 E 步迭代。

    输出:模型参数 \theta 。

最后,推导高斯混合模型

问题:

步骤:
        1、E步:

        2、M步:
              把多项分布和高斯分布的参数代入:

        3、对均值求偏导:

        4、高斯分布均值:
             令上式等于 0,解的均值为

        5、高斯分布的方差
             求偏导,等于 0 

        6、多项分布的参数
              考察M-step的目标函数,对于 \phi ,删除常数项

             得到

        7、拉格朗日乘子法
              由于多项分布的概率和为 1,建立拉格朗日方程

注: 这样求解的 \phi_i 一定非负,所以,不用考虑 \phi_i>=0 这个条件

        8、求偏导等于 0

总结:

对于所有的数据点,可以看作组份 k 生成了这些点。组份 k 是一个标准的高斯分布,利用上面的结论:

http://www.lbrq.cn/news/772885.html

相关文章:

  • 公司定制网站建设公司/汕头seo计费管理
  • 博物馆建设网站/百度推广seo
  • 如何建设幼儿园网站方案/深圳广告策划公司
  • 清溪镇网站建设/电脑优化用什么软件好
  • 昌平区住房城乡建设委 房管局 官方网站/seo的范畴是什么
  • 临夏市建设局网站/西安seo顾问培训
  • wordpress引入css样式/淘宝关键词排名优化
  • 二次开发是指/seo专家是什么意思
  • wordpress 加上广告/seo是什么意思蜘蛛屯
  • 招标资源网官网/北京网站优化方式
  • 建设工程消防网站进入程序/软文营销ppt
  • 成都 企业网站建设公司/网络推广视频
  • 做网站免费服务器哪家好/百度不收录网站
  • 艺梵科技 网站建设/seo网页优化工具
  • 4399游戏网页版入口/seo搜索引擎优化课程总结
  • 做电商平台网站有哪些内容/网站建设与营销经验
  • 做好网站建设工作/厦门seo百度快照优化
  • 赛马网站开发出售/百度打开
  • 公司网站做的好的/黑帽seo优化软件
  • 网站开发的招标参数/网站免费网站免费优化优化
  • 个人网站的制作教程/中国2022年重大新闻
  • 网站建设现在主要做些什么/培训seo去哪家机构最好
  • 沈阳做网站优化的公司/网络营销题库及答案2020
  • 柳城企业网站建设公司/优化落实新十条措施
  • 网站前台的实现/关键词广告
  • 东莞专业技术人才服务网/seo广告优化多少钱
  • 自己做网站开微店可行吗/静态网页制作
  • 网站建设需要会什么软件/许昌seo公司
  • 大连网站建设找哪家好/网络营销公司名字大全
  • 东莞常平邮编是多少/广州seo优化费用
  • 服务器硬件电路设计之 I2C 问答(五):I2C 总线数据传输方向如何确定、信号线上的串联电阻有什么作用?
  • MCP协议更新:从HTTP+SSE到Streamable HTTP,大模型通信的进化之路
  • 2025 开源语音合成模型全景解析:从工业级性能到创新架构的技术图谱
  • linux_网络层-ip协议
  • 《嵌入式Linux应用编程(四):Linux文件IO系统调用深度解析》
  • 如何在 Ubuntu 24.04 LTS Linux 中安装 JSON Server