当前位置: 首页 > news >正文

杭州网站建设多少钱抖音关键词排名优化

杭州网站建设多少钱,抖音关键词排名优化,无锡网络公司网站建设app微信公众号平,企业官网营销推广http://blog.csdn.net/zjsghww/article/details/51638126 首先,C4.5是决策树算法的一种。决策树算法作为一种分类算法,目标就是将具有p维特征的n个样本分到c个类别中去。相当于做一个投影,cf(n),将样本经过一种变换赋予一种类别标…

 

 

 

 

http://blog.csdn.net/zjsghww/article/details/51638126

首先,C4.5是决策树算法的一种。决策树算法作为一种分类算法,目标就是将具有p维特征的n个样本分到c个类别中去。相当于做一个投影,c=f(n),将样本经过一种变换赋予一种类别标签。决策树为了达到这一目的,可以把分类的过程表示成一棵树,每次通过选择一个特征pi来进行分叉。

那么怎样选择分叉的特征呢?每一次分叉选择哪个特征对样本进行划分可以最快最准确的对样本分类呢?不同的决策树算法有着不同的特征选择方案。ID3用信息增益,C4.5用信息增益率,CART用gini系数。

下面主要针对C4.5算法,我们用一个例子来计算一下。

上述数据集有四个属性,属性集合A={ 天气,温度,湿度,风速}, 类别标签有两个,类别集合L={进行,取消}。

 

1. 计算类别信息熵

类别信息熵表示的是所有样本中各种类别出现的不确定性之和。根据熵的概念,熵越大,不确定性就越大,把事情搞清楚所需要的信息量就越多。

 

2. 计算每个属性的信息熵
每个属性的信息熵相当于一种条件熵。他表示的是在某种属性的条件下,各种类别出现的不确定性之和。属性的信息熵越大,表示这个属性中拥有的样本类别越不“纯”。

3. 计算信息增益

信息增益的 = 熵 - 条件熵,在这里就是 类别信息熵 - 属性信息熵,它表示的是信息不确定性减少的程度。如果一个属性的信息增益越大,就表示用这个属性进行样本划分可以更好的减少划分后样本的不确定性,当然,选择该属性就可以更快更好地完成我们的分类目标。

信息增益就是ID3算法的特征选择指标。

但是我们假设这样的情况,每个属性中每种类别都只有一个样本,那这样属性信息熵就等于零,根据信息增益就无法选择出有效分类特征。所以,C4.5选择使用信息增益率对ID3进行改进。

4.计算属性分裂信息度量

用分裂信息度量来考虑某种属性进行分裂时分支的数量信息和尺寸信息,我们把这些信息称为属性的内在信息(instrisic information)。信息增益率用信息增益 / 内在信息,会导致属性的重要性随着内在信息的增大而减小(也就是说,如果这个属性本身不确定性就很大,那我就越不倾向于选取它),这样算是对单纯用信息增益有所补偿。

5. 计算信息增益率

(下面写错了。。应该是IGR = Gain / H )

天气的信息增益率最高,选择天气为分裂属性。发现分裂了之后,天气是“阴”的条件下,类别是”纯“的,所以把它定义为叶子节点,选择不“纯”的结点继续分裂。

 

 

 

在子结点当中重复过程1~5。

以天气=“雨”的子结点为例:

1. 计算类别信息熵

风速属性的信息增益率最高,所以选择风速作为分裂结点,分裂之后,发现子结点都是纯的,因此子节点均为叶子节点,分裂结束。

至此,这个数据集上C4.5的计算过程就算完成了,一棵树也构建出来了。

 

现在我们来总结一下C4.5的算法流程:

 

转载于:https://www.cnblogs.com/heavenhome/p/8492962.html

http://www.lbrq.cn/news/2473219.html

相关文章:

  • 广州网站建设广州网络推广公司百度小说排行榜总榜
  • 渭南华阴建设银行的网站是多少上海比较大的优化公司
  • 关于做代购网站的纳税知识cba最新排名
  • 网页兼容性站点如何做seo整站优化
  • 南京有哪些做网站的公司上海seo推广
  • 网站建设logo中囯联通腾迅
  • 个人网站首页布局设计百度一下首页手机版
  • 石家庄专业做网站公司营销网络推广方式有哪些
  • 源码网站开发seo技术服务外包
  • 全网网站建设seo搜索引擎优化案例
  • 苏州知名网站建设设计公司企业网址怎么注册
  • 网站建设吗产品推广方案范例
  • 室内设计在哪里接网单推推蛙seo顾问
  • 网站建设与管理的考试上海推广外包
  • 苍南网站建设个人如何推广app
  • 建设田达摩托车官方网站免费的seo
  • 三级a一级a做爰视频免费网站搜索引擎是网站吗
  • 关键词排名优化网站建设公司哪家好线上营销方式6种
  • 假网站怎么做呢大学生网页设计主题
  • 低价网站建设多少钱如何利用网络广告进行推广
  • 百城建设提质工程网站今天晚上19点新闻联播直播回放
  • 网站推广怎么做优化atp最新排名
  • 鸡西建设银行网站站长工具一区
  • 政府网站开发的目的com天堂网
  • 哈尔滨教育学会网站建设网络服务平台
  • 遵义最新疫情通报西安网站关键词优化推荐
  • 怎么做盗版电影网站网络广告的特点
  • 网站开发公司网站官网百度一下你就知道官方网站
  • 招聘网站如何做薪酬报告东莞网络公司电话
  • 网站编辑信息怎么做百度应用商店下载安装
  • golang实现一个定时引擎,功能包括按照corntab的时间任务实时增加、修改、删除定时任务
  • 前端基础知识Vue系列 - 29(怎么处理vue项目中的错误)
  • vue 脚手架配置代理
  • 相机ROI 参数
  • C++STL系列之set和map系列
  • Python-初学openCV——图像预处理(二)