当前位置: 首页 > news >正文

营销型门户网站建设方案/不受限制的搜索浏览器

营销型门户网站建设方案,不受限制的搜索浏览器,虎门网站建设,成都网站优化方案《老饼讲解机器学习》http://ml.bbbdata.com/teach#92 目录 一.决策树种类简介 (一) 第一支线:CART(classification and regression tree)分类与回归树 (二) 第二支线:ID3算法和C4.5算法 二.常见概念 (一) 决策树中的熵,信息增益&#…

《老饼讲解机器学习》http://ml.bbbdata.com/teach#92

目录

一.决策树种类简介

(一) 第一支线:CART(classification and regression tree)分类与回归树

(二) 第二支线:ID3算法和C4.5算法

二.常见概念

(一) 决策树中的熵,信息增益,信息增益比,GINI系数是什么?

(二)  剪枝是什么?


人们常说的决策树有两支线,共四种 :
(1) CART:分类与回归树
(2) ID3系列: ID3算法,C4.5算法(ID3加强版)

ID3发展更早,CART现在应用更广泛。实际中,基本都用CART.现在人们说决策树,基本都是指CART (pythn,matlab中也只有CART算法包)

一.决策树种类简介

(一) 第一支线:CART(classification and regression tree)分类与回归树

它是一棵二叉树:

分类树和回归树的输入输出都是数值形(枚举型我们会先作问题转化)
对于分类树,它输出(叶子节点)的是类别。
对于回归树,它输出(叶子节点)的是数值。

(二) 第二支线:ID3算法和C4.5算法

1.  ID3算法决策树:

它不是二叉树,

每一层会选一个变量来作全分裂(可以知道,树的层数上限就是变量个数。)。
它的输入和输出都是枚举值。

2 .  C4.5算法决策树:

C4.5算法是ID3作者昆兰重新修强ID3后发布的一个算法(即C4.5算法决策树是ID3的改进版。)

ID3算法有如下缺点:
(1)变量偏好多枚举值:
(2) ID3容易过拟合。
(3) ID3不支持连续变量。
(4) 不支持数据有缺失值。

修改后,因为要兼容连续变量,就让连续变量每次作二分裂(且可以多次分裂),所以树的层数上限有可能超出变量个数。
其它方面与ID3大同小异,仅是修正了ID3上述的四个缺陷。

二.常见概念

(一) 决策树中的熵,信息增益,信息增益比,GINI系数是什么?

熵,熵增益,GINI系数都是在构建树过程中,用来引导树选择哪个变量分裂,连续变量在何处分裂的函数。

(1) 信息增益     :供ID3算法使用(ID3算法用各个变量的信息增益决定决策树用哪个变量分裂)。
(2) 信息增益比 :供C4.5算法使用(C4.5算法用各个变量的信息增益决定决策树用哪个变量分裂)。
(3) GINI系数    :供CART算法使用(C4.5算法用各个变量不同切处的GINI系数决定决策树用哪个变量,切哪里)
(4) 熵              :信息增益,信息增益比的理论意义背景。

(二)  剪枝是什么?

1.概念:
树分裂时是一裂到底,但往往一些节点裂与不裂没区别,另一方面,裂得太细致,往往出现过拟合。
因此,剪掉一些不必要的未端枝节,使模型更简单(更简单的模型也意味着更不易过拟合)。

2.剪枝方式:
剪枝一般是自下往上剪,主流是这样,也有一些骚操作,但不是主流。

3.剪枝的凭据:
(1) 如果用父节点分类更准确,剪掉枝叶.
(2) 设立一个损失函数(也是在信息增益,信息增益比,GINI系数的基础上设立的一个引导函数),如果剪掉该枝,损失函数下降,则剪掉。

4.预剪枝:
上面所说的剪枝都是指后剪枝(先把树构建到极致,再剪枝),
预剪枝则指建枝过程中,达到一定条件就不剪了,例如,深度到一定程度,或者节点样本过少等等。
预剪枝实际就是给树设立一个生长条件。

实现例子: 《一个简单的决策树例子》 

《老饼讲解机器学习》http://ml.bbbdata.com/teach#92

http://www.lbrq.cn/news/1559809.html

相关文章:

  • 金融网站建设运营方案/台湾新闻最新消息今天
  • 如何给网站做提升/网络推广是网络营销的基础
  • 张家港做政府网站的公司/seo怎么收费
  • 建筑网站、/如何进行网络营销
  • 模板网站如何做seo/郑州seo关键词排名优化
  • ppt怎么做网站/运营推广的方式和渠道有哪些
  • 做学科竞赛的网站/百度网站排名优化
  • 做网站的项目职责怎么写/cps推广
  • 织梦做的网站/营销策略国内外文献综述
  • php手机网站如何制作/线上推广有哪些渠道
  • 自助建站网站建设/关键词优化seo费用
  • 四川省建设厅网站/网络媒体广告代理
  • 公司做网站买域名之后做什么/网络营销软文范例
  • 做封面网站/西安网站关键词优化费用
  • 响应式网站 哪些/刷网站排名软件
  • WordPress分类置顶插件/关键词优化排名软件案例
  • 格尔木城乡建设规划局网站/网络营销的应用研究论文
  • 专业建站推荐/谷歌推广网站
  • 用java做的网站怎么发布/微信社群营销推广方案
  • 广州番禺区房价/谷歌seo技巧
  • 网站的验证码是怎么做的/企业网站推广渠道
  • 外贸网站建设设计/微信搜一搜怎么做推广
  • 秦皇岛属于哪个省哪个市的/网站seo优化培训
  • 室外建筑网站/优化营商环境的金句
  • 外管局网站做延期收汇报告/合肥做网站的公司有哪些
  • 网页模板免费下载源代码/佛山旺道seo
  • 响应网站开发/使用软件提高百度推广排名
  • 移动开发网站开发区别/不死鸟分享友情链接
  • 化工企业建网站/百度手机助手应用商店
  • 做外贸生意在哪个网站/成都seo网站qq
  • 如何解决pip安装报错ModuleNotFoundError: No module named ‘opencv-python’问题
  • 从频繁告警到平稳发布:服务冷启动 CPU 风暴优化实践00
  • Qt QDateTime时间部分显示为全0,QTime赋值后显示无效问题【已解决】
  • echarts 画一个饼图,并且外围有一个旋转动画
  • 【LeetCode 热题 100】55. 跳跃游戏
  • 【秋招笔试】2025.08.15饿了么秋招机考-第一题