当前位置: 首页 > news >正文

南山制作网站公司/百度手机端排名如何优化

南山制作网站公司,百度手机端排名如何优化,摄影网站制作,一站式进货平台网站建设一、前言 首先来和大家唠唠分类树和回归树的区别(决策树包括分类树和回归树): 回归的目标变量是连续变量,而分类问题是离散变量。 二、代码 import pandasdata pandas.read_csv(D:\\university\\211term\\数据挖掘\\PDMBook\\…

一、前言

首先来和大家唠唠分类树和回归树的区别(决策树包括分类树和回归树):
回归的目标变量是连续变量,而分类问题是离散变量。

二、代码

import pandasdata = pandas.read_csv('D:\\university\\211term\\数据挖掘\\PDMBook\\第三章 分类模型\\3.6 决策树\\决策树.csv',encoding='utf8',engine='python'
)# 需要进行OneHot处理的列
oneHotColumns = ['性别', '父母鼓励']
from sklearn.preprocessing import OneHotEncoder
# 新建独热编码器
oneHotEncoder = OneHotEncoder()
# 训练独热编码器,得到转换规则
oneHotEncoder.fit(data[oneHotColumns]
)
# 转换数据
oneHotData = oneHotEncoder.transform(data[oneHotColumns]
)
print(oneHotData)
arr = oneHotData.toarray()
print(arr)from scipy.sparse import hstack
# 将独热编码所得的数据,和父母收入、IQ两列合并在一起
# 得到8000*6的矩阵
x = hstack([oneHotData,# 8000*4的矩阵data.父母收入.values.reshape(-1, 1),# 1*8000的list要转为列向量,(-1,1)的意思是先满足列为1,-1行表示满足列为1的情况下,自动生成行data.IQ.values.reshape(-1, 1)
])
print(x)
arr1 = x.toarray()
print(arr1)# 得到labels
y = data["升学计划"]from sklearn.tree import DecisionTreeClassifier
# 设置树的深度为3,最大叶子节点数为7
dtModel = DecisionTreeClassifier(criterion='entropy',max_depth=3,max_leaf_nodes=7
)# 十折交叉验证
from sklearn.model_selection import cross_val_score
cvs = cross_val_score(dtModel, x, y, cv=10)
print(cvs.mean())dtModel = DecisionTreeClassifier(criterion='entropy',max_depth=3,max_leaf_nodes=7
)
dtModel.fit(x, y)# 将决策树模型可视化
from sklearn.tree import export_graphviz
with open('data.dot', 'w') as f:# 运行完之后在当前文件夹里可以打开f = export_graphviz(dtModel, out_file=f)# 导入pydot模块
import pydot_ng as pydot
# 导入内存IO模块
from six import StringIO
# 把dot文件,写入StringIO中
dot_data = StringIO()# class_names: dtModel.classes_
# feature_names: oneHotEncoder.get_feature_names()
export_graphviz(dtModel,out_file=dot_data,class_names=["不计划", "计划"],feature_names=['女性', '男性', '不鼓励', '鼓励', '父母收入', '智商'],filled=True, rounded=True,special_characters=True
)
# 从字符串中读入dot,生成graph对象
graph = pydot.graph_from_dot_data(dot_data.getvalue()
)# 设置所有的节点的字体属性为 Microsoft YaHei
graph.get_node("node")[0].set_fontname("Microsoft YaHei"
)# 将图形保存到 opt_tree.png 文件中
graph.write_png('D:\\university\\211term\\数据挖掘\\PDMBook\\第三章 分类模型\\3.6 决策树\\opt_tree11.png'
)

代码结果图形展示:
分类树结果

三、一些值得积累的细节

  1. OneHot编码:(给出一个具体示例)

原始数据:

性别 颜色
0 男 红
1 女 绿
2 女 蓝
3 男 绿
4 女 红

训练独热编码器,得到转换规则后fit:
[array([‘女’, ‘男’], dtype=object), array([‘红’, ‘绿’, ‘蓝’], dtype=object)]

转换数据得到一个稀疏矩阵:
[[0. 1. 1. 0. 0.]
[1. 0. 0. 1. 0.]
[1. 0. 0. 0. 1.]
[0. 1. 0. 1. 0.]
[1. 0. 1. 0. 0.]]

  1. hstack函数
    定义:水平(按列)按顺序堆叠数组。
http://www.lbrq.cn/news/1400311.html

相关文章:

  • 日文网站建站/中国疫情今天最新消息
  • 展馆展示设计公司哪家好一点/百度seo关键词排名价格
  • 网站建设论坛社区/网上营销模式
  • 政府网站建设与网络安全培训/seo在线外链
  • 湘潭网站seo/怎么样创建网站
  • 国内虚拟助手网站/seo关键词的选择步骤
  • 重庆平台网站建设/金阊seo网站优化软件
  • 深圳市南山区住房和建设局网站/网上怎么找人去推广广告
  • 搜索品牌价值的网站/百度热搜排名
  • 东莞哪家做网站很有名的公司/网页链接
  • 中心网站建设方法/宁波seo快速优化平台
  • 新公司如何做网站/短链接
  • 做网站属于It行业吗/百度联系电话多少
  • 云南建设企业网站/企业培训权威机构
  • wordpress kalium/网站优化方案设计
  • 电白区建设局网站/网络营销师是做什么的
  • 网站建设定位/销售人员培训课程有哪些
  • 活动线报资源网/seo关键词排名优化系统
  • wordpress网站在哪里修改/网络营销的招聘信息
  • 新疆乌鲁木齐建设厅网站/培训机构排名
  • 网站设计 网站建设/网站seo关键词优化排名
  • 专业网站建设的公司/最近的新闻事件
  • 非经营性网站个人可以备案吗/自己怎么优化网站排名
  • 织梦关闭网站/深圳市住房和建设局官网
  • 好听顺口的公司名字/优化营商环境条例解读
  • 有关风水的网站建设栏目/设计一个公司网站多少钱
  • 山东政府网站建设特色/优化网站关键词排名软件
  • 全国工程信息查询平台/贵港seo
  • 成都企业网站设计服务商/武汉网站建设优化
  • 周六日可以在外汇局网站做申报吗/沈阳seo排名优化软件
  • Git Commit 提交信息标准格式
  • 运维日常工作100条
  • 【shell脚本编程】-7 寻找到在5分钟内改动的文件
  • 中国大学MOOC-C语言第九周指针(上)
  • 微信小程序连接到阿里云物联网平台
  • 点大餐饮独立版系统源码v1.0.3+uniapp前端+搭建教程