当前位置: 首页 > news >正文

湘潭找工作网站/竞价广告

湘潭找工作网站,竞价广告,网站建设需要入无形资产吗,做照片书网站目录步骤1.导入需要的库2. 导入数据集,探索数据3. 进行一次简单的建模,看看模型本身在数据集上的效果4. 随机森林调整的第一步:无论如何先来调n_estimators5. 在确定好的范围内,进一步细化学习曲线6.利用网格搜索,按照…

目录

  • 步骤
    • 1.导入需要的库
    • 2. 导入数据集,探索数据
    • 3. 进行一次简单的建模,看看模型本身在数据集上的效果
    • 4. 随机森林调整的第一步:无论如何先来调n_estimators
    • 5. 在确定好的范围内,进一步细化学习曲线
    • 6.利用网格搜索,按照参数对模型整体准确率的影响程度进行调参,首先调整max_depth
    • 7.调整max_features
    • 8.调整min_samples_leaf
    • 9.调整min_samples_split
  • 完整代码

步骤

1.导入需要的库

from sklearn.datasets import load_breast_cancer
#随机森林分类器
from sklearn.ensemble import RandomForestClassifier
#网格搜索
from sklearn.model_selection import GridSearchCV
#交叉验证
from sklearn.model_selection import cross_val_score
#画图用的
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

2. 导入数据集,探索数据

在这里插入图片描述

3. 进行一次简单的建模,看看模型本身在数据集上的效果

#建模三步
#实例化
rfc=RandomForestClassifier(n_estimators=100,random_state=90)
#交叉验证
score_pre=cross_val_score(rfc,data.data,data.target,cv=10).mean()
score_pre

在这里插入图片描述

4. 随机森林调整的第一步:无论如何先来调n_estimators

"""
在这里我们选择学习曲线,可以使用网格搜索吗?可以,但是只有学习曲线,才能看见趋势
我个人的倾向是,要看见n_estimators在什么取值开始变得平稳,是否一直推动模型整体准确率的上升等信息
第一次的学习曲线,可以先用来帮助我们划定范围,我们取每十个数作为一个阶段,来观察n_estimators的变化如何
引起模型整体准确率的变化
"""
#####【TIME WARNING: 30 seconds】#####
scorel = []
for i in range(0,200,10):rfc = RandomForestClassifier(n_estimators=i+1,random_state=90)score = cross_val_score(rfc,data.data,data.target,cv=10).mean()scorel.append(score)
print(max(scorel),(scorel.index(max(scorel))*10)+1)
#画布
plt.figure(figsize=[20,5])
#横坐标、纵坐标
plt.plot(range(1,201,10),scorel)
plt.show()
#list.index([object])
#返回这个object在列表list中的索引

在这里插入图片描述

5. 在确定好的范围内,进一步细化学习曲线

scorel = []
for i in range(65,75):rfc = RandomForestClassifier(n_estimators=i,n_jobs=-1,random_state=90)score = cross_val_score(rfc,data.data,data.target,cv=10).mean()scorel.append(score)
#[*range(65,75)]把下标替换成对应序号的值 比方说 第一个就是65 第二个就是66.......
print(max(scorel),([*range(65,75)][scorel.index(max(scorel))]))
plt.figure(figsize=[20,5])
plt.plot(range(65,75),scorel)
plt.show()

在这里插入图片描述

6.利用网格搜索,按照参数对模型整体准确率的影响程度进行调参,首先调整max_depth

#调整max_depth
param_grid = {'max_depth':np.arange(1, 20, 1)}
# 一般根据数据的大小来进行一个试探,乳腺癌数据很小,所以可以采用1~10,或者1~20这样的试探
# 但对于像digit recognition那样的大型数据来说,我们应该尝试30~50层深度(或许还不足够
#   更应该画出学习曲线,来观察深度对模型的影响
rfc = RandomForestClassifier(n_estimators=73,random_state=90)#网格搜索 参数(实例化模型,希望其进行搜索的参数,网格搜索中交叉验证的次数)*****************************************
GS = GridSearchCV(rfc,param_grid,cv=10)
GS.fit(data.data,data.target)

在这里插入图片描述

7.调整max_features

#调整max_features
param_grid = {'max_features':np.arange(5,30,1)}
"""
max_features是唯一一个即能够将模型往左(低方差高偏差)推,也能够将模型往右(高方差低偏差)推的参数。我
们需要根据调参前,模型所在的位置(在泛化误差最低点的左边还是右边)来决定我们要将max_features往哪边调。
现在模型位于图像左侧,我们需要的是更高的复杂度,因此我们应该把max_features往更大的方向调整,可用的特征
越多,模型才会越复杂。max_features的默认最小值是sqrt(n_features),因此我们使用这个值作为调参范围的
最小值。
"""
rfc = RandomForestClassifier(n_estimators=73,random_state=90)
GS = GridSearchCV(rfc,param_grid,cv=10)
GS.fit(data.data,data.target)

在这里插入图片描述

8.调整min_samples_leaf

#调整min_samples_leaf
param_grid={'min_samples_leaf':np.arange(1, 1+10, 1)}
#对于min_samples_split和min_samples_leaf,一般是从他们的最小值开始向上增加10或20
#面对高维度高样本量数据,如果不放心,也可以直接+50,对于大型数据,可能需要200~300的范围
#如果调整的时候发现准确率无论如何都上不来,那可以放心大胆调一个很大的数据,大力限制模型的复杂度
rfc = RandomForestClassifier(n_estimators=73,random_state=90)
GS = GridSearchCV(rfc,param_grid,cv=10)
GS.fit(data.data,data.target)

在这里插入图片描述
可以发现此时 调整leaf已经没啥用处

9.调整min_samples_split

#调整min_samples_split
param_grid={'min_samples_split':np.arange(2, 2+20, 1)}
rfc = RandomForestClassifier(n_estimators=39,random_state=90)
GS = GridSearchCV(rfc,param_grid,cv=10)
GS.fit(data.data,data.target)

在这里插入图片描述
调完反而下降所以没用

完整代码

在这里插入图片描述

http://www.lbrq.cn/news/1468135.html

相关文章:

  • 淘宝做海淘产品 网站折扣变化快/上海百度搜索排名优化
  • 手机网站制作费用多少/seo排名优化点击软件有哪些
  • 做电影网站要怎么拿到版权/人民日报新闻
  • 乌鲁木齐百度seo/seo快速优化软件
  • 花瓣网是仿国外那个网站做的/宁德市
  • 晋城手机网站建设/站长工具ip查询
  • 做实验用哪些国外网站/外贸推广方式
  • 网站建设主流技术/玄幻小说排行榜百度风云榜
  • 网站建设和维护怎么学/我赢网seo优化网站
  • 今日兰州疫情最新消息/谷歌seo博客
  • 男人和女人做性网站/爱站网seo工具
  • dede网站迁移步骤/平台推广员是做什么的
  • 武汉网站建设优化/网站推广方案有哪些
  • 企业3合1网站建设/网站推广seo方法
  • 怎么做网站把图片发到网上/网站建设服务公司
  • 深圳做网站价格/网站你应该明白我的意思吗
  • 做网站策划案/百度快速排名优化技术
  • 阿里云备案网站建设方案书案例/营销型公司网站建设
  • 北京网站设计公司新鸿儒/近期国内外重大新闻10条
  • 国内net开发的网站建设/网络营销的产品策略
  • 织梦可以做大型网站吗/百度seo优化是什么
  • 企业网查询四六级/深圳seo优化电话
  • 开源房产网站源码/设计公司网站设计
  • 运营网站团队建设/app营销十大成功案例
  • 企业网站建设注意/营销策略ppt
  • 梅林网站建设/保定网站seo
  • 自己做网站想更换网址/整合营销沟通
  • 阿里企业邮箱客服人工电话/使用 ahrefs 进行 seo 分析
  • 现在哪些做进口商品的电商网站/如何做百度免费推广
  • 网上商城建设方案/哈尔滨优化网站方法
  • ubuntu22.04离线一键安装gpu版docker
  • 数据结构初学习、单向链表
  • Oracle 11g RAC集群部署手册(三)
  • 用 JavaSwing 开发经典横版射击游戏:从 0 到 1 实现简易 Contra-like 游戏
  • LLM Prompt与开源模型资源(3)如何写一个好的 Prompt
  • U-Net vs. 传统CNN:为什么医学图像分割需要跳过连接?