即墨有做网站的吗/东莞服务好的营销型网站建设

首先还是讲两句题外话,其实我觉得经济学的分析框架可以很好的和算法结合在一起,比如算法可以改进经济学关于市场主体的行为模型,而经济学的”均衡“思想可以使得算法得到的结果更好的适应市场。举个例子,微观经济学中的供需模型(如下图),经济学模型关于需求曲线的形式一般情况给出的是线性(价格每增加一块钱,需求量减少X),供给曲线也是如此(价格每增加一块钱,供给量增加Y),供给需求平衡,从而使得买方和卖方达成一致。

事实上,买方和卖方的决策模型并不一定是线性模型,可以用算法去改进主体的决策模型,同时,经济学的关于”均衡“的分析框架(比如消费者决策与公司决策的均衡,多个公司共同竞争市场的博弈,买方市场还是卖方市场决策)可以对算法的优化提出改进。
这篇笔记写的决策树实战事实上就是尝试决策树在供给方(保险公司)在风险定价时的其中一个应用。
回到正题,决策树想要模仿“做决定”这件事情,意图通过制定特定的规则(约束),得到决策路径,进而在未知事情上取代人类做出决定。我们通常关注这个决策的路径是怎么样的,但是其实规则是最重要的,有了规则,决策路径只是结果,而规则体现的才是人的观点。
一、决策树算法原理
1.决策树原理
决策树算法原理看这篇就行,写得通俗易懂:
AI蜗牛车:【白话机器学习】算法理论+实战之决策树zhuanlan.zhihu.com
2.现实意义
以车险的业务为例,业务流程大致是这样的,依据核保人员多年业务经营、后台精算模型、市场情况和公司的经营目标制定一系列的核保政策,对于承保什么样的车,以什么样的条件承保进行决策,下图为举例说明核保流程(下图纯属虚构,实际业务中的核保条件和流程比这个复杂得多,当原理看一下就可以):

可以发现这个流程和决策树的思路其实是相似的,即由一系列的特征值(上年出险次数,适用性质,货车吨位数等等)最终决定目标值(赔付率时多少,承保什么样的车,以什么样的价格承保)
转换成决策树,其实就是构造这样一个决策链,一方面可以适用CART树(回归)预测赔付率,另一方面可以使用分类树确定客户的风险标签以及承保决策。
3.模型的优缺点
可以看出来,决策树算法和人依靠经验判断做出决策的思路相似,易于理解,解释起来简单;同时,其对缺失值不敏感,也可以处理不相关特征数据;效率高,决策树只需要一次构建,反复使用,每一次预测的最大计算次数不超过决策树的深度。
但是,决策树算法的缺点也是比较明显的。决策树容易出现过拟合现象,尤其是当类别太多时,错误可能就会增加的比较快;对于各类别样本数量不一致的数据,在决策树当中,信息增益的结果偏向于那些具有更多数值的特征。
二、算法示例
## step1:导入库函数
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_boston
from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error
from sklearn.tree import DecisionTreeRegressor## step2:准备数据集
boston=load_boston()# 查看特征值
print(boston.feature_names)
# 获取特征集和房价
features = boston.data
prices = boston.target
# 随机抽取33%的数据作为测试集,其余为训练集
train_features, test_features, train_price, test_price = train_test_split(features, prices, test_size=0.33)## step3:训练模型
# 创建CART回归树
dtr=DecisionTreeRegressor()
# 拟合构造CART回归树
dtr.fit(train_features, train_price)
# 预测测试集中的房价
predict_price = dtr.predict(test_features)## step4:测试集的结果评价
print('回归树二乘偏差均值:', mean_squared_error(test_price, predict_price))
print('回归树绝对值偏差均值:', mean_absolute_error(test_price, predict_price))
print('回归树R方:', r2_score(test_price, predict_price))
运行结果如下:
['CRIM' 'ZN' 'INDUS' 'CHAS' 'NOX' 'RM' 'AGE' 'DIS' 'RAD' 'TAX' 'PTRATIO''B' 'LSTAT']
回归树二乘偏差均值: 26.413832335329346
回归树绝对值偏差均值: 3.6341317365269465
回归树R方: 0.6435776484418962