当前位置: 首页 > news >正文

卖手机网站开发的必要性长沙网站推广排名优化

卖手机网站开发的必要性,长沙网站推广排名优化,做空包网站合法吗,网站开发技术可行性分析sklearn逻辑回归 logistics回归名字虽然叫回归,但实际是用回归方法解决分类的问题,其形式简洁明了,训练的模型参数还有实际的解释意义,因此在机器学习中非常常见。 理论部分 设数据集有n个独立的特征x,与线性回归的思路…

sklearn逻辑回归

logistics回归名字虽然叫回归,但实际是用回归方法解决分类的问题,其形式简洁明了,训练的模型参数还有实际的解释意义,因此在机器学习中非常常见。

理论部分

设数据集有n个独立的特征x,与线性回归的思路一样,先得出一个回归多项式:

\[y(x) = w_0+w_1x_1+w_2x_2+…+w_nx_n\]

但这个函数的值域是\([-\infty,+\infty]\),如果使用符号函数进行分类的话曲线又存在不连续的问题。这个时候,就要有请我们的sigmoid函数登场了,其定义如下:

\[f(x)=\frac{1}{1+e^{-x}}\]

1146398-20170913103738469-1891237230.jpg

这个函数属于\([0,1]\),而且连续可导,如果把纵坐标看成概率,那么就可以根据某个对象属于某一类的概率来进行分类了。

顺着这样的思路,我们定义几率比(odds ratio):

\[y(x)=ln(\frac{p(x)}{1-p(x)})\]

这里\(p(x)\)表示该属性组合x属于第一类(正类)的概率,对应的\(1-p(x)\)表示该属性组合x属于第二类(反类)的概率。可以解得:

\[p(x)=\frac{1}{1+e^{-(w_0+w_1x_1+w_2x_2+…+w_nx_n)}}\]

如果模型已经训练好,我们就可以根据w和x来求出\(p(x)\),如果\(p(x)>0.5\)就判断为正类,否则判断为反类。

之后就是训练参数的问题,可以采用极大似然估计的方法估算权重。

理论部分差不多就结束了,值得注意的是,训练出的参数\(w_i\)不光可以分类,还具有实际意义,它表示属性\(x_i\)对于总体对象属于哪一类的影响程度。因此逻辑回归虽然形式简单,但解释力比较强。

sklearn代码实现

#coding=utf-8import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn import datasets
from sklearn import linear_model
import numpy as npdef main():iris = datasets.load_iris() #典型分类数据模型#这里我们数据统一用pandas处理data = pd.DataFrame(iris.data, columns=iris.feature_names)data['class'] = iris.target#这里只取两类,class=0或1data = data[data['class']!=2]#为了可视化方便,这里取两个属性为例X = data[['sepal length (cm)','sepal width (cm)']]Y = data[['class']]#划分数据集X_train, X_test, Y_train, Y_test =train_test_split(X, Y)#创建回归模型对象lr = linear_model.LogisticRegression()lr.fit(X_train, Y_train)#显示训练结果print lr.coef_, lr.intercept_print lr.score(X_test, Y_test) #score是指分类的正确率#作图2x1plt.subplot(211)#区域划分h = 0.02x_min, x_max = X.iloc[:, 0].min() - 1, X.iloc[:, 0].max() + 1y_min, y_max = X.iloc[:, 1].min() - 1, X.iloc[:, 1].max() + 1xx, yy = np.meshgrid(np.arange(x_min, x_max, h),np.arange(y_min, y_max, h))Z = lr.predict(np.c_[xx.ravel(), yy.ravel()])Z = Z.reshape(xx.shape)plt.contourf(xx, yy, Z, cmap=plt.cm.Paired)#做出原来的散点图class1_x = X.loc[Y['class']==0,'sepal length (cm)']class1_y = X.loc[Y['class']==0,'sepal width (cm)']l1 = plt.scatter(class1_x,class1_y,color='b',label=iris.target_names[0])class1_x = X.loc[Y['class']==1,'sepal length (cm)']class1_y = X.loc[Y['class']==1,'sepal width (cm)']l2 = plt.scatter(class1_x,class1_y,color='r',label=iris.target_names[1])plt.legend(handles = [l1, l2], loc = 'best')#做出概率分布图sigmoidplt.subplot(212)x0 = np.linspace(-5, 5, 200)#与lr.predict_proba(X)[:,1]等价plt.plot(x0,1/(1+np.exp(-x0)),linestyle = "-.",color='k')x1 = np.dot(X[data['class']==0],lr.coef_.T)+lr.intercept_l3 = plt.scatter(x1,1/(1+np.exp(-x1)),color='b',label=iris.target_names[0])x2 = np.dot(X[data['class']==1],lr.coef_.T)+lr.intercept_l4 = plt.scatter(x2,1/(1+np.exp(-x2)),color='r',label=iris.target_names[1])plt.legend(handles = [l3, l4], loc = 'best')plt.grid(True)plt.show()if __name__ == '__main__':main()

测试结果

[[ 1.9809081 -3.2648774]] [-0.60409876]
1.0

1146398-20170913103756203-1536385852.png

转载于:https://www.cnblogs.com/fanghao/p/7513745.html

http://www.lbrq.cn/news/2753335.html

相关文章:

  • 南昌网站开发建设哪些店铺适合交换友情链接
  • 靖江有哪些做网站的专门看网站的浏览器
  • 中国可以做交互的网站企业文化的重要性和意义
  • 什么网站可以做相册ip域名查询地址
  • 浦东做网站长沙seo服务哪个公司好
  • 网页特效网站品牌推广方案
  • 政府制作网站建议免费注册推广网站
  • 国内视差网站百度广告投放平台官网
  • 网站开发好要租服务器吗网站推广方法
  • 中介做哪些网站电商网站seo怎么做
  • 梧州市地图疫情最新消息站长seo
  • 上海网站建设哪里好小红书搜索优化
  • 企业品牌网站建设做网络推广一般是什么专业
  • 网站制作高端网站建设免费注册个人网站
  • 英文网站接单做翻译企业宣传推广怎么做
  • wordpress菜单相对地址性能优化大师
  • 如何做直播网站哈尔滨seo优化公司
  • 网站后台管理系统html南京seo排名公司
  • 广东佛山如何制作网站公司北京seo收费
  • 门户网站解决方案网址如何被快速收录
  • 乐山市建设局网站百度视频免费高清影视
  • 长沙域名注册公司seo优化论坛
  • 做网站都需要用到什么360竞价推广怎么做
  • php网站开发总结推广普通话手抄报简单
  • 做计量检定的网站搜索引擎整合营销
  • 洛阳市App网站开发公司南京网站设计公司
  • 做网站的尺寸搜索引擎优化的特点
  • wordpress a5成都seo优化排名推广
  • wordpress插件不显示福州seo网络推广
  • 网站图片属性是什么不受限制的搜索浏览器
  • 深度学习——R-CNN及其变体
  • JavaScript性能优化实战(四):资源加载优化
  • Linux817 shell:until,nfs,random
  • 负载测试与压力测试详解
  • es7.17.x es服务yellow状态的排查查看节点,分片状态数量
  • Windchill 11.0使用枚举类型自定义实用程序实现生命周期状态管理