当前位置: 首页 > news >正文

大连网站建设优化/电商运营模式

大连网站建设优化,电商运营模式,网站建设合作合同模板下载,海淀seo搜索引擎优化公司接上篇: Pyspark使用LinearRegressionWithSGD回归预测共享单车租赁量 第一步:下载数据。 同上篇,略 第二步:加载数据。 同上篇,略 第三步:创建特征向量 def extract_features_dt(record):return np…

接上篇:   Pyspark使用LinearRegressionWithSGD回归预测共享单车租赁量

第一步:下载数据。  同上篇,略

第二步:加载数据。  同上篇,略

第三步:创建特征向量

def extract_features_dt(record):return np.array([float(record[i]) for i in np.arange(2,14)])
data_dt = records.map(lambda r: LabeledPoint(extract_label(r),extract_features_dt(r)))
first_point_dt = data_dt.first()
print("Decision Tree feature vector: " + str(first_point_dt.features))
print("Decision Tree feature vector length: " +str(len(first_point_dt.features)))

第四步:对target变量进行log变换

#对target值进行 log-变换
data_dt_log = data_dt.map(lambda lp:LabeledPoint(np.log(lp.label), lp.features))

第五步:拆分训练、测试集

#拆分训练样本-测试样本
data_with_idx_dt = data_dt.zipWithIndex().map(lambda point_index: (point_index[1], point_index[0]))
test_dt = data_with_idx_dt.sample(False, 0.2, 42)  
train_dt = data_with_idx_dt.subtractByKey(test_dt) 
train_data_dt = train_dt.map(lambda index_point:index_point[1])
test_data_dt = test_dt.map(lambda index_point:index_point[1])

第六步:定义模型评价度量

def evaluate_dt(train, test, maxDepth, maxBins):model = DecisionTree.trainRegressor(train, {},impurity='variance', maxDepth=maxDepth, maxBins=maxBins)preds = model.predict(test.map(lambda p: p.features))actual = test.map(lambda p: p.label)tp = actual.zip(preds)rmsle = np.sqrt(tp.map(lambda ap: squared_log_error(ap[0],ap[1])).mean())return rmsle

第七步:调节参数,可调节参数包括: maxDepth, bins

#调节参数--树的深度,maxDepth
params = [1, 2, 3, 4, 5, 10, 20]
metrics = [evaluate_dt(train_data_dt, test_data_dt, param, 32) for param in params]
print( params)
print( metrics)
plt.plot(params, metrics)
fig = plt.gcf()

第八步:汇总上述模型最优参数和结果

Done

http://www.lbrq.cn/news/1458451.html

相关文章:

  • 做 理财网站有哪些/搜索引擎竞价排名
  • 山东华邦建设集团网站/优化网站链接的方法
  • 网站汉英结合的怎么做/云南网络推广公司排名
  • 榆林网站建设推广/2345网址导航下载
  • 网站作业免费下载/网站建设百度推广
  • 空间放两个网站/武汉抖音seo搜索
  • 河南外贸网站建设/seo网站推广实例
  • 东莞东坑网站设计/发帖子的网站
  • 海珠电子商务网站建设/什么是友情链接?
  • wordpress 博客不显示/合肥seo按天收费
  • 网站建设服务网站/大数据分析师
  • 上海多语种建站/徐州seo企业
  • 网站建设子目录/人工智能培训班
  • 中国建设银行公积金网站/怎么在百度上推广
  • 中企动力建站怎么样/深圳网站建设运营
  • 广州出台21条措施扶持餐饮住宿/学seo的培训学校
  • 怎样建网站 阿里云/如何创建一个个人网站
  • 琴童少儿音乐创作网站建设/云搜索神器
  • dw做网站鼠标经过图像/郑州seo学校
  • 关于网站建设意见和建议/今天的新闻发布会
  • 网站建设费用细项/网站seo优化培训
  • 网站开发答辩/seo页面如何优化
  • 哪个网站是做旅游B2B的/seo的方式有哪些
  • 做网站推广工作赚钱吗/微信加精准客源软件
  • 成都海鸥手表网站/商品标题优化
  • ui设计网站模板/2345网址导航下载桌面
  • 为什么建设银行的网站打不开/关键时刻
  • 网站建设商家/新能源汽车公司
  • 济南专业网站建设/做网站需要什么条件
  • 南京市公共建设中心网站/b站新人视频怎么推广
  • 抛出自定义异常
  • 03.一键编译安装Redis脚本
  • k8s+isulad 国产化技术栈云原生技术栈搭建2-crictl
  • 前后端交流
  • Flutter开发 dart异步
  • 接口测试用例的编写