当前位置: 首页 > news >正文

赣州做网站的公司有哪家好网络营销讲师

赣州做网站的公司有哪家好,网络营销讲师,门户网站建设美丽,上海做网站的网站我们对同样的一些电影,书,音乐进行评分,从这些评分中能看到我们彼此之间的相似度么?说到这里你可能会想到豆瓣,我们有没有方法来模仿豆瓣计算这种相似度呢?本文是《集体智慧编程》介绍相似度算法&#xff1…

  我们对同样的一些电影,书,音乐进行评分,从这些评分中能看到我们彼此之间的相似度么?说到这里你可能会想到豆瓣,我们有没有方法来模仿豆瓣计算这种相似度呢?本文是《集体智慧编程》介绍相似度算法:欧几里德距离和皮尔逊相关度系数的一次演练。

       本文将介绍.

       距离是在传统统计学和数据挖掘中衡量接近程度的关键度量。我们如何衡量接近程度或距离呢?在详细介绍不同距离度量方式前,让我们先描述一个便于讨论的问题场景。

 

  故事是这样的:一些人对同样的一些电影做出了评价,我们将在这个基础上进行分析.我们按照IMDB的评分规则,10分为电影的最高评分.首先我们将能够描述这一事实的数据构造出来放入数据库中.我们需要下列的表:

o    Moive 电影信息表

o    UserInfo 用户表(这些人将对电影给出评分)

o    Moive_Level

    使用下面的SQL语句就可以完成上面数据表的建表工作.

ContractedBlock.gifCREATE TABLES

 

  首先是Moive电影表,我从一些电影网站中抽取了1330条电影信息,覆盖了爱情电影,动作电影,科幻电影等各种类型的电影.实际上我们坐算法演示的时候只用到其中的10条数据.如下图,10条数据是比较有代表性的,从类型和发行时间上都有特点..


clip_image005
    
下列用户将对上面的十部电影进行评价:


clip_image006
    
用户对电影的评价是如下结构(下图试数据片段):

    clip_image007

    一个简单常用的距离度量是欧几里德距离。它以人们都评价过的电影为坐标轴,然后将参与评价的人绘制在图上,并考察它们的距离远近,换句话说这幅图就是描述了处于偏好空间中的人们.第一种算法考察方法是:

欧几里德距离

欧几里得度量定义欧几里得空间中点 x = (x1,...,xn) 和 y = (y1,...,yn) 之间的距离为

clip_image001

为了方便将这个算法应用到数据库上,我们创建一个存储过程EuclideanDistance:

ContractedBlock.gifEuclideanDistance
ContractedBlock.gifCode

clip_image002

但是当评价结果中,评价者的评价相对于平均水平偏离很大的时候欧几里德距离不能很好的揭示出真实的相似度.还有一种评价方法就是使用皮尔逊相关系数,它可以完成"夸大值纠偏":

皮尔逊相关度系数

两个变量之间的相关系数越高,从一个变量去预测另一个变量的精确度就越高,这是因为相关系数越高,就意味着这两个变量的共变部分越多,所以从其中一个变量的变化就可越多地获知另一个变量的变化。如果两个变量之间的相关系数为1或-1,那么你完全可由变量X去获知变量Y的值。

·         当相关系数为0时,XY两变量无关系。

·         X的值增大,Y也增大,正相关关系,相关系数在0.001.00之间

·         X的值减小,Y也减小,正相关关系,相关系数在0.001.00之间

·         X的值增大,Y减小,负相关关系,相关系数在-1.000.00之间

X的值减小,Y增大,负相关关系,相关系数在-1.000.00之间

相关系数的绝对值越大,相关性越强,相关系数越接近于1和-1,相关度越强,相关系数越接近于0,相关度越弱。

clip_image003
http://www.lbrq.cn/news/2562985.html

相关文章:

  • wordpress 自动别名seo优化思路
  • 网站制作中企动力公司域名注册需要多少钱
  • 外贸商城网站开发百度推广效果不好怎么办
  • 石家庄网页设计工资seo点击排名源码
  • 网站开发语言phpsem竞价教程
  • 餐饮网站建设方案书惠州抖音seo
  • 天津网站设计建设口碑营销的优缺点
  • 贵阳国家经济技术开发区门户网站宁波seo快速优化课程
  • 织梦网站需要优化360搜索优化
  • 网站标题会影响吗谷歌google play下载
  • wordpress装饰公司主题福建seo顾问
  • 四大门户网站创始人企业营销型网站建设
  • 金阊做网站价格营销推广活动策划书模板
  • 淘宝网站建设属于什么类目seo运营做什么
  • 做网站坂田关键词是什么
  • 哪有专做注册小网站的百度推广平台登录入口
  • 公司做网站之前要准备什么软件产品推广计划怎么写
  • 做网站开发考什么研网络营销的优势
  • 手表回收网网站seo推广公司
  • 自己做了个网站合肥百度快照优化排名
  • 做软件的网站建设百度网址安全中心怎么关闭
  • 如何做独立网站他达拉非的副作用和危害
  • 权大师的网站是哪个公司做的优化营商环境 提升服务效能
  • 辽宁网站建站系统平台百度推广工资多少钱一个月
  • 投资网站建设优化排名推广关键词
  • 男做暧免费视频网站好的seo平台
  • 已有网站怎么修改网站seo优化外包顾问
  • 潍坊网站建设top长沙网站建设公司
  • 浏览器小游戏在线玩深圳网站搜索优化
  • 天津建设工程信息网网站首页seo教程网站优化推广排名
  • 系统性学习数据结构-第一讲-算法复杂度
  • wxPython 实践(六)对话框
  • AR智能巡检系统:制造业设备管理的效率革新
  • CMake Debug/Release配置生成器表达式解析
  • 【华为机试】127. 单词接龙
  • Coze开源版本地部署指南