当前位置: 首页 > news >正文

为什么不能用来名字做网站名拓客软件

为什么不能用来名字做网站名,拓客软件,企业为什么要网站建设,工 投标做哪个网站好1. 间隔的直观理解 这一章从“间隔”这个概念开始讲述SVM(支持向量机)模型。本文会以实际的例子让读者对于“间隔”的概念有一个更清晰直观的理解。我们会将前两节总结的思想在第三节通过数学语言来描述。 对于logistic分类模型,由公式hθ(…

1. 间隔的直观理解

这一章从“间隔”这个概念开始讲述SVM(支持向量机)模型。本文会以实际的例子让读者对于“间隔”的概念有一个更清晰直观的理解。我们会将前两节总结的思想在第三节通过数学语言来描述。

对于logistic分类模型,由公式hθ(x)=g(θTx)计算条件概率p(y=1|x;θ)。只有在hθ(x)0.5我们会预测y=1,等价于θTx0时y=1。对单个正样本(y=1)而言,θTx的值越大,条件概率p(y=1|x;θ)就越大,那我们就更“确信”这个样本标记为1。这样模型就有一个很好的优化方向,寻找参数θ使得当y(i)=1θTx>>0,同理当y(i)=0时使θTx<<0,这反映我们对训练样本分类结果的确定性。我们将会通过函数间隔来刻画这个思想。

注意看下面这张图,叉叉代表正样本,圆圈代表负样本。我们画出了一条决策线(也可称为分离超平面,其上的点满足θTx=0)。我们标出了三个示范点A、B、C。

这里写图片描述

可以很容易的发现A点离决策线很远,而C点离决策线很近。我们可以很有信心的说A是一个正样本(y=1),但C点就不太确定了,决策线的参数只需稍有改变,C点就极有可能变成负样本(y=0)。B点相对决策线的距离在A、C之间,我们对它的确信度也在A、C之间。整理一下思路,我们需要找到一条直线使得直线两边的点到它的距离都尽可能的远,这样我们才能确信自己的判断。我们之后会以物理间隔这个概念来描述此问题。

标记符

之后支持向量机的讨论中,我们将使用一组新的标记符。对于二分类问题中的线性分类器,标注记为y,特征为x。我们令y的值域为y{1,1}(而非{0,1})。同时模型参数的标记从向量θ变为w,b。公式即改写为:

hw,b(x)=g(wTx+b)

对于函数 g,当z0 g(z)=1,当 z0 g(z)=1。当前 w,b组合的标记符有利于我们将截距项 b从众多参数中分离出来。
还有一点需要注意,从函数g的定义可以看出这个分类器会直接预测1或-1,这一点和感知器模型是一致的。而不是像logisitc分类器先求解y=1的条件概率 P(y=1|θ;x)后再做判断。

函数间隔和物理间隔

这一节将正式给出函数间隔和物理间隔的数学定义。对某一给定训练样本(x(i),y(i)),我们定义其函数间隔为

γ^(i)=y(i)(wTx(i)+b)

从上式可以看出,当 y(i)=1时要使函数间隔变大,只需增大 wTx+b。同理当 y(i)=1只需减小 wTx+b函数间隔就会增大。同时当 y(i)(wTx(i)+b)0即代表我们预测正确。因此足够大的函数间隔表示这是一个置信度很高的正确预测。

对于某一给定训练集S={(x(i),y(i));i=1,,m},我们定义训练集中最小函数间隔记为γ^

γ^=mini=1,,mγ^(i)

但是用函数间隔描述置信度存在一个问题,如果我们将参数从(w,b)替换成(2w,2b)那么函数间隔会扩大一倍,但实际并不能增加置信度。直觉告诉我们,这里可能需要有一个归一化条件比如w2=1,将(w,b)替换成(w/w2,b/w2)再来计算函数间隔,这就引出了几何间隔的概念。我们接下来讨论几何间隔,看下图:

这里写图片描述

我们画出了决策线,易见w同决策线正交(垂直)。点A是一个输入为x(i)标记为y(i)=1的正样本。它到决策线的距离γ(i)就是线段AB。我们如何确定γ(i)的数值呢?首先w/ww的单位向量,点A的坐标为x(i)那么点B的坐标可表示为x(i)γ(i)w/w,又点B在决策线上则有:

wT(x(i)γ(i)ww)+b=0

求解方程得:

γ(i)=wTx(i)+bw=(ww)Tx(i)+bw.

这就是几何间隔的数学公式。当w=1时,几何间隔和函数间隔相等。从公式中可以发现参数的缩放不会影响几何间隔的大小。

最后,对于某一给定训练集S={(x(i),y(i));i=1,,m},我们定义训练集中最小几何间隔记为γ

γ=mini=1,,mγ(i)

本文主要内容来自吴恩达老师网易公开课机器学习中的课件,本人自行翻译并重新对文章进行编辑排版,转载请注明出处

http://www.lbrq.cn/news/2452699.html

相关文章:

  • 网站建设公司简介企业产品推广运营公司
  • 中国建设银行的网站免费的网站推广
  • 知名网站开发买卖交易平台
  • 鄂州建设网站竞价推广思路
  • 上海做网站的自建站模板
  • 无锡网站建设设计国内比较好的软文网站
  • wordpress本地打开慢google seo整站优化
  • 吉安律师网站建设企业员工培训课程有哪些
  • 郑州市建设网站谷歌seo关键词优化
  • 网站建设403怎么去推广一个产品
  • 会员卡管理系统多少钱宁波seo外包代运营
  • 网络规划设计师的意义厦门网站综合优化贵吗
  • discuz做影视网站重庆seo搜索引擎优化优与略
  • 钓鱼转转网站在线生成软件一键优化清理加速
  • 大连手机自适应网站建设服务市场推广策略 包括哪些
  • 做网站多少人公司官网开发制作
  • 寿光网站建设公司快速优化网站排名软件
  • 最大的房产网站排名app推广之家
  • 平面设计在线制作网站优化公司开始上班了
  • 顺德外贸网站建设湖南知名网络推广公司
  • 做好档案整理及网站建设seo诊断工具
  • 昆山网站制作 微博十种网络推广的方法
  • iis配置wap网站大连中小企业网络营销
  • 企业网站规划方案头条广告入口
  • 做国外网站赚钱微信营销的方法
  • 山东中讯网站建设百度导航官网
  • 住房和城乡建设部课题网站子域名在线查询
  • 三级做视频网站有哪些推广下载app赚钱
  • 基本信息型网站有哪些外包公司被辞退有补偿吗
  • 株洲seo优化公司seo服务公司怎么收费
  • 微分方程入门之入门之入门,纯笔记
  • 实现网页访问/接口调用KernelMemory
  • 多模态大模型与 AI 落地:从技术原理到实践路径的深度解析
  • HTTP 协议的基本格式和 fiddler 的用法
  • 雨雪雾冰全预警:交通气象站为出行安全筑起“隐形防护网”
  • 基于匿名管道的多进程任务池实现与FD泄漏解决方案