当前位置: 首页 > news >正文

网站建设 标准/公众号怎么推广

网站建设 标准,公众号怎么推广,德阳 网站建设,wordpress 蓝色主题人工智能实验TF-IDF矩阵 目录 人工智能实验TF-IDF矩阵 1 一、 TF-IDF矩阵表示 1 算法原理 1伪代码 2代码展示 4实验结果及分析 7 二、 KNN分类任务 8算法原理 8伪代码 8代码展示 10创新点 14实验结果及分析 16 三、 KNN回归任务 19算法原理 19伪代码 20代码展示 21实验结果及分…

人工智能实验TF-IDF矩阵
目录
人工智能实验TF-IDF矩阵 1
一、 TF-IDF矩阵表示 1

  1. 算法原理 1
  2. 伪代码 2
  3. 代码展示 4
  4. 实验结果及分析 7
    二、 KNN分类任务 8
  5. 算法原理 8
  6. 伪代码 8
  7. 代码展示 10
  8. 创新点 14
  9. 实验结果及分析 16
    三、 KNN回归任务 19
  10. 算法原理 19
  11. 伪代码 20
  12. 代码展示 21
  13. 实验结果及分析 24
  14. 思考题 27
    二、 KNN分类任务
  15. 算法原理
    首先对训练集进行学习。在本题中,训练集的每个数据由两部分组成:文档和标签。文档是一句话,含有多个单词,标签是一个描述情绪的单词,是需要用文档预测的结果。使用KNN进行分类的基本过程是:将文档进行编码,统计文档中的单词。在测试时比较测试样本和训练样本的距离,选取若干个距离最近的训练样本,由这几个训练样本的标签来判断测试样本的标签。具体算法如下:
    首先使用TF-IDF矩阵形式编码文档,具体做法参见上文。
    同样,读入测试集后,每个测试集样本也用TF-IDF编码表述为向量形式。需要注意的是测试集在计算TF-IDF矩阵时使用的IDF向量应该是通过训练集的出来的IDF,从而保证每个单词在整个文档中的重要程度的一致。将测试样本和训练集样本一一比较,并且选择距离最小的几个。具体选择几个记为变量K,K的取值不同会对模型产生影响,这会在之后的实验结果分析部分讨论。描述训练集和测试集样本距离的方式是Lp距离:
    在这里插入图片描述

该公式表示向量xix_ixixjx_jxj之间的Lp距离,公式内的l表示向量的维度。将两个向量各个维度对应的数值相减后求q次方,再把各个维度的结果加和,最后再开p次方根,就得到了Lp距离的结果。这里的p也是一个可以调整大小的变量,取值在之后的实验结果分析进行讨论。
在找出了K个和测试样本最近的训练样本后,由训练样本的标签决定测试样本的标签。这里采用多数投票的方法,即选取K个训练样本中出现次数最多的那个标签作为结果。

首先要将训练集进行TF-IDF编码。具体做法和上文一样。
在对文档进行编码的同时,也要将文档对应的标签给记录下来:
emt = {}
/* emt即emotion,记录情绪标签。emt为字典,如emt[5]='sad'表示5号文档的标签为sad */
for eachEmt in 全部文档:emt[当前文档编号] = eachEmt
end
这样一来,就能记录各个文档的TF-IDF编码以及对应的标签emt了。
在测试时,将测试样本进行TF-IDF编码可以不需要读入整个训练集再计算。因为使用的IDF向量已经由训练集得到,每次读取一行,即一个测试样本,直接对其进行距离运算即可。for i in 全部的训练样本			/* 和全部的训练样本进行比较 */diff = 0.0					/* diff表示样本距离 */for eachWord in tf_idf:		/* 检索每个单词,如果在当前训练样本或测试样本中出现则更新diff */if eachWord出现在测试样本或当前训练样本中	then diff += 因eachWord增加的Lp距离项enddiff = diff ^ (1/p)
end

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

http://www.lbrq.cn/news/1413775.html

相关文章:

  • 联系我们_网站制作公司/推广引流工具
  • 老男孩linux网站/seo网站推广方案策划书
  • 教学网站/seo优化报价公司
  • 做彩票网站需要什么技术/做一个公司网站需要多少钱
  • 建设自己的网站怎么做/公司推广方案
  • 软件网站建设基本流程/百度商家平台登录
  • 易语言和网站做交互/不死鸟分享友情链接
  • 知名的集团门户网站建设企业/全球网站流量排名查询
  • 免费跨境电商网站/营销策略分析
  • 北京市海淀区网站建设/网络销售平台有哪些软件
  • 网站设计文档/百度学术论文查重官网入口
  • wordpress没有样式/广州seo优化推广
  • 西安手机网站建设公司/电商sem是什么意思
  • 做全网影视网站的风险/如何进行搜索引擎的优化
  • 上海最专业的集团网站建设/培训后的收获和感想
  • 做网站的经历/谷歌流量代理代理
  • 研究生网站建设/武汉seo推广
  • 从零开始网站建设/百度一下你就知道 官网
  • 广告网架/seo推广软件
  • 微信公众平台怎么做微网站/sem是什么意思
  • 哪些网站可以接单做/网站统计平台
  • 商业网站的建设流程/市场营销公司排名
  • 网站制作客户寻找/申请域名的方法和流程
  • 网站怎么做seo、/上海服务政策调整
  • 成都哪里有做网站建设的/成都seo网络优化公司
  • 做网站生意不赚钱/网站权重查询工具
  • 年报是否就是在工商网站做的/怎么搭建一个网站
  • 自己在线制作logo免费下载/百度爱采购怎么优化排名
  • 网站建设 php/做网站推广
  • 什么网站可以接模具做/百度竞价入门教程
  • 前端环境安装
  • LeetCode热题100--104. 二叉树的最大深度--简单
  • 攻防世界—unseping(反序列化)
  • 网络原理与编程实战:从 TCP/IP 到 HTTP/HTTPS
  • 前端vue3+后端spring boot导出数据
  • 【R语言】R语言矩阵运算:矩阵乘除法与逐元素乘除法计算对比