当前位置: 首页 > news >正文

上海做网站多少钱seo引擎优化是什么

上海做网站多少钱,seo引擎优化是什么,牡丹江最新疫情行动轨迹,网站后台维护一般要怎么做最近在做文本分类方面的项目,前前后后也遇到很多问题并去寻找解决办法,现在记录一下。 用的开发工具是VS code,语言是python。 无法在VS code的控制台输入内容: 打开设置,输入run in terminal 勾选保存分类器训练好的模…

最近在做文本分类方面的项目,前前后后也遇到很多问题并去寻找解决办法,现在记录一下。

用的开发工具是VS code,语言是python。

  • 无法在VS code的控制台输入内容:
    打开设置,输入run in terminal
    勾选
    1486408-20190421175310964-6140699.png

  • 保存分类器训练好的模型和t训练好的fidf词典:
    from sklearn.externals import joblib
    joblib.dump(model,filename)#保存
    joblib.load(filename)#调用

  • 中文乱码:
    import sys,io
    sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8')
    或先解码再编码

  • 字符串与列表相互转换:
    list=str.split("分割符")
    str="分割符".join(list)

  • jibea分词中添加规则,如禁止某些此拆分或拆分某些词:
    jieba.suggest_freq('不拆分词',True)
    jieba.suggest_freq('拆分','词',True)

  • LDA模型聚类步骤:(无监督学习)
    1.将数据转换为list of list的结构
    2.将数据构造为字典:dictionary=corpora.Dictionary(result) corpora属于gensim库
    3.将数据的每一部分转换为稀疏向量:corpus=[dictionary.doc2bow(sentence) for sentence in result]
    4.转换为tfidf指数
    5.确定聚类数目,输入tfidf特征矩阵,调用LDA模型

  • CountVectorizer和TfidfVectorizer的对比:
    前者单纯考虑词频,后者考虑tfidf指数:即在本文出现的频率(词频)和在其他文本出现的频率(逆文本频率)。当tf高,idf低时该词区分度高。

暂时写下这些,还有问题暂未记录,未完待续

转载于:https://www.cnblogs.com/lfz1211/p/10746134.html

http://www.lbrq.cn/news/2756863.html

相关文章:

  • 小榄公司网站建设著名的网络营销案例
  • 企业查查app下载seo搜索引擎优化课程总结
  • 哪个网站做废旧好手机百度收录提交入口
  • 武汉网站建设团队seo网站推广软件
  • 晋江网站开发谷歌推广新手教程
  • java程序员转网站开发怎么做app推广
  • 论坛网站地图怎么做成人馆店精准引流怎么推广
  • 做暖暖视频网站有哪些百度推广关键词技巧定价
  • 医疗协助平台网站建设方案我想接app纯注册推广单
  • 连云港专业做网站江北seo页面优化公司
  • 做宣传单页的网站汽车营销活动策划方案
  • 做网站租服务器一年多少钱自己的网站怎么做seo
  • 做网站之前要安装什么搜索引擎网站优化和推广方案
  • 设计师网站pintset关键词林俊杰百度云
  • 西安网站建设公司哈尔滨百度推广联系人
  • 做网站 收费广告推广方案怎么写
  • app软件下载安装官方免费下载文章优化软件
  • wordpress根据用户名生成头像百度关键词优化多久上首页
  • 手机如何创建简易网站广东网络推广运营
  • 做电影网站需要用什么空间三只松鼠搜索引擎推广
  • 淄博网站建设至信网络亚马逊提升关键词排名的方法
  • 网上兼职做网站网站百度收录批量查询
  • 搞个竞拍网站怎么做seo公司重庆
  • 网站和app区别与联系广州google推广
  • vs可以做网站吗最火网站排名
  • 网站域名列表怎么填写seo任务
  • 网站开发招标公告安卓优化软件
  • 电脑做系统哪个网站比较好店铺运营
  • 石家庄市网站建设培训班seo管理与优化期末试题
  • 西安百姓网免费发布信息网上海城市分站seo
  • 布隆过滤器的原理及使用
  • RK3568 NPU RKNN(四):RKNN-ToolKit2性能和内存评估
  • linux设备驱动之字符设备驱动
  • 安全审计-firewall防火墙
  • 开源 Arkts 鸿蒙应用 开发(十七)通讯--http多文件下载
  • c#Blazor WebAssembly在网页中多线程计算1000万次求余