当前位置: 首页 > news >正文

我要学做网站/南昌seo服务

我要学做网站,南昌seo服务,做电影网站步骤,wordpress破解插件Topic model 是一种应用十分广泛的产生式模型(generative model),在IR, NLP,ML都有广泛的应用,本文将对目前已有的topic model进行分类总结,然后选择几个代表性的topic model进行较为详细的介绍,从而理解to…

Topic model 是一种应用十分广泛的产生式模型(generative model),在IR, NLP,ML都有广泛的应用,本文将对目前已有的topic model进行分类总结,然后选择几个代表性的topic model进行较为详细的介绍,从而理解topic model 的思想,以及怎么应用。

 

topic model最经典的模型之一是LDA(latent dirichlet allocation) ,其它的topic model大都充分利用了LDA的思想去设计,所以下面先简单地描述一下其生成一个文档集合过程:

 

Topic Model (LDA)认为一个离散数据集合(如文档集合,图片集合,为行文方便,本文统统以文档集合作为描述对象,其他的数据集合只需换掉对应的术语即可)是由隐含在数据集合背后的topic set 生成的,这个set中的每一个topic都是词的概率分布。对于文档中的每一篇文档,先抽取一个topics proportion \theta;然后对于这个文档中的每一个词的位置 w_i, LDA 先从\theta中选择一个topic,然后再从这个topic对应的词分布中选择一个词去填充;按照上述步骤直到整个文档集合产生完毕。

 

下面我会把目前出现的topic models进行分门别类,小结。

我认为topic models主要可以分为四大类:1)无监督的、无层次结构的topic model;2)无监督的、层次结构的topic model;3)有监督的、无层次结构的topic model;4)有监督的、层次结构的topic model。

对于1)主要有: PLSA, LDA, Correlated Topic Model, PAM,Concept Topic Model等

对于2)主要有: HLDA, HDP,HPAM等

对于3)主要有: S-LDA, Disc-LDA, MM-LDA, Author-Model, Labeled LDA, PLDA 等等

对于4)主要有: hLLDA, HSLDA

以上模型对应的文章名字,用google直接搜索即可得到,这里就不列出。

 

下面对于每一类topic model,我都选择一个模型来进行介绍:

对于1) 上述已经介绍了LDA,所以就不介绍这类模型了;

对于2) 我想介绍HLDA(Hierarchical Latent Dirichlet Allocation) 模型

由于LDA产生出来的topic都是孤立的,topic之间没有关系,HLDA模型在LDA的基础上,试图建立topic之间的层次关系,同时考虑到LDA需要指定topic的数量作为参数,如果能自动决定topic的数量就比较理想了。为了自动发现决定topic的数量,HLDA用Chinese Restaurant  Process去自动决定每一层的topic数量,然而需要指定topic层次的高度H(也就是有多少层的topic),同时它训练出来的层次结构是等高的,都是H这么高。至于怎么产生文档的每个词,这个和LDA都是一样的。

对于3) 我想介绍Labeled LDA (Labeled Latent Dirichlet Allocation) 模型

这个模型最大的好处是能够训练出来带标签的topic,因为在以前的topic model训练出来的topic都是分布,怎么赋予一个标签给这些topic则是很难的一个问题。

Labeled LDA与LDA最大的不同是: LDA是在所有topics上为某一个词进行选择某个topic,而labeled LDA则是只从文档相关的label对应的topic中去选择,其余和LDA都是一样的。

对于4) 我想介绍hLLDA (hierarchical Labeled Latent Dirichlet Allocation)模型

这个模型最大的好处就是在Labeled Latent Dirichlet Allocation模型的基础上扩展到层次结构,其思想也是很简单的,认为一个文档只是由这个文档对应的层次label所产生,具体学习和推断的时候几乎和Labeled Latent Dirichlet Allocation模型一样。

 

这些模型相对来说都是较为容易理解的,关键是要先理解LDA,包括数学公式的推导,如果LDA能弄得比较清楚,其它的模型就会非常的容易理解。

 

转自:http://blog.csdn.net/xianlingmao/article/details/7076165

转载于:https://www.cnblogs.com/ywl925/archive/2013/05/17/3084404.html

http://www.lbrq.cn/news/1047961.html

相关文章:

  • 建设项目公示网站/软文营销ppt
  • 怎么做代刷网网站app/网站制作论文
  • 宿州房地产网站建设/上海广告推广
  • 密云做网站/百度快速排名软件
  • 西安网站制作顶/宜昌网站建设公司
  • 装饰网站建设效果图/上海做seo的公司
  • 做网站软件html css/西安做网站的公司
  • 网站合同建设模板/如何做网络推广运营
  • 便宜做网站公司/网络推广app是干什么的
  • 北京企业响应式网站建设/重庆seo主管
  • 重庆做网站建设公司哪家好/营销型外贸网站建设
  • 深圳品牌设计公司介绍/东莞seo优化案例
  • 佛山做网站公司有哪些/最新热点新闻事件素材
  • 太原网站开发模板/上海app定制开发公司
  • 网站内容怎么做备份/百度论坛
  • 做外贸需关注的网站/网络销售怎么干
  • vue.js做网站/刷外链工具
  • 汕头网站排名优化/电子商务网站建设多少钱
  • 盐城市住房和城乡建设局门户网站/关键词检测
  • 初学者做网站的软件/国内高清视频素材网站推荐
  • 帮别人做违法网站会判刑吗/做网站用什么软件好
  • 网站建设网络公司/什么公司适合做seo优化
  • 网站建设项目风险管理的主要内容/做一个简单的网站需要多少钱
  • 怎样利用网站做淘宝客/网站关键词seo费用
  • 郑州网站制作天强科技/亚马逊关键词排名提升
  • 谷歌平台推广/厦门百度关键词优化
  • 兼职开发网站开发/网络营销的目的是
  • (小企制作)自制/互联网关键词优化
  • 集团网站建设方案/哈尔滨百度搜索排名优化
  • 广州哪家网站建设最好/国内专业seo公司
  • Leaflet地图高亮与编辑功能实现
  • 如何通过API接口实现批量获取淘宝商品数据?(官方与非官方渠道分享)
  • 六、RuoYi-Cloud-Plus OSS文件上传配置
  • 【npm、yarn、pnpm】特点对比,按需选择
  • Baumer高防护相机如何通过YoloV8深度学习模型实现道路坑洼的检测识别(C#代码UI界面版)
  • 进度、质量、安全的关系随笔