测速网站开发/百度小说排行榜风云榜单
在商品系统设计的工作中,我发现三个概念特别容易混淆:标签、分类、属性。还有一个关键词,不在本文提及。
初看三者,貌似能够很好区分开来。标签就是用户随意输入的关键词。分类是由组织或系统约束的、有层次结构的分类体系。属性是商品某个信息维度。
再往深里想,觉得他们似乎又有所联系。譬如属性代表某个信息维度的分类,那属性跟分类和标签又有啥区别?标签和分类难道真的仅以是否有层次结构来做区分吗?它们三者是否能够统一?
本书从社会化网络的角度考虑标签这件事。
#分类体系的种类#
分类体系可以归纳出很多种类。本书重点提及三种:传统分类体系(taxonomy,single hierarchical classification,分类 )、大众分类体系(folksonomy,tags,标签)、分面分类法(faceted classification,属性)。
taxnomy和folksonomy本质的区别是谁有权利定义分类,是自民众、还是权威/组织。形式上taxnomy有层次结构、像一棵树;folksonomy更像关键词,tags和关键词的区别在于tags连接了人与人、人与资源、资源与资源的关系。
faceted classification跟前两者谈的事不在一个维度。facet类似商品系统的一个属性,描述事情的一个事实维度。每一个维度依然需要catelog,无论是folksonomy还是taxonomy。
#标签也可以层次化#
标签是否一定没有层次结构?书中提及一个冒泡算法bubble-up folksonomy,它可以根据用户打的标分层级的做聚合。譬如对于音乐标签而言,用户打的标首先会聚合到一个音乐集上、然后聚合到作家上。标签一层一层往上冒,最后形成了一个分类树。
但这样一棵树不是权威所定义的。标签的关系特点是由算法计算出来的。因此,标签和分类最大的一个区别就是标签是由大众用户生产、算法自动关联标签与标签关系。
#标签的三个视角与四个张力点#
标记涉及三个学科领域:社会化、个人信息管理、信息架构。四个张力点:自由与控制、个性化与标准化标签、业余与专家意见、个人应用与社会化应用。不同的系统会在这些张力点间做平衡。
#标签的价值#
该书主要从两个角色来看价值:用户与商业组织。从用户来看,个人管理、易用性、协作与分享、娱乐、自我表达。从组织来看,包含辅助协同工作、获得元数据、增加可寻性、增加用户参与、强化分类成果、激发创新等。
总结一下就是:“个体用户得到了自由、得到了社交;商业组织得到了大量用户的数据反馈、促进信息架构”。标签创造了一个用户反馈的信息分类系统。
#标签模型的三个元素#
模型包含三个元素:用户、标签、资源。用户元素主要考虑:身份、活跃度、社区等因素。标签主要考虑:权限、幂率模式等。
分析三个元素的关系可以用一张二维表格:
关于幂律模式。讲的是标签的词频符合幂律的概率分布。从统计学的角度去理解数据,当然还可以从机器学习的角度去看。常见的标签词频头部集中。
#分类体系的速度分层与生态#
速度分层理论(pace layering)是速度快的层围绕速度慢的层旋转。如果从快和慢的角度去看标签分类属性,随着信息的沉淀、以及不断加强的认知,由标签、分类、属性,依次下沉信息的过程。
因此三者可以在一个信息生态下共存,只是这种速度的快慢会有个历史发展的过程。从标签系统的设计上说,我们应该建立一套这样的信息生态系统,让关键词、标签、分类、属性等能够比较容易的转换。
#参考#
https://www2.kintivo.com/en/Blog/Pages/Taxonomy-and-Folksonomy.aspx
http://journalofia.org/volume2/issue2/02-conradi/ : to_be_classified
https://en.wikipedia.org/wiki/Classification_Research_Group : CRG
http://www.ceur-ws.org/Vol-201/05.pdf : facetag
http://journalofia.org/volume2/issue2/04-fricke/