当前位置：首页 > news >正文

完整域名展示网站源码百度浏览器下载安装2023版本

news 2025/7/29 11:18:39

完整域名展示网站源码,百度浏览器下载安装2023版本,禹州市门户网站建设,网站建设可行性报告模板2019独角兽企业重金招聘Python工程师标准>>> es的同义词搜索功能通过自定义分析器实现我们知道一个分析器就是在一个包里面组合了三种函数的一个包装器， 三种函数按照顺序被执行: char_filter 如：emoticons， html_strip等toke…

2019独角兽企业重金招聘Python工程师标准>>>

es的同义词搜索功能通过自定义分析器实现

我们知道一个分析器就是在一个包里面组合了三种函数的一个包装器，三种函数按照顺序被执行:

char_filter 如：emoticons， html_strip等
tokenizer 如：standard， ik_smart等
filter 如：lowercase，english_stop等

char_filter 用于分词前对原搜索的句子进行处理 tokenizer 用于将搜索的句子分成多个词组 filter 用于处理tokenizer输出的词组，比如删除某些词，修改某些词，增加某些词

实现同义词搜索的原理是，自定义filter，处理tokenizer输出的待搜索词组时，取出其中词的同义词，加入到待搜索的词组中。

创建分析器：

PUT /synonym
{"settings": {"analysis": {"filter": {"word_sync": {"type": "synonym","synonyms_path": "analysis/synonyms.txt"}},"analyzer": {"ik_sync_smart": {"filter": ["word_sync"],"type": "custom","tokenizer": "ik_smart"}}}	}
}

上面的例子在名为synonym的index下面创建了个名为ik_sync_smart的分析器，改分析器的tokenizer为ik_smart, filter为word_sync. word_sync是自定义filter，这个filter的type是synonym，synonyms_path是指定的同义词词典的路径，这个路径在config下面，所以我们需要在config路径下面增加analysis目录，里面增加synonyms.txt文件

synonyms.txt文件的格式为每行为一组同义词，每组的同义词格式由如下两种：

番茄,西红柿
番茄,西红柿 => 西红柿

第一种情况下，无论索引番茄或者西红柿，分析器分析结果的词组为［'番茄', '西红柿'］

第二种情况下，无论索引番茄或者西红柿，分析器分析结果的词组为［'西红柿'］

可以通过

GET /synonym/_analyze?analyzer=ik_sync_smart&text=注册

查看同义词结果是否符合需求

然后设置索引数据的mapping时，指定对应搜索字段的analyzer为自定义的ik_sync_smart即可。

转载于:https://my.oschina.net/u/2299936/blog/1800461

查看全文

http://www.lbrq.cn/news/2501065.html

ios wordpress连接站点简述什么是网络营销

电子商务seo招聘seo快速排名软件网址

wordpress修改描述国外搜索引擎优化

网站做管理后台需要知道什么长沙百度搜索网站排名

用别人的二级域名做网站app推广代理加盟

有谁会设制网站免费引流微信推广

网站开发确认函南京百度推广

wordpress h5 app锦绣大地seo

青海省公路建设网站百度爱采购优化排名软件

郑州网站建设乛汉狮网络哈尔滨网络优化推广公司

防城港网站开发排位及资讯

开一个网站建设公司好seo网络优化公司哪家好

dedecms网站空白西安计算机培训机构哪个最好

新手做网站的几个必要步骤论文收录网站排名

网站建设与管理实训心得体会aso关键词搜索优化

LeetCode--50.Pow(x,n)

归雁思维：解锁自然规律与人类智慧的桥梁

把振动数据转成音频并播放

数值计算 | 图解基于龙格库塔法的微分方程计算与连续系统离散化(附Python实现)

flutter使用firebase集成谷歌，苹果登录

mac neo4j install verifcation

相关文章：