当前位置: 首页 > news >正文

帮做装修设计的网站/百度查重免费入口

帮做装修设计的网站,百度查重免费入口,做wd网站实训报告总结,营销型企业网站建设包括什么在Solr中默认是没有中文分析器的,需要手工配置,配置一个FieldType,在FieldType中指定使用的中文分析器。另外,Solr中的字段(即业务域)必须先定义后使用。下面我们先把中文分析器配好,这儿使用的中文分析器是IK Analyze…

在Solr中默认是没有中文分析器的,需要手工配置,配置一个FieldType,在FieldType中指定使用的中文分析器。另外,Solr中的字段(即业务域)必须先定义后使用。下面我们先把中文分析器配好,这儿使用的中文分析器是IK Analyzer。 
我们首先应下载IK Analyzer中文分析器,下面是我所下载的IK Analyzer。 
这里写图片描述
接着要将IK Analyzer 2012FF_hf1目录上传到Linux系统上去,怎样将目录上传到Linux系统上,我想我已经说的要吐了,所以这儿不再浪费口舌。与以往一样,我把IK Analyzer 2012FF_hf1目录上传到了用户主目录(即root)下,如下图所示。 
这里写图片描述
我们可以到IK Analyzer 2012FF_hf1目录下查看都有哪些文件,如下图所示。 
这里写图片描述

  • doc:IK Analyzer的文档。
  • ext_stopword.dic:停用词词典。在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词会形成一个停用词表。但是,并没有一个明确的停用词表能够适用于所有的工具,甚至有一些工具是明确地避免使用停用词来支持短语搜索的。
  • IKAnalyzer.cfg.xml:配置文件。
  • mydict.dic:扩展词典。
  • IKAnalyzer2012FF_u1.jar:核心包。

我们接下来把中文分析器的jar包添加到solr工程中。 
这里写图片描述
紧接着我们需要先在/usr/local/solr/tomcat/webapps/solr/WEB-INF目录下创建一个classes目录,然后把IK Analyzer需要的扩展词典及停用词词典、配置文件复制到solr工程的classpath下。 
这里写图片描述
注意:扩展词典及停用词词典的字符集必须是utf-8,不能使用windows记事本编辑。 
下面我们需要配置FieldType,在哪儿进行配置呢?我们应在solrhome/collection1/conf/schema.xml中配置,我们先到schema.xml所在的目录,如下图所示。 
这里写图片描述
然后编辑schema.xml,使用Shift+G就可以直接到文件的末尾,然后添加如下内容:

<fieldType name="text_ik" class="solr.TextField"><analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

要实现商品搜索,我们得配置业务域,在Solr中,这些业务域必须得先定义后使用,所以我们应该先定义业务域,如果要定义业务域,我们得先想想看要把哪些域导入到索引库里面去。在淘淘商城的商品搜索功能当中,我们可能用到的字段如下,由于数据库tb_item表中id字段和Solr中的id同名,我们便使用Solr的id代替商品id,也就是说,我们还需要在schema.xml文件中配置6个业务字段,最后,我们一共要向schema.xml文件中配置7个业务字段,它们分别是:

1、商品Id
2、商品标题
3、商品卖点
4、商品价格
5、商品图片
6、分类名称
7、商品描述

因此,我们在schema.xml文件的末尾添加的业务字段如下所示。

<field name="item_title" type="text_ik" indexed="true" stored="true"/>
<field name="item_sell_point" type="text_ik" indexed="true" stored="true"/>
<field name="item_price"  type="long" indexed="true" stored="true"/>
<field name="item_image" type="string" indexed="false" stored="true" />
<field name="item_category_name" type="string" indexed="true" stored="true" />
<field name="item_desc" type="text_ik" indexed="true" stored="false" />

配置业务域时,type指定使用自定义的FieldType。 
我们配置完业务域后,还要配置复制域,即在schema.xml的末尾添加复制域,如下所示,复制域的好处是可以提高查询效率,原来需要查询多个字段的,现在只需要查询一个字段就可以了(因为各个字段都把内容复制到一块儿了,查询也就方便了)。

<field name="item_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>
<copyField source="item_title" dest="item_keywords"/>
<copyField source="item_sell_point" dest="item_keywords"/>
<copyField source="item_category_name" dest="item_keywords"/>
<copyField source="item_desc" dest="item_keywords"/>

最后,我们只须重启tomcat,重启之后,我们看看字段是否有我们刚才定义的几个,发现是有的,如下图所示。 
这里写图片描述
下面我们来测试中文分词器是否可用,我们选择item_desc字段,我们在Field Value当中添加一段中文,然后点击”Analyse Values”按钮,就可以开始分析了,分析结果如下图所示。 
这里写图片描述
可以看到,我们的中文分析器配置成功了。

http://www.lbrq.cn/news/1372483.html

相关文章:

  • 重庆做网站推广的/网络销售好不好做
  • 可以上传自己做的视频的网站吗/网络服务平台
  • wordpress保存图片不显示/郑州seo建站
  • dw做的网站如何上传云服务器/下列关于seo优化说法不正确的是
  • 衡水企业做网站推广/推推蛙seo
  • 生活家装饰官方网站/宁波网站推广找哪家
  • wordpress调用大类下的分类列表/什么优化
  • 响应式网站的几种尺寸/艺考培训
  • 湖南营销网站建设/博客营销
  • php做网站框架/网络营销与市场营销的区别
  • wordpress承载压力/seo入门免费教程
  • 上海住房和建设交通委员会网站/万网商标查询
  • php网站建设与维护/百度一下首页网页
  • 网站建设背景和目标/品牌推广方式都有哪些
  • 浙江省政府加强政府网站建设方案/百度网络营销中心app
  • 重庆做网站的公司有哪些/网站主题
  • 贵金属网站模板/怎样推广自己的网站
  • 做天猫网站要多少钱/代发新闻稿最大平台
  • 做网站推广的优势/网站收录一般多久
  • 网站被攻击怎么让百度重新蜘蛛自动抓/网络营销的推广手段
  • asp.net 动态网站开发/淘宝关键词指数查询
  • 怎么做网站给国外看见/怎么网上推广自己的产品
  • 代理公司注册有哪些/seo难不难
  • 备案网站名怎么写/电商运营培训正规平台
  • 石家庄网站建设seo/软文发布的平台与板块
  • 餐饮类网站设计/西安发布最新通知
  • 地推加人2元1个/seo的培训班
  • 做夏促的网站有哪些/杭州龙席网络seo
  • 买个网站域名要多少钱一年/百度做网站
  • 做网约车网站/今天的新闻内容
  • 广东省省考备考(第六十五天8.3)——判断推理:图形推理(数量规律题目总结)
  • 介绍JAVA语言、介绍greenfoot 工具
  • 【智能体cooragent】创建 workflow 时 候选 Agent 和 Tool 获取来源详细分析
  • JVM中年轻代、老年代、永久代(或元空间)、Eden区和Survivor区概念介绍
  • 江协科技STM32 13-1 PWR电源控制
  • 【Linux网络】netstat 的 -anptu 各个参数各自表示什么意思?