当前位置: 首页 > news >正文

建设职业技术学院网站/百度推广官网电话

建设职业技术学院网站,百度推广官网电话,国外公司做中国网站,东莞市城乡建设规划局官网Elasticsearch是一个分布式可扩展的实时搜索和分析引擎。它能帮助你搜索、分析和浏览数据,而往往大家并没有在某个项目一开始就预料到需要这些功能。Elasticsearch之所以出现就是为了重新赋予硬盘中看似无用的原始数据新的活力。 Elasticsearch每一个独立的部…

       Elasticsearch是一个分布式可扩展的实时搜索分析引擎。它能帮助你搜索、分析和浏览数据,而往往大家并没有在某个项目一开始就预料到需要这些功能。Elasticsearch之所以出现就是为了重新赋予硬盘中看似无用的原始数据新的活力。
       Elasticsearch每一个独立的部分都不是新创的。比如全文搜索早就已经被实现,统计系统和分布式数据库也早已存在。但是革命之处在于能将这些独立的功能结合成一个连贯、实时处理的整体。对于新用户,它的门槛也很低,当然他也会因为你的强大而变得更强大。
       很不幸的是,目前的大部分数据库在提取数据方面都是非常的薄弱的。虽然它们可以通过精准的时间戳或者确切的数值来进行内容的筛选,但是它们可以在全文搜索时做到同义词或者相关性搜索吗?他们可以汇总相同内容数据吗?最重要的是,每对如此巨大的数据量,它们能做到实时处理吗?
在Elasticsearch中,每一个字段都会默认被建立索引。也就是说,每一个字段都会有一个反向索引以便快速搜索。而且,与大多数其他数据库不同的是Elasticsearch可以在同一个查询中使用所有的反向索引,以惊人的速度返回查询结果。这便是Elasticsearch如此突出的理由:Elasticsearch可以帮助你浏览并利用已经快要烂在数据库里的那些极难查询的数据。


了解搜索
       Elasticsearch是一个建立在全文搜索引擎Apache Lucene(TM)基础上的搜索引擎,可以说Lucene是当今最先进,最高效的全功能开源搜索引擎框架。但是Lucene只是一个框架,要充分利用它的功能,你需要使用Java,并且在你的程序中集成Lucene。更糟的是,你需要做很多的学习了解,才能明白它是如何运行的,Lucene确实非常复杂。
       Elasticsearch使用Lucene作为内部引擎,但是在你使用它做全文搜索时,只需要使用统一开发好的API即可,而不需要了解其背后复杂的Lucene的运行原理。当然Elasticsearch并不仅仅是Lucene这么简单,它不但包括了全文搜索功能,还可以进行以下工作:
       分布式实时文件存储,并将每一个字段都编入索引,使其可以被搜索。
       实时分析的分布式搜索引擎
       可以扩展到上百台服务器,处理PB级别的结构化或非结构化数据。
       这么多的功能被集成到一台服务器上,你可以轻松地通过客户端或者任何你喜欢的程序语言与ES的RESTful API进行交流,默认端口为9200,可以在配置文件中修改。


面向文档
程序中的对象很少是单纯的键值与数值的列表。更多的时候它拥有一个复杂的结构,比如包含了日期、地理位置、对象、数组等。
迟早你会把这些对象存储在数据库中。你会试图将这些丰富而又庞大的数据都放到一个由行与列组成的关系数据库中,然后你不得不根据每个字段的格式来调整数据,然后每次重建它你都要检索一遍数据。


       Elasticsearch是面向文档型数据库,这意味着它存储的是整个对象或者文档,它不但会存储它们,还会为他们建立索引,这样你就可以搜索他们了。你可以在Elasticsearch中索引、搜索、排序和过滤这些文档。不需要成行成列的数据。这将会是完全不同的一种面对数据的思考方式,这也是为什么Elasticsearch可以执行复杂的全文搜索的原因。
       Elasticsearch使用JSON (或称作JavaScript Object Notation )作为文档序列化的格式。JSON已经被大多数语言支持,也成为NoSQL领域的一个标准格式。它简单、简洁、易于阅读。在Elasticsearch中,将对象转换为JSON并作为索引要比在表结构中做相同的事情简单多了。
Elasticsearch可以通过curl以get post delete等方式进行数据操作,或者通过match匹配、filter过滤器、range范围查询、布尔查询、aggregations(取代facet)聚合等方式,官方网站(https://www.elastic.co/guide/index.html)有丰富的查询示例。同样,它支持bulk api批量查询,减少网络往返。


基本搜索请求格式

[php] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. Method /{index}/{type}/{id}  
  2. {  
  3. "field""value",  
  4. ...  
  5. }  

HEAD方法可以用来检查文档是否存在,加上-i参数获取反馈头文件。另外,在查询字符串中带上pretty参数,Elasticsearch就可以得到优美打印的更加易于识别的JSON结果。 _source 字段不会执行优美打印,它的样子取决于我们录入的样子。


全文搜索

一项在传统数据库很难实现的功能。 我们将会搜索所有喜欢rock climbing的员工:

[php] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. GET /megacorp/employee/_search  
  2. {  
  3.     "query" : {  
  4.     "match" : {  
  5.     "about" : "rock climbing"  
  6.     }  
  7.     }  
  8. }  


你会发现我们同样使用了 match 查询来搜索 about 字段中的rock climbing。我们会得到两个匹配的文档:

[php] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. {  
  2. ...  
  3. "hits": {  
  4. "total": 2,  
  5. "max_score": 0.16273327,  
  6. "hits": [  
  7.     {  
  8.     ...  
  9.     "_score": 0.16273327, <1>  
  10.     "_source": {  
  11.     "first_name""John",  
  12.     "last_name""Smith",  
  13.     "age": 25,  
  14.     "about""I love to go rock climbing",  
  15.     "interests": [ "sports""music" ]  
  16.     }  
  17.     },  
  18.     {  
  19.     ...  
  20.     "_score": 0.016878016, <1>  
  21.     "_source": {  
  22.     "first_name""Jane",  
  23.     "last_name""Smith",  
  24.     "age": 32,  
  25.     "about""I like to collect rock albums",  
  26.     "interests": [ "music" ]  
  27.     }  
  28.     }  
  29.     ]  
  30.     }  
  31.     }  

相关性评分
       通常情况下,Elasticsearch会通过相关性来排列顺序,第一个结果中,John Smith的 about 字段中明确地写到rock climbing。而在Jane Smith的 about 字段中,提及到了rock,但是并没有提及到climbing,所以后者的 _score 就要比前者的低。即所谓的相关性(与指定搜索查询匹配程度的一个相对度量,得分越高,文档越相关)
       另外,计算得分会带来一定的性能损耗,当不需要计算得分时,可以使用filter过滤器。这个例子很好地解释了Elasticsearch是如何执行全文搜索的。对于Elasticsearch来说,相关性的感念是很重要的,而这也是它与传统数据库在返回匹配数据时最大的不同之处。


段落搜索
       能够找出每个字段中的独立单词固然很好,但是有的时候你可能还需要去匹配精确的短语或者段落。例如,我们只需要查询到 about 字段只包含rock climbing的短语的员工。为了实现这个效果,我们将对 match 查询变为 match_phrase 查询进行精确匹配。


原文链接:http://blog.csdn.net/xifeijian/article/details/49611909

http://www.lbrq.cn/news/1293121.html

相关文章:

  • 网站推广策划的思路包括哪些内容/个人网站推广怎么做
  • 广州黄埔做网站/seo 首页
  • 随州网站建设外包公司/市场推广方案
  • 做注册任务网站源码/营销的主要目的有哪些
  • 用illustrator做网站/seo关键词优化举例
  • 公司国际网站怎么做/国内seo公司排名
  • 帮人家做网站难吗/seo推广编辑
  • 长春建设网站公司/西安做网站
  • 保山网站建设多少钱/公司网站模版
  • 湖南做网站 磐石网络引领/seo建站教程
  • 杭州网站外包/seo优化培训班
  • 房天下官方网站/广告关键词有哪些类型
  • 网站标题符号/今日疫情实时数据
  • 图标网站导航制作怎么做/网站外贸推广
  • 网站地图怎么做、/杭州网站建设 seo
  • 网站安全建设模板下载/广州网站建设工作室
  • 大数据营销工具/系统优化软件十大排名
  • 专业做网站建设公/站长seo推广
  • 红杉网站建设/aso优化排名违法吗
  • 工厂怎么做网站/搜狗搜索引擎推广
  • 聊城做wap网站服务/中国进入一级战备状态了吗
  • 石岩网站建设 0755/济南网络推广
  • 微信小程序案例展示/关键词优化快速排名
  • wordpress 替换jquery/seo是什么意思 seo是什么职位
  • wordpress 伪静态 windows/搜索引擎营销seo
  • 网站开发维护的好处/站长工具是干嘛的
  • 上线了做网站怎么样/朋友圈广告推广文字
  • 京东优惠券网站怎么做/什么是互联网销售
  • 动态网页设计网站建设/sem是什么方法
  • 龙泉市做网站企业/排名优化哪家好
  • ARM 学习笔记(三)
  • 【图文详解】Transformer架构详细解析:多头自注意力机制、qkv计算过程、encoder架构、decoder架构以及mask的意义
  • 深入解析 Amazon Q:AWS 推出的企业级生成式 AI 助手
  • GATE:基于移动嵌入式设备的实时边缘构建图注意力神经网络用于鲁棒室内定位
  • CentOS7下的ElasticSearch部署
  • Git使用与管理