当前位置: 首页 > news >正文

国外用tornado做的网站/学生个人网页制作

国外用tornado做的网站,学生个人网页制作,日照网站优化,毕设做系统好还是做网站好1. 新特性一:动态分区裁剪 比如上面的 SQL 查询&#xff0c;假设 t2 表 t2.id < 2 过滤出来的数据比较少&#xff0c;但是由于之前版本的 Spark 无法进行动态计算代价&#xff0c;所以可能会导致 t1 表扫描出大量无效的数据。有了动态分区裁减&#xff0c;可以在运行的时候过…

1. 新特性一:动态分区裁剪

比如上面的 SQL 查询,假设 t2 表 t2.id < 2 过滤出来的数据比较少,但是由于之前版本的 Spark 无法进行动态计算代价,所以可能会导致 t1 表扫描出大量无效的数据。有了动态分区裁减,可以在运行的时候过滤掉 t1 表无用的数据 

优化之后:

经过这个优化,查询扫描的数据大大减少,性能提升了 33 倍

2. 新特性二:自适应优化查询

比如下面的查询,基于代价的模型优化不可能准确的评估

而有了 AQE 之后,Spark 就可以动态统计相关信息,并动态调整执行计划,比如把 SortMergeJoin 变成 BroadcastHashJoin

3. 新特性三:映射下推(Project PushDown)

说到列式存储的优势,映射下推是最突出的,它意味着在获取表中原始数据时只需要扫描查询中需要的列,由于每一列的所有值都是连续存储的,所以分区取出每一列的所有值就可以实现TableScan算子,而避免扫描整个表文件内容。在Parquet原生就支持映射下推,执行查询的时候可以通过Configuration传递需要读取的列的信息,这些列必须是Schema的子集,映射每次会扫描一个Row Group的数据,然后一次性得将该Row Group里所有需要的列的Cloumn Chunk都读取到内存中,每次读取一个Row Group的数据能够大大降低随机读的次数,除此之外,Parquet在读取的时候会考虑列是否连续,如果某些需要的列是存储位置是连续的,那么一次读操作就可以把多个列的数据读取到内存

4.新特性四:谓词下推(Predicate PushDown)

在数据库之类的查询系统中最常用的优化手段就是谓词下推了,通过将一些过滤条件尽可能的在最底层执行可以减少每一层交互的数据量,从而提升性能

例如”select count(1) from A Join B on A.id = B.id where A.a > 10 and B.b < 100”SQL查询中,在处理Join操作之前需要首先对AB执行TableScan操作,然后再进行Join,再执行过滤,最后计算聚合函数返回,但是如果把过滤条件A.a > 10B.b < 100分别移到A表的TableScanB表的TableScan的时候执行,可以大大降低Join操作的输入数据。

无论是行式存储还是列式存储,都可以在将过滤条件在读取一条记录之后执行以判断该记录是否需要返回给调用者,在Parquet做了更进一步的优化,优化的方法时对每一个Row Group的每一个Column Chunk在存储的时候都计算对应的统计信息,包括该Column Chunk的最大值、最小值和空值个数通过这些统计值和该列的过滤条件可以判断该Row Group是否需要扫描。另外Parquet还增加诸如Bloom FilterIndex等优化数据,更加有效的完成谓词下推

在使用Parquet的时候可以通过如下两种策略提升查询性能

1、类似于关系数据库的主键,对需要频繁过滤的列设置为有序的,这样在导入数据的时候会根据该列的顺序存储数据,这样可以最大化的利用最大值、最小值实现谓词下推

2、减小行组大小和页大小,这样增加跳过整个行组的可能性,但是此时需要权衡由于压缩和编码效率下降带来的I/O负载

PartitionFilter分区过滤:创建表的时候为分区表

 

 

 

 

 

 

 

 

 

 

 

 

 

 

http://www.lbrq.cn/news/814915.html

相关文章:

  • 百度推广引流/百度seo优化分析
  • 一个网站绑定2个域名/地推公司
  • 有没有教做网站实例视频/武汉seo霸屏
  • 做外文翻译的网站/seo如何优化网站
  • 怀柔区住房和城乡建设委员会网站/如何让百度搜索到自己的网站
  • 有关网站建设的视频/抖音运营推广策划方案
  • 免费学习做网站/竞价托管代运营公司
  • wordpress a 登录/网站页面优化包括
  • 徐州网站建设公司哪个好/网络营销的基本职能
  • 网站建站的流程/平面设计培训
  • 区政府网站建设方案/seo积分优化
  • 论文 网站建设可行性/网络平台销售
  • 免费永久个人网站注册/职业技能培训中心
  • 山西建设厅网站2016年3号文件/网络营销的发展历程
  • SEO网站布局优化/个人网站制作软件
  • 建站策划设计公司/推广之家官网
  • jeecms官网/武汉seo公司排名
  • 网站开发西安/学校网站建设哪家好
  • 给大家科普一下b站推广网站/网络广告形式
  • dreamweaver网站建设教程视频/西安百度竞价外包
  • web3d游戏网站开发/湖州网站建设制作
  • 无锡做公司网站/网页推广链接怎么做
  • 小程序开发制作公司哪家好/东营网站seo
  • 报名网站怎么做/计算机培训机构哪个最好
  • 网站欣赏/成功的品牌推广案例分析
  • 小程序怎么做微网站链接/今天的新闻最新消息
  • php网站开发图文教程/网站视频播放代码
  • 做网站 乐清/百度公司电话是多少
  • 工作室怎么网站备案/西安seo网站关键词
  • wordpress二次开发手册chm/搜索引擎关键词优化技巧
  • AWD的攻击和防御手段
  • Java 大视界 -- Java 大数据在智能安防视频监控系统中的视频语义理解与智能检索进阶(365)
  • C++连接MySQL完整教程
  • NodeJS搭建SSE接口服务
  • Linux parted问题:指定分区边界失效
  • 04.建造者模式的终极手册:从快餐定制到航天飞船的组装哲学