当前位置：首页 > news >正文

河南公司网站可以做天津备案吗/网络营销案例实例

news 2025/7/21 16:14:52

河南公司网站可以做天津备案吗,网络营销案例实例,百度网站的优势,银行网站源码一、前言为什么调研MongoDB？下图是DB-Engines2017年8月数据库的排名统计，可以看到MongoDB总排名在第5，在Nosql数据库中排名第1。优点： 1)社区活跃，用户较多，应用广泛。 2)MongoDB在内存充足的情况下数据都放…

一、前言

为什么调研MongoDB？

下图是DB-Engines2017年8月数据库的排名统计，可以看到MongoDB总排名在第5，在Nosql数据库中排名第1。

优点：

1)社区活跃，用户较多，应用广泛。

2)MongoDB在内存充足的情况下数据都放入内存且有完整的索引支持，查询效率较高。

3)MongoDB的分片机制，支持海量数据的存储和扩展。

缺点：

1)不支持事务

2)不支持join、复杂查询

初步调研下来，MongoDB具备我们需要的特性，而缺点不影响我们的应用场景，故接下来我们就开始做实际的性能压测。

二、压测性能对比

1、准备条件

1)Mysql 、MongoDB数据库所在服务器硬件环境

2)最新的数据库版本

MongoDB server version: 3.4.5

MongoDB client version: mongo-java-driver-2.14.3

Mysql server version:5.6.34

Mysql connector version: mysql-connector-java-6.0.6

MongoDB使用的储存引擎wiredTiger

Mysql使用的储存引擎InnoDB

3)数据库表结构及索引

MongoDB索引为dateTime 且是唯一索引。我们实际测试使用的MongoDB数据结构及字段如图所示。

Mysql索引为DATETIME,PARTNER_ID,GOODS_ID,SCOPE且是唯一索引。我们实际测试使用的Mysql数据结构及字段如图所示。

sql语句根据datetime字段进行时间范围的查询

4)连接池最大连接数都设置为200个。sql语句调到最优

2、百万、千万级别的下不同查询量不同并发量的压测结果

数据库表中记录数总量在百万、千万级别的压测数据及结果如表所示。

3、亿级别的下不同查询量不同并发量的压测结果

数据库表中记录数总量在亿级别的压测数据及结果如表所示。

压测结果分析：

1)当每次查询数据量在500条时，无论表中数据总量千万或者亿级别，Mysql和MongoDB在100线程并发的情况下查询性能相当，表现良好，平均响应时间在500ms以内，TPS在230左右。

2)当每次查询数据量在5000条时，表中数据总量为千万级别时，MongoDB在50线程并发情况下查询性能不及Mysql 的一半，100线程并发情况查询性能都很差，平均响应时间在4500ms左右，表中数据总量为亿级别时，在50个及以上的并发情况下，MongoDB和Mysql性能都较差。

在本案例简单数据模型下的时间范围内的等值查询应用场景下，MongoDB在高并发条件下的大数据量查询性能并没有比Mysql更好。另外还有一点需要注意的是，在本案例中，数据总量由百万级别到千万级别再到亿级别的变化过程中，对于查询性能的影响都不是很大，但对于查询数据量的数倍增长却十分敏感，所以在考量数据库查询性能的时候，也要重点考量应用的单次查询量的需求。

尽管MongoDB在我们的这种应用场景下并没有达到我们预期的性能，我们也简单的调研了下Mysql和MongoDB对于内存的使用机制以及一些可能影响查询效率的内部配置。

三、Mysql和MongoDB内存结构

1、InnoDb内存使用机制

Innodb体系结构如图所示。

压测的Mysql使用的是Innodb存储引擎，Innodb关于查询效率有影响的两个比较重要的参数分别是innodb_buffer_pool_size，innodb_read_ahead_threshold。

innodb_buffer_pool_size指的是Innodb缓冲池的大小，本例中Innodb缓冲池大小为20G，该参数的大小可通过命令指定innodb_buffer_pool_size 20G。缓冲池使用改进的LRU算法进行管理，维护一个LRU列表、一个FREE列表，FREE列表存放空闲页，数据库启动时LRU列表是空的，当需要从缓冲池分页时，首先从FREE列表查找空闲页，有则放入LRU列表，否则LRU执行淘汰，淘汰尾部的页分配给新页。

innodb_read_ahead_threshold相对应的是数据预加载机制，innodb_read_ahead_threshold 30表示的是如果一个extent中的被顺序读取的page超过或者等于该参数变量的，Innodb将会异步的将下一个extent读取到buffer pool中，比如该参数的值为30，那么当该extent中有30个pages被sequentially的读取，则会触发innodb linear预读，将下一个extent读到内存中；在没有该变量之前，当访问到extent的最后一个page的时候，Innodb会决定是否将下一个extent放入到buffer pool中；可以在Mysql服务端通过show innodb status中的Pages read ahead和evicted without access两个值来观察预读的情况：

Innodb_buffer_pool_read_ahead：表示通过预读请求到buffer pool的pages；

Innodb_buffer_pool_read_ahead_evicted：表示由于请求到buffer pool中没有被访问，而驱逐出内存的页数。

可以看出来，Mysql的缓冲池机制是能充分利用内存且有预加载机制，在某些条件下目标数据完全在内存中，也能够具备非常好的查询性能。

2、MongoDB的存储结构及数据模型

1)本例中MongoDB使用的储存引擎是WiredTiger，WiredTiger的结构如图所示。

WiredTiger Cache的实现原理图如图所示。

Wiredtiger的Cache采用Btree的方式组织，每个Btree节点为一个page，root page是btree的根节点，internal page是btree的中间索引节点，leaf page是真正存储数据的叶子节点；btree的数据以page为单位按需从磁盘加载或写入磁盘。

可以通过在配置文件中指定storage.wiredTiger.engineConfig.cacheSizeGB参数设定引擎使用的内存量。此内存用于缓存工作集数据(索引、namespace，未提交的write，query缓冲等)。

2)数据模型

内嵌

MongoDB的文档是无模式的，所以可以支持各种数据结构，内嵌模型也叫做非规格化模型(denormalized)。在MongoDB中，一组相关的数据可以是一个文档，也可以是组成文档的一部分。

内嵌类型支持一组相关的数据存储在一个文档中，这样的好处就是，应用程序可以通过比较少的的查询和更新操作来完成一些常规的数据的查询和更新工作。

当遇到以下情况的时候，我们应该考虑使用内嵌类型：

如果数据关系是一种一对一的包含关系，例如下面的文档，每个人都有一个contact字段来描述这个人的联系方式。像这种一对一的关系，使用内嵌类型可以很方便的进行数据的查询和更新。

{  ”_id”: ,  ”name”: “Wilber”,  ”contact”: {     “phone”: “12345678”,     “email”: “wilber@shanghai.com”   }}

如果数据的关系是一对多，那么也可以考虑使用内嵌模型。例如下面的文档，用posts字段记录所有用户发布的博客。在这中情况中，如果应用程序会经常通过用户名字段来查询改用户发布的博客信息。那么，把posts作为内嵌字段会是一个比较好的选择，这样就可以减少很多查询的操作。

{   “_id”: ,   “name”: “Wilber”,   “contact”: {    ”phone”: “12345678”,    ”email”: “wilber@shanghai.com”  },  ”posts”: [  {    ”title”: “Indexes in MongoDB”,    ”created”: “12/01/2014”,    ”link”: “www.linuxidc.com”  },  {    ”title”: “Replication in MongoDB”,    ”created”: “12/02/2014”,    ”link”: “www.linuxidc.com”  },  {    ”title”: “Sharding in MongoDB”,    ”created”: “12/03/2014”,    ”link”: “www.linuxidc.com”  } ]}

根据上面的描述可以看出，内嵌模型可以给应用程序提供很好的数据查询性能，因为基于内嵌模型，可以通过一次数据库操作得到所有相关的数据。同时，内嵌模型可以使数据更新操作变成一个原子写操作。然而，内嵌模型也可能引入一些问题，比如说文档会越来越大，这样就可能会影响数据库写操作的性能，还可能会产生数据碎片(data fragmentation)。

引用

相对于嵌入模型，引用模型又称规格化模型(Normalized data models)，通过引用的方式来表示数据之间的关系。这里同样使用来自MongoDB文档中的图片，在这个模型中，把contact和access从user中移出，并通过user_id作为索引来表示他们之间的联系。