Mysql分页关联查询优化

news/2024/7/1 5:55:52

以下内容参考《高性能Mysql》

优化关联查询

这个话题基本上整本书都在讨论,这里需要特别提到的是:

  • 确保ON或者USING子句中的列上有索引。在创建索引的时候就要考虑到关联的顺序。
    当表A和表B用列c关联的时候,如果优化器的关联顺序是B、A,那么就不需要在B表的对应列上建上索引。没有用到的索引只会带来额外的负担。一般来说,除非有其他理由,否则只需要在关联顺序中的第二个表的相应列上创建索引。

  • 确保任何的GROUP BY和ORDER BY中的表达式只涉及到一个表中的列,这样MySQL
    才有可能使用索引来优化这个过程。

  • 当升级MySQL的时候需要注意:关联语法、运算符优先级等其他可能会发生变化
    的地方。因为以前是普通关联的地方可能会变成笛卡儿积,不同类型的关联可能会生成不同的结果

优化LIMIT分页

在系统中需要进行分页操作的时候,我们通常会使用LIMIT加上偏移量的办法实现,同
时加上合适的ORDER BY子句。如果有对应的索引,通常效率会不错,否则,MySQL需
要做大量的文件排序操作。

一个非常常见又令人头疼的问题就是,在偏移量非常大的时候注”,例如可能是LIMIT
1000,20这样的查询,这时MySQL需要查询1 0 020条记录然后只返回最后20条,前面
10 000条记录都将被抛弃,这样的代价非常高。如果所有的页面被访问的频率都相同,
那么这样的查询平均需要访问半个表的数据。要优化这种查询,要么是在页面中限制分
页的数量,要么是优化大偏移量的性能。

优化此类分页查询的一个最简单的办法就是尽可能地使用索引覆盖扫描,而不是查询所
有的列。然后根据需要做一次关联操作再返回所需的列。对于偏移量很大的时候,这样
做的效率会提升非常大。考虑下面的查询:

mysql> SELECT film_id,description FROM sakila.film ORDER BY title LIMIT 50,5;

如果这个表非常大,那么这个查询最好改写成下面的样子:

mysql> SELECT film.film_id,Film.description->  FROM  sakila.film->INNER JOIN(->  SELECT film.film_id FROM sakila.film->  ORDER BY title LIMIT 50,5->) AS lim USING(film_id);

这里的“延迟关联”将大大提升查询效率,它让MySQL扫描尽可能少的页面,获取需
要访问的记录后再根据关联列回原表查询需要的所有列。这个技术也可以用于优化关联
查询中的LIMIT子句。

有时候也可以将LIMIT查询转换为已知位置的查询,让MySQL通过范围扫描获得到对
应的结果。例如,如果在一个位置列上有索引,并且预先计算出了边界值,上面的查询
就可以改写为:

mysql> SELECT film_id, description FROM sakila.Film-> WHERE position BETWEEN so AND 54 0RDER BY position;

对数据进行排名的问题也与此类似,但往往还会同时和GROUP BY混合使用。在这种情况
下通常都需要预先计算并存储排名信息。

LIMIT和OFFST的问题,其实是OFFSET的问题.它会导致MySQL扫描大量不需要的
行然后再抛弃掉。如果可以使用书签记录上次取数据的位置,那么下次就可以直接从该
书签记录的位置开始扫描,这样就可以避免使用OFFSET。例如,若需要按照租借记录做
翻页,那么可以根据最新一条租借记录向后追溯,这种做法可行是因为租借记录的主键
是单调增长的。首先使用下面的查询获得第一组结果:

mysql> SELECT * FROM sakila.rental-> ORDER BY rental id DESC LIMIT 20;

假设上面的查询返回的是主键为1 6 049到1 6 03 0的租借记录,那么下一页查询就可以
从1 6 030这个点开始:

mysql> SELECT * FROM sakila*rental-> WHERE rental id < 16030,-> ORDER BY rental id DESC LIMIT 20;

该技术的好处是无论翻页到多么后面,其性能都会很好。
其他优化办法还包括使用预先计算的汇总表,或者关联到一个冗余表,冗余表只包含主
键列和需要做排序的数据列。还可以使用Sphinx优化一些搜索操作,参考附录F可以获
得更多相关信息。


http://lihuaxi.xjx100.cn/news/279667.html

相关文章

工作发狂:Mybatis 中$和#千万不要乱用!

点击上方“方志朋”&#xff0c;选择“置顶公众号”技术文章第一时间送达&#xff01;开头这是一次代码优化过程中发现的问题&#xff0c;在功能优化后发现部分数据查不到出来了&#xff0c;问题就在于一条sql上的#和$。下图为两条sql&#xff1a;从图上可以看出 wwlr.LabelId …

[C#,Java,PHP] - IMAP文件夹名称编码和解码方法

[C#] 来源&#xff1a;http://www.oschina.net/code/snippet_110991_2237 // 编码private string IMAPEncode(string folder){string rtn "", base64;int index 0; Regex regAsis new Regex("\G(?:[\x20-\x25\x27-\x7e])"); Regex reg26 new Rege…

NB-Iot烟感01:烟感探测器原理和规格

一、烟感探测器分类和工作原理 感烟探测器: 俗称 烟雾探测器&#xff0c;这个产品我们到处都可以看到&#xff0c;不管是地铁站&#xff0c;还是办公楼&#xff0c;商城&#xff0c;宾馆、商店、仓库、机房、住宅等我们抬头就可以看到。也被称为感烟式火灾探测器、烟感探测器、…

那个14岁上大学、17岁读博、24岁当教授的天才神童,如今怎么样了?

陶哲轩最令人羡慕之处&#xff0c;不在于惊人的天赋和出色的成就&#xff0c;而在于坐拥这些天才和成就的同时&#xff0c;也能成长为一个享有健康生活的快乐的“普通人”。世界上最聪明的人是谁&#xff1f;一些媒体报道可能会将这个答案引向一位华裔男性——陶哲轩。据说&…

时隔15 年,Glibc引入Linux的arc4random函数

时隔 15 年&#xff0c;Glibc 终于引入了用于 Linux 的 arc4random 函数,glibc是GNU发布的libc库&#xff0c;即c运行库。glibc是linux系统中最底层的api&#xff0c;几乎其它任何运行库都会依赖于glibc。 近日的一个提交显示&#xff0c;GNU C 库 (Glibc) 终于添加了用于 Linu…

对抗图像和攻击在Keras和TensorFlow上的实现

点击上方“小白学视觉”&#xff0c;选择加"星标"或“置顶”重磅干货&#xff0c;第一时间送达本文转自&#xff1a;计算机视觉联盟AI博士笔记系列推荐周志华《机器学习》手推笔记正式开源&#xff01;可打印版本附pdf下载链接[ 摘要 ]在这篇教程中&#xff0c;你将会…

java中Volatile修饰符的含义

在java语言中&#xff1a;为了获得最佳速度&#xff0c;同意线程保存共享成员变量的私有拷贝。并且仅仅当线程进入或者离开同步代码块时才与共享成员变量的原始值进行对照。 volatilekeyword的作用就是提示vm&#xff1a;对于这个成员变量不能保存它的私有拷贝。而应直接与共享…

边界框的回归策略搞不懂?算法太多分不清?看这篇就够了

作者 | fivetrees来源 | https://zhuanlan.zhihu.com/p/76477248本文已由作者授权&#xff0c;未经允许&#xff0c;不得二次转载【导读】目标检测包括目标分类和目标定位 2 个任务&#xff0c;目标定位一般是用一个矩形的边界框来框出物体所在的位置&#xff0c;关于边界框的回…