百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

MySQL索引失效的10大陷阱:从隐式类型转换到索引选择性全面优化

moboyou 2025-04-03 21:23 25 浏览

索引是MySQL性能优化的核心武器,但错误的使用场景可能让索引完全失效,导致查询性能断崖式下降。本文通过实际案例,深入剖析索引失效的典型场景及其底层原理,并提供可落地的解决方案。


一、索引失效的核心原理

1.索引数据结构特性

  • B+树索引:有序存储,适合范围查询和前缀匹配
  • 回表代价:非覆盖索引需二次查询主键索引

2.优化器决策机制

  • 成本估算:基于索引选择性(Cardinality)和IO成本
  • 强制索引(FORCE INDEX)可能破坏优化器决策平衡

二、索引失效的10大典型场景

1.对索引列进行运算或函数操作

sql

-- 失效案例:对索引列做运算
SELECT * FROM users WHERE YEAR(create_time) = 2023; 

-- 优化方案:使用范围查询
SELECT * FROM users 
WHERE create_time BETWEEN '2023-01-01' AND '2023-12-31';

2.隐式类型转换

sql

-- user_id是VARCHAR类型,但用数字查询(触发类型转换)
SELECT * FROM users WHERE user_id = 10086; 

-- 执行计划显示:type=ALL(全表扫描)

3.前导通配符模糊查询

sql

-- 无法使用name索引
SELECT * FROM users WHERE name LIKE '%张%'; 

-- 优化方案:后缀匹配 + 倒序索引
ALTER TABLE users ADD INDEX idx_name_reverse (reverse(name));
SELECT * FROM users WHERE reverse(name) LIKE reverse('%张');

4.OR连接非索引列条件

sql

-- age未建索引,导致全表扫描
SELECT * FROM users WHERE id = 100 OR age > 30;

5.联合索引最左前缀缺失

sql

-- 联合索引 (a,b,c)
SELECT * FROM table WHERE b = 2 AND c = 3; -- 未使用索引
SELECT * FROM table WHERE a = 1 AND c = 3; -- 仅使用a列索引

6.数据倾斜导致索引选择性过低

sql

-- 性别字段(cardinality极低)
SELECT * FROM users WHERE gender = 'F'; -- 可能全表扫描

7.使用NOT或负向条件

sql

-- 无法使用索引
SELECT * FROM orders WHERE status NOT IN ('paid', 'completed');

8.索引列参与JOIN的隐式转换

sql

-- 两表user_id类型不同(INT vs VARCHAR)
SELECT * FROM t1 
JOIN t2 ON t1.user_id = t2.user_id; -- 全表扫描

9.强制类型转换破坏索引

sql

-- CAST导致索引失效
SELECT * FROM products 
WHERE CAST(price AS DECIMAL) > 100.00;

10.全文索引的误用

sql

-- MATCH...AGAINST未遵循最左匹配原则
SELECT * FROM articles 
WHERE MATCH(title,content) AGAINST('+MySQL -Oracle' IN BOOLEAN MODE);

三、诊断与优化工具箱

1.执行计划分析(EXPLAIN)

  • type列
    • const/system > ref > range > index > ALL
  • key_len:确认索引使用长度
  • Extra
    • Using index:覆盖索引
    • Using filesort:需优化排序

2.索引选择性计算

sql

SELECT 
  COUNT(DISTINCT column)/COUNT(*) AS selectivity 
FROM table;
-- 选择性 > 10% 适合建索引

3.强制索引的风险提示

sql

-- 需对比有无FORCE INDEX的查询成本
SELECT * FROM table FORCE INDEX(idx_column) WHERE ...;

4.优化器提示(Optimizer Hints)

sql

/*+ INDEX(table idx_name) */ 
SELECT * FROM table WHERE ...;

四、高级优化策略

1.索引跳跃扫描(Index Skip Scan)

  • MySQL 8.0+ 特性,缓解最左前缀缺失问题
  • 适用条件:前导列基数低,后续列基数高

2.虚拟列索引(Generated Columns)

sql

-- 对函数结果建索引
ALTER TABLE users 
ADD COLUMN name_reverse VARCHAR(255) AS (REVERSE(name)),
ADD INDEX idx_name_reverse (name_reverse);

3.索引合并优化

sql

-- index_merge场景(需权衡成本)
SET optimizer_switch='index_merge=on';

五、总结:索引优化的黄金法则

  1. 写查询比建索引更重要:80%的性能问题源于错误SQL
  2. 理解B+树特性:有序性决定前缀匹配的有效性
  3. 关注基数与成本:优化器的选择可能不符合直觉
  4. 监控索引使用率:定期执行 SHOW INDEX_STATISTICS

通过精准识别索引失效场景,结合执行计划分析与版本特性,可系统性提升MySQL的索引命中率,让查询性能飞驰在正确的轨道上。

相关推荐

php宝塔搭建部署实战服务类家政钟点工保姆网站源码

大家好啊,我是测评君,欢迎来到web测评。本期给大家带来一套php开发的服务类家政钟点工保姆网站源码,感兴趣的朋友可以自行下载学习。技术架构PHP7.2+nginx+mysql5.7+JS...

360自动收录简介及添加360自动收录功能的详细教程

以前我们都是为博客站点添加百度实时推送功能,现在360已经推出了自动收录功能,个人认为这个功能应该跟百度的实时推送功能差不多,所以我们也应该添加上这个功能,毕竟360在国内的份额还是不少的。360自动...

介绍一个渗透测试中使用的WEB扫描工具:Skipfish

Skipfish简介Skipfish是一款主动的、轻量级的Web应用程序安全侦察工具。它通过执行递归爬取和基于字典的探测来为目标站点准备交互式站点地图。该工具生成的最终报告旨在作为专业Web应用程序安...

好程序员大数据培训分享Apache-Hadoop简介

好程序员大数据培训分享Apache-Hadoop简介  好程序员大数据培训分享Apache-Hadoop简介,一、Hadoop出现的原因:现在的我们,生活在数据大爆炸的年代。国际数据公司已经预测在20...

LPL比赛数据可视化,完成这个项目,用尽了我的所有Python知识

LPL比赛数据可视化效果图完成这个项目,我感觉我已经被掏空了,我几乎用尽了我会的所有知识html+css+javascript+jQuery+python+requests+numpy+mysql+p...

网站被谷歌标记“有垃圾内容”但找不到具体页面?

谷歌的垃圾内容判定机制复杂,有时违规页面藏得深(如用户注册页、旧测试内容),或是因第三方插件漏洞被注入垃圾代码,导致站长反复排查仍毫无头绪。本文提供一套低成本、高执行性的解决方案。你将学会如何利用谷歌...

黑客必学知识点--如何轻松绕过CDN,找到真实的IP地址

信息收集(二)1、cms识别基础为什么要找CMS信息呢?因为有了CMS信息之后,会给我们很多便利,我们可以搜索相应CMS,有没有公开的漏洞利用根据敏感文件的判断:robots.txt文件robots....

Scrapy 爬虫完整案例-提升篇

1Scrapy爬虫完整案例-提升篇1.1Scrapy爬虫进阶案例一Scrapy爬虫案例:东莞阳光热线问政平台。网站地址:http://wz.sun0769.com/index.php/que...

如何写一个疯狂的爬虫!

自己在做张大妈比价(http://hizdm.com)的时候我先后写了两个版本的爬虫(php版本和python版本),虽然我试图将他们伪装的很像人但是由于京东的价格接口是一个对外开放的接口,如果访问频...

程序员简历例句—范例Java、Python、C++模板

个人简介通用简介:有良好的代码风格,通过添加注释提高代码可读性,注重代码质量,研读过XXX,XXX等多个开源项目源码从而学习增强代码的健壮性与扩展性。具备良好的代码编程习惯及文档编写能力,参与多个高...

Python爬虫高级之JS渗透登录新浪微博 | 知了独家研究

小伙伴们看到标题可能会想,我能直接自己登陆把登陆后的cookie复制下来加到自定义的请求头里面不香嘛,为什么非要用python模拟登录的过程?如果我们是长期爬取数据,比如每天早上中午和晚上定时爬取新浪...

使用Selenium实现微博爬虫:预登录、展开全文、翻页

前言想实现爬微博的自由吗?这里可以实现了!本文可以解决微博预登录、识别“展开全文”并爬取完整数据、翻页设置等问题。一、区分动态爬虫和静态爬虫1、静态网页静态网页是纯粹的HTML,没有后台数据库,不含程...

《孤注一掷》关于黑客的彩蛋,你知道多少?

电影总是能引发人们的好奇心,尤其是近日上映的电影《孤注一掷》。这部电影由宁浩监制,申奥编剧执导,是一部反诈骗犯罪片。今天给大家讲解一下影片潘生用的什么语言,以及写了哪些程序。揭秘影片中的SQL注入手法...

python爬虫实战之Headers信息校验-Cookie

一、什么是cookie上期我们了解了User-Agent,这期我们来看下如何利用Cookie进行用户模拟登录从而进行网站数据的爬取。首先让我们来了解下什么是Cookie:Cookie指某些网站为了辨别...

「2022 年」崔庆才 Python3 爬虫教程 - urllib 爬虫初体验

首先我们介绍一个Python库,叫做urllib,利用它我们可以实现HTTP请求的发送,而不用去关心HTTP协议本身甚至更低层的实现。我们只需要指定请求的URL、请求头、请求体等信息即...