mysql的索引

在大部分情况下,程序的瓶颈都在于数据库,所以为了减少数据库的压力,我们会通过缓存(减少数据库查询),分布式数据库,读写分离等方式去减少数据库本身的curd压力.

但是,数据库还是避免不了一定要被程序curd的命运,而大部分压力来自于数据库的查询.

当不能避免查询数据库,该怎么优化数据库的查询速度呢?

没错,只有索引.


索引的好处

数据库索引是一个非常重要的东西,举个例子,

我们要去图书馆找一本<<php从入门到精通>>,最傻逼的做法就是从门口开始,一本一本看过去,直到找到这本书,有索引之后呢?

我们首先从图书馆分类开始:"外语","哲学","艺术","经营","少儿","计算机",通过"计算机"分类,指引我们到了一片区域,然后通过"A_Z"的书本名排序,我们很快就能定位到这本书,这就是索引


首先,我们建立个表:

create table `article`
(
  `id` int auto_increment primary key  comment 'id',
  `user_id` int(11) not null comment '用户id',
  `title` varchar(64) not null  comment '标题',
  `add_time` datetime comment '新增时间',
  `update_time` int(11) comment '更新时间',
  `content` text comment '内容',
  `description` varchar(255) comment '简介',
  `status` tinyint(1) comment '状态 1正常 0隐藏'
)engine = INNODB charset ='utf8'


我们用程序批量创建10w条数据用于测试(本文使用easyswoole程序创建):

<?php
include "./vendor/autoload.php";
\EasySwoole\EasySwoole\Core::getInstance()->initialize();
for ($i = 0; $i <= 1000; $i++) {//协程最多3000,创建1000个协程
    go(function () use ($i) {
        \App\Utility\Pool\MysqlPool::invoke(function (\App\Utility\Pool\MysqlObject $mysqlObject) use ($i) {
            for ($y = 0; $y <= 100; $y++) {//每个协程插入100条数据
                $data = [
                    'user_id'     => mt_rand(1, 2500),
                    'title'       => \EasySwoole\Utility\Random::character(32),//随机生成32位字母的标题
                    'add_time'    => date('Y-m-d H:i:s', mt_rand(strtotime('2018-01-01'), strtotime('2019-01-01'))),//随机生成日期
                    'update_time' => mt_rand(strtotime('2018-01-01'), strtotime('2019-01-01')),//随机生成日期
                    'content'     => getChar(mt_rand(100, 1024)),//随机生成100-1024位汉字,
                    'description' => getChar(mt_rand(8, 64)),//随机生成8-64位汉字,
                    'status'      => mt_rand(0, 1),
                ];
                $mysqlObject->insert('article', $data);
            }
            echo "协程$i 插入完成\n";
        }, -1);
    });
}

function getChar($num)  // $num为生成汉字的数量
{
    $b = '';
    for ($i = 0; $i < $num; $i++) {
        // 使用chr()函数拼接双字节汉字,前一个chr()为高位字节,后一个为低位字节
        $a = chr(mt_rand(0xB0, 0xD0)) . chr(mt_rand(0xA1, 0xF0));
        // 转码
        $b .= iconv('GB2312', 'UTF-8', $a);
    }
    return $b;
}

大概需要等半个小时左右才能插入好10W条(固态硬盘快的飞起,为了测试慢的情况,所以没用固态)

仙士可博客


好的,我们已经插入了10W条数据,现在是除了id都是没有索引的,我们先查询下user_id=200的数据:仙士可博客


可以看到,查询一次数据需要5秒左右,这个速度在线上网站是会造成服务器崩溃的,用户根本没法正常访问网站,

在这个时候,索引的优势就出来了,我们给user_id增加一个索引:

ALTER TABLE `article`
  ADD INDEX `index_user_id` (`user_id`) ;

由于数据量较大,第一次增加索引需要时间(索引时间根据字段基数,表数据大小而不同):

仙士可博客


我们再一次查询:

仙士可博客

很明显速度快了很多,索引在表数据越大的时候越能体现用处



索引类型

mysql的索引类型分为以下几种:

  1. 普通索引

  2. 组合索引

  3. 唯一索引

  4. 主键索引

  5. 全文索引

我们根据不同的业务需求,去使用不同的索引,提高查询速度.


普通索引

 普通索引,顾名思义,就是普通的索引,没有其他特性,直接创建就可以使用

组合索引

 组合索引是通过多个字段组合起来的索引,

主键索引

主键索引就是数据表的主键,主键是为了区分一个表中不同的数据列而产生的,

主键将确定表数据的实体,例如通过主键,我们才能定位到表数据的某一列,

如果一个表没有主键,那么这个表就没有什么意义,

主键可以是多个字段组成的,也可以是一个字段组成的,例如"id","member_name,member_code"等等,但一个表只能有一个主键,每个主键都是唯一的,不可能出现重复的字段


唯一索引

唯一索引增加了对索引值的约束,代表着该值只能出现一次,不能重复插入,

主键是特殊的唯一索引

唯一索引值可以为多个null,null代表没有存值,也就是null没有走索引


全文索引

全文索引是mysql的另一种技术

原理是先定义一个词库,然后在文章中查找每个词条(term)出现的频率和位置,把这样的频率和位置信息按照词库的顺序归纳,这样就相当于对文件建立了一个以词库为目录的索引,这样查找某个词的时候就能很快的定位到该词出现的位置。

本人不建议使用全文索引,请自行用php等分词技术做分词,并使用elasticsearch搜索引擎进行全文搜索







仙士可博客
请先登录后发表评论
  • 最新评论
  • 总共0条评论
  • 本站由白俊遥博客程序搭建
    © 2017-1-17 php20.cn 版权所有 ICP证:闽ICP备17001387号
  • 联系邮箱:1067197739@qq.com