色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

MySQL Group by的優化詳解

瀏覽:30日期:2023-10-05 09:58:31

一個標準的 Group by 語句包含排序、分組、聚合函數,比如 select a,count(*) from t group by a ; 這個語句默認使用 a 進行排序。如果 a 列沒有索引,那么就會創建臨時表來統計 a和 count(*),然后再通過 sort_buffer 按 a 進行排序。

標準的執行流程

結構:

create table t1(id int primary key, a int, b int, index(a));delimiter ;;create procedure idata()begin declare i int; set i=1; while(i<=1000)do insert into t1 values(i, i, i); set i=i+1; end while;end;;delimiter ;call idata();

函數就是向 t1 中插入1000條語句,從(1,1,1) 到(1000,1000,1000)。

執行 select id%10 as m, count(*) as c from t1 group by m;

解析:

MySQL Group by的優化詳解

Using index,表示這個語句使用了覆蓋索引,選擇了索引 a,不需要回表;Using temporary,表示使用了臨時表;Using filesort,表示需要排序。

過程:

1、創建內存臨時表,表里有兩個字段 m 和 c,主鍵是 m;2、掃描表 t1 的索引 a,依次取出葉子節點上的 id 值,計算 id%10 的結果,記為 x;1)如果臨時表中沒有主鍵為 x 的行,就插入一個記錄 (x,1);2)如果表中有主鍵為 x 的行,就將 x 這一行的 c 值加 1;

第2 步如果發現內存臨時表存儲的總字段長度到達參數 tmp_table_size 設置的大小,那么就會將內存臨時表升級為磁盤臨時表,然后重新開始遍歷計算。3、遍歷完成后,再根據字段 m 做排序,得到結果集返回給客戶端。

MySQL Group by的優化詳解

最后的排序就是下圖虛線框中的操作,如果 sort_buffer 設置的大小不夠大,那么就會使用臨時表來輔助排序。

MySQL Group by的優化詳解

優化

未優化(也就是分組列沒有索引)的 group by 的總過程可以概括為:因為數據是無序的,所以需要創建臨時表,然后一個一個判斷屬于哪個分組,最后再根據分組列進行排序。所以,優化可以有兩個思路:

去掉排序

在明確返回的數據不需要排序的情況下,可以禁止排序,也就是將上面的語句改成 select a,count(*) from t group by a order by null。

順序排列

如果記錄都按照排序字段排序,那么數據就變成了下面的結構:

MySQL Group by的優化詳解

這樣在實際獲取要返回的字段或計算聚合函數時,只需要按順序依次訪問,等到列值變成下一個就知道當前組訪問結束,將之前統計的數據直接返回。這樣就避免了創建臨時表,同時排序也不需要使用 sort_buffer 進行額外排序。這樣就極大地提高了執行的效率。

實現

1、如果分組字段適合創建索引就直接為分組字段創建索引。

MySQL 5.7 版本支持了 generated column 機制,用來實現列數據的關聯更新。你可以用下面的方法創建一個列 z,然后在 z 列上創建一個索引(如果是 MySQL 5.6 及之前的版本,你也可以創建普通列和索引,來解決這個問題)

alter table t1 add column z int generated always as(id % 100), add index(z);

然后解析:

MySQL Group by的優化詳解

這時沒有用到臨時表和額外排序,所以性能提升。

2、如果分組字段不適合(使用率很低),那么可以使用 SQL_BIG_RESULT 來嘗試優化。

在 group by 語句中加入 SQL_BIG_RESULT 這個提示(hint),就可以告訴優化器:這個語句涉及的數據量很大,請直接用磁盤臨時表。MySQL 的優化器一看,磁盤臨時表是 B+ 樹存儲,存儲效率不如數組來得高。所以,既然使用SQL_BIG_RESULT來說明數據量很大,那從磁盤空間考慮,還是直接用數組來存吧。所以在使用 SQL_BIG_RESULT 后優化器會使用數組結構的磁盤臨時表。

但是如果在未達到磁盤臨時表的使用條件是不會使用磁盤臨時表的,也就是在 sort_buffer 空間能夠存儲要返回和排序的總字段長度時,就使用數組結構的 sort_buffer ,如果總字段超過 sort_buffer 大小,那么就再加上數組結構的磁盤臨時表來幫助排序。

那么在 sort_buffer 空間足夠的情況下, sort_buffer 內部就會對數據進行排序,這樣也就起到了索引的作用,

還是以上面的例子來看,使用 SQL_BIG_RESULT

alter table t1 add column z int generated always as(id % 100), add index(z);

具體過程如下:

1、初始化 sort_buffer,確定放入一個整型字段,記為 m;2、掃描表 t1 的索引 a,依次取出里面的 id 值, 將 id%10 的值存入 sort_buffer 中;3、掃描完成后,對 sort_buffer 的字段 m 做排序(如果 sort_buffer 內存不夠用,就會利用磁盤臨時文件輔助排序);4、排序完成后,就得到了一個有序數組。

MySQL Group by的優化詳解

解析:

MySQL Group by的優化詳解

可以看到此時就沒有使用臨時表了,而是直接使用 sort_buffer 進行排序,這樣就省去了使用臨時表帶來的性能消耗。

總結

1、如果對 group by 語句的結果沒有排序要求,要在語句后面加 order by null;那么一般情況就不需要使用臨時表了(上面兩個優化都是在要求排序的前提下提出的優化方式)2、盡量讓 group by 過程用上表的索引,確認方法是 explain 結果里沒有 Using temporary 和 Using filesort;3、如果 group by 需要統計的數據量不大,盡量只使用內存臨時表;也可以通過適當調大 tmp_table_size 參數,來避免用到磁盤臨時表;4、如果數據量實在太大,使用 SQL_BIG_RESULT 這個提示,來告訴優化器直接使用排序算法得到 group by 的結果。

以上就是詳解MySQL Group by 優化的詳細內容,更多關于MySQL Group by 優化的資料請關注好吧啦網其它相關文章!

標簽: MySQL 數據庫
相關文章:
主站蜘蛛池模板: a级黄色毛片免费播放视频 a级精品九九九大片免费看 | 中文字幕在线欧美 | 久久久久久毛片免费播放 | 国产手机视频 | 亚洲成人高清在线观看 | 男女男精品视频免费观看 | 久久精品视频2 | 成人在线黄色 | 亚洲一区二区视频 | 国产亚洲精品一区二区久久 | 久久综合精品视频 | 久久精品国产免费高清 | 精品视频国产狼人视频 | 欧美在线观看视频一区 | 欧美成人二区 | 2021精品国产品免费观看 | 国产亚洲精品hd网站 | 91久久国产综合精品 | 黄色美女网站免费 | 特黄特黄 | 日本三片在在线播放 | 伊人五月天婷婷琪琪综合 | 一本色道久久88亚洲综合 | 国产盗摄一区二区三区 | 日韩在线观看中文字幕 | 一级毛片a免费播放王色 | 亚洲精品美女国产一区 | 先锋影音xfyy5566男人资源 | 草久久免费视频 | 亚洲qingse中文久久网 | 亚洲三级在线播放 | 久久精品视频一区二区三区 | 欧美日韩 国产区 在线观看 | 欧美一级专区免费大片野外交 | 国产午夜精品一区二区 | 亚洲人成网7777777国产 | 国产乱码一区二区三区四 | 亚洲欧美7777 | 欧美国产成人精品一区二区三区 | 在线国产日韩 | 成人一级黄色毛片 |