亚洲免费在线视频-亚洲啊v-久久免费精品视频-国产精品va-看片地址-成人在线视频网

您的位置:首頁技術(shù)文章
文章詳情頁

淺析SQL Server三大算法的I/O成本

瀏覽:145日期:2023-10-28 07:04:03

本文作者先對SQL Server三大算法的IO成本進(jìn)行分析,然后提出優(yōu)化原則。希望可以給讀者帶來幫助。

1. Nested Loop Join(嵌套循環(huán)聯(lián)結(jié))

算法:

其思路相當(dāng)?shù)暮唵魏椭苯樱簩τ陉P(guān)系R的每個(gè)元組 r 將其與關(guān)系S的每個(gè)元組 s 在JOIN條件的字段上直接比較并篩選出符合條件的元組。寫成偽代碼就是:

代價(jià):

被聯(lián)結(jié)的表所處內(nèi)層或外層的順序?qū)Υ疟PI/O開銷有著非常重要的影響。而CPU開銷相對來說影響較小,主要是元組讀入內(nèi)存以后(in-memory)的開銷,是 O (n * m)

對于I/O開銷,根據(jù) page-at-a-time 的前提條件,I/O cost = M + M * N,

翻譯一下就是 I/O的開銷 = 讀取M頁的I/O開銷 + M次讀取N頁的I/O開銷。

2. Sort-Merge Join (排序合并聯(lián)結(jié))

Nested Loop一般在兩個(gè)集合都很大的情況下效率就相當(dāng)差了,而Sort-Merge在這種情況下就比它要高效不少,尤其是當(dāng)兩個(gè)集合的JOIN字段上都有聚集索引(clustered index)存在時(shí),Sort-Merge性能將達(dá)到最好。

算法:

基本思路也很簡單(復(fù)習(xí)一下數(shù)據(jù)結(jié)構(gòu)中的合并排序吧),主要有兩個(gè)步驟:

a.按JOIN字段進(jìn)行排序

b.對兩組已排序集合進(jìn)行合并排序,從來源端各自取得數(shù)據(jù)列后加以比較(需要根據(jù)是否在JOIN字段有重復(fù)值做特殊的“分區(qū)”處理)

代價(jià):(主要是I/O開銷)

有兩個(gè)因素左右Sort-Merge的開銷:JOIN字段是否已排序 以及 JOIN字段上的重復(fù)值有多少。

◆最好情況下(兩列都已排序且至少有一列沒有重復(fù)值):O (n + m) 只需要對兩個(gè)集合各掃描一遍。(這里的m,n如果都能用到索引那就更好了)

◆最差情況下(兩列都未排序且兩列上的所有值都相同):O (n * log n + m * log m + n * m) 兩次排序以及一次全部元組間的笛卡爾乘積

3. Hash Join (哈希聯(lián)結(jié))

Hash Join在本質(zhì)上類似于兩列都有重復(fù)值時(shí)的Sort-Merge的處理思想——分區(qū)(patitioning)。但它們也有區(qū)別:Hash Join通過哈希來分區(qū)(每一個(gè)桶就是一個(gè)分區(qū))而Sort-Merge通過排序來分區(qū)(每一個(gè)重復(fù)值就是一個(gè)分區(qū))。

值得注意的是,Hash Join與上述兩種算法之間的較大區(qū)別同時(shí)也是一個(gè)較大限制是它只能應(yīng)用于等值聯(lián)結(jié)(equality join),這主要是由于哈希函數(shù)及其桶的確定性及無序性所導(dǎo)致的。

算法:

基本的Hash Join算法由以下兩步組成:

同nested loop,在執(zhí)行計(jì)劃中build input位于上方,probe input位于下方。

hash join操作分兩個(gè)階段完成:build(構(gòu)造)階段和probe(探測)階段。

a.Build Input Phase: 基于JOIN字段,使用哈希函數(shù)h2為較小的S集合構(gòu)建內(nèi)存中(in-memory)的哈希表,相同鍵值的以linked list組成一個(gè)桶(bucket)

b.Probe Input Phase: 在較大的R集合上對哈希表進(jìn)行核對以完成聯(lián)結(jié)。

代價(jià):

值得注意的是對于大集合R的每個(gè)元組 r ,hash bucket中對應(yīng) r 的那個(gè)bucket中的每個(gè)元組都需要與 r 進(jìn)行比較,這也是算法最耗時(shí)的地方所在。

CPU開銷是O (m + n * b) b是每個(gè)bucket的平均元組數(shù)量。

總結(jié):

三種join方法,都是擁有兩個(gè)輸入,優(yōu)化的基本原則:

1.避免大數(shù)據(jù)的hash join,(hash join適合低并發(fā)情況,他占用內(nèi)存和io是很大的);

2.盡量將其轉(zhuǎn)化為高效的merge join、nested loop join。可能使用的手段有表結(jié)構(gòu)設(shè)計(jì)、索引調(diào)整設(shè)計(jì)、SQL優(yōu)化,以及業(yè)務(wù)設(shè)計(jì)優(yōu)化。

標(biāo)簽: Sql Server 數(shù)據(jù)庫
主站蜘蛛池模板: 又黄又爽又刺激的视频 | 日本欧美一区二区三区在线 | 亚洲视频在线观看视频 | 毛片在线免费观看网站 | 男人的天堂欧美精品色偷偷 | 日韩黄色片在线观看 | aaa级精品久久久国产片 | 亚洲午夜在线 | 久久精品国产精品亚洲综合 | 国产一区二区三区久久精品小说 | 性做久久久久免费看 | 小明台湾成人永久免费看看 | 国产成人综合日韩精品无 | 日韩欧美~中文字幕 | 日韩欧美不卡在线 | 99久久精品免费看国产高清 | 国产高清在线不卡 | 日产国产精品久久久久久 | 欧美亚洲欧美区 | 加勒比在线免费视频 | 大尺度福利视频奶水在线 | 天堂8中文在线最新版在线 天堂8资源8在线 | 老外一级毛片免费看 | 亚洲综合第一页 | 亚洲精品一区专区 | 普通话对白国产情侣自啪 | 自拍偷在线精品自拍偷无码专区 | 精品视频久久久久 | 武松金莲肉体交战在线观看 | 成年人在线视频 | 国产精品永久免费自在线观看 | 国产亚洲精品午夜高清影院 | 九九视频免费精品视频免费 | 国产精品亚洲精品一区二区三区 | 久久久久欧美情爱精品 | 精品区 | 欧美日韩亚洲国产 | 国产精品一区二区免费 | a毛片a毛片a视频 | 亚洲精品tv久久久久 | 超矿碰人人超人人看 |