資料庫實驗心得

sql server 會根據索引方式，最佳化成下面方式來執行。

select a.member_no,a.firstname,b.region_nofrom(select m.member_no, m.firstname from dbo.member as m where m.firstname like 'k%' and m.member_no < 5000) a , -- 這個查詢可以直接使用 memberfirstname 非聚集索引，而且這個非聚集索引覆蓋了所有查詢列-- 實際執行時，只需要邏輯讀取 3 次

(select m.member_no, m.region_no from dbo.member as mwhere m.region_no > 6) b

-- 這個查詢可以直接使用 member_region_link 非聚集索引，而且這個非聚集索引覆蓋了所有查詢列-- 實際執行時，只需要邏輯讀取 10 次

where a.member_no = b.member_no

不信，你可以看這兩個sql 的執行計畫，以及邏輯讀信息，都是一樣的。

其實上面的sql，如果最佳化成下面的方式，實際的邏輯讀消耗也是一樣的。為何sql server 不會最佳化成下面的方式。是因為 and 操作符最佳化的另外一個原則。

1/26 的數據和 1/6 的數據找交集的速度要比 1/52 的數據和 1/3 的數據找交集速度要慢。

select a.member_no,a.firstname,b.region_nofrom(select m.member_no, m.firstname from dbo.member as mwhere m.firstname like 'k%' -- 1/26 數據) a,

(select m.member_no, m.region_no from dbo.member as mwhere m.region_no > 6 and m.member_no < 5000-- 1/3 * 1/ 2 數據) bwhere a.member_no = b.member_no

當然，我們要學習sql 如何最佳化的話，就會用到查詢語句中的一個功能，指定查詢使用哪個索引來進行。

比如下面的查詢語句

select m.member_no, m.firstname, m.region_nofrom dbo.member as m with (index (0))where m.firstname like 'k%' and m.region_no > 6 and m.member_no < 5000go

select m.member_no, m.firstname, m.region_nofrom dbo.member as m with (index (1))where m.firstname like 'k%' and m.region_no > 6 and m.member_no < 5000goselect m.member_no, m.firstname, m.region_nofrom dbo.member as m with (index (membercovering3))where m.firstname like 'k%' and m.region_no > 6 and m.member_no < 5000goselect m.member_no, m.firstname, m.region_nofrom dbo.member as m with (index (memberfirstname, member_region_link))where m.firstname like 'k%' and m.region_no > 6 and m.member_no < 5000go

這裡 index 計算符可以是 0 ，1，指定的一個或者多個索引名字。對於 0 ，1 的意義如下：

如果存在聚集索引，則 index(0) 強制執行聚集索引掃描，index(1) 強制執行聚集索引掃描或查找（使用性能最高的一種）。

如果不存在聚集索引，則 index(0) 強制執行表掃描，index(1) 被解釋為錯誤。

總結知識點：

簡單來說，我們可以這么理解：sql server 對於每一條查詢語句。會根據實際索引情況（sysindexes 系統表中存儲這些信息），分析每種組合可能的成本。然後選擇它認為成本最小的一種。作為它實際執行的計畫。

成本代價計算的一個主要組成部分是邏輯i/o的數量，特別是對於單表的查詢。

and 操作要滿足所有條件，這樣，經常會要求對幾個數據集作交集。數據集越小，數據集的交集計算越節省成本。

第1頁第2頁第3頁