0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

淺談SQL優(yōu)化小技巧

京東云 ? 來源:京東零售 王軍 ? 作者:京東零售 王軍 ? 2024-12-25 09:59 ? 次閱讀

作者:京東零售 王軍

回顧:MySQL的執(zhí)行過程回顧 MySQL的執(zhí)行過程,幫助 介紹 如何進行sql優(yōu)化。

(1)客戶端發(fā)送一條查詢語句到服務器;

(2)服務器先查詢緩存,如果命中緩存,則立即返回存儲在緩存中的數(shù)據(jù);

(3)未命中緩存后,MySQL通過關鍵字將SQL語句進行解析,并生成一顆對應的解析樹,MySQL解析器將使用MySQL語法進行驗證和解析。

例如,驗證是否使用了錯誤的關鍵字,或者關鍵字的使用是否正確;

(4)預處理是根據(jù)一些MySQL規(guī)則檢查解析樹是否合理,比如檢查表和列是否存在,還會解析名字和別名,然后預處理器會驗證權限;

根據(jù)執(zhí)行計劃查詢執(zhí)行引擎,調(diào)用API接口調(diào)用存儲引擎來查詢數(shù)據(jù);

(5)將結果返回客戶端,并進行緩存;

SQL語句性能優(yōu)化常用策略

1、 為 WHERE 及 ORDER BY 涉及的列上建立索引

對查詢進行優(yōu)化,應盡量避免全表掃描,首先應考慮在 WHERE 及 ORDER BY 涉及的列上建立索引。

2、where中使用默認值代替null應盡量避免在 WHERE 子句中對字段進行 NULL 值判斷,創(chuàng)建表時 NULL 是默認值,但大多數(shù)時候應該使用 NOT NULL,或者使用一個特殊的值,如 0,-1 作為默認值。

為啥建議where中使用默認值代替null,四個原因:

(1)并不是說使用了is null或者 is not null就會不走索引了,這個跟mysql版本以及查詢成本都有關;

(2)如果mysql優(yōu)化器發(fā)現(xiàn),走索引比不走索引成本還要高,就會放棄索引,這些條件 !=,<>,is null,is not null經(jīng)常被認為讓索引失效;

(3)其實是因為一般情況下,查詢的成本高,優(yōu)化器自動放棄索引的;

(4)如果把null值,換成默認值,很多時候讓走索引成為可能,同時,表達意思也相對清晰一點;

3、慎用 != 或 <> 操作符。MySQL 只有對以下操作符才使用索引:<,<=,=,>,>=,BETWEEN,IN,以及某些時候的 LIKE。

所以:應盡量避免在 WHERE 子句中使用 != 或 <> 操作符, 會導致全表掃描。

4、慎用 OR 來連接條件使用or可能會使索引失效,從而全表掃描;

應盡量避免在 WHERE 子句中使用 OR 來連接條件,否則將導致引擎放棄使用索引而進行全表掃描,

可以使用 UNION 合并查詢:

select id from t where num=10

union all

select id from t where num=20

一個關鍵的問題是否用到索引。他們的速度只同是否使用索引有關,如果查詢需要用到聯(lián)合索引,用 UNION all 執(zhí)行的效率更高。多個 OR 的字句沒有用到索引,改寫成 UNION 的形式再試圖與索引匹配。

5、慎用 IN 和 NOT IN

IN 和 NOT IN 要慎用,否則會導致全表掃描。對于連續(xù)的數(shù)值,能用 BETWEEN 就不要用 IN:select id from t where num between 1 and 3。

6、慎用 左模糊like ‘%…’模糊查詢,程序員最喜歡的就是使用like,like很可能讓索引失效。

比如:

select id from t where name like‘%abc%’ select id from t where name like‘%abc’ 而select id from t where name like‘a(chǎn)bc%’才用到索引。

所以:

首先盡量避免模糊查詢,如果必須使用,不采用全模糊查詢,也應盡量采用右模糊查詢, 即like ‘…%’,是會使用索引的; 左模糊like ‘%…’無法直接使用索引,但可以利用reverse + function index的形式,變化成 like ‘…%’; 全模糊查詢是無法優(yōu)化的,一定要使用的話建議使用搜索引擎,比如 ElasticSearch。 備注:如果一定要用左模糊like ‘%…’檢索, 一般建議 ElasticSearch+Hbase架構

7、WHERE條件使用參數(shù)會導致全表掃描。如下面語句將進行全表掃描:

select id from t where num=@num

因為SQL只有在運行時才會解析局部變量,但優(yōu)化程序不能將訪問計劃的選擇推 遲到 運行時;

它必須在編譯時進行選擇。然而,如果在編譯時建立訪問計劃,變量的值還是未知的,因而無法作為索引選擇的輸入項。

所以, 可以改為強制查詢使用索引:

select id from t with(index(索引名)) where num=@num

8、用 EXISTS 代替 IN 是一個好的選擇很多時候用exists 代替in 是一個好的選擇:

select num from a where num in(select num from b) 用下面的語句替換: select num from a where exists(select 1 from b where num=a.num)

9、索引并不是越多越好索引固然可以提高相應的 SELECT 的效率,但同時也降低了 INSERT 及 UPDATE 的效。

因為 INSERT 或 UPDATE 時有可能會重建索引,所以怎樣建索引需要慎重考慮,視具體情況而定。

一個表的索引數(shù)最好不要超過 6 個,若太多則應考慮一些不常使用到的列上建的索引是否有必要。

10、盡量使用數(shù)字型字段(1)因為引擎在處理查詢和連接時會逐個比較字符串中每一個字符;

(2)而對于數(shù)字型而言只需要比較一次就夠了;

(3)字符會降低查詢和連接的性能,并會增加存儲開銷;

所以:盡量使用數(shù)字型字段,若只含數(shù)值信息的字段盡量不要設計為字符型,這會降低查詢和連接的性能,并會增加存儲開銷。

11、盡可能的使用 varchar, nvarchar 代替 char, nchar(1)varchar變長字段按數(shù)據(jù)內(nèi)容實際長度存儲,存儲空間小,可以節(jié)省存儲空間;

(2)char按聲明大小存儲,不足補空格;

(3)其次對于查詢來說,在一個相對較小的字段內(nèi)搜索,效率更高;

因為首先變長字段存儲空間小,可以節(jié)省存儲空間,其次對于查詢來說,在一個相對較小的字段內(nèi)搜索效率顯然要高些。

14、查詢SQL盡量不要使用select ,而是具體字段 最好不要使用返回所有:select * from t ,用具體的字段列表代替 “”,不要返回用不到的任何字段。

select *的弊端:

(1)增加很多不必要的消耗,比如CPU、IO、內(nèi)存、網(wǎng)絡帶寬;

(2)增加了使用覆蓋索引的可能性;

(3)增加了回表的可能性;

(4)當表結構發(fā)生變化時,前端也需要更改;

(5)查詢效率低;

15、將需要查詢的結果預先計算好將需要查詢的結果預先計算好放在表中,查詢的時候再Select,而不是查詢的時候進行計算。

16、IN后出現(xiàn)最頻繁的值放在最前面如果一定用IN,那么:

在IN后面值的列表中,將出現(xiàn)最頻繁的值放在最前面,出現(xiàn)得最少的放在最后面,減少判斷的次數(shù)。

17、盡量使用 EXISTS 代替 select count(1) 來判斷是否存在記錄。count 函數(shù)只有在統(tǒng)計表中所有行數(shù)時使用,而且 count(1) 比 count(*) 更有效率。

18、用批量插入或批量更新當有一批處理的插入或更新時,用批量插入或批量更新,絕不會一條條記錄的去更新。

(1)多條提交

INSERT INTO user (id,username) VALUES(1,'xx'); INSERT INTO user (id,username) VALUES(2,'yy');

(2)批量提交

INSERT INTO user (id,username) VALUES(1,'xx'),(2,'yy'); 默認新增SQL有事務控制,導致每條都需要事務開啟和事務提交,而批量處理是一次事務開啟和提交,效率提升明顯,達到一定量級,效果顯著,平時看不出來。

19、將不需要的記錄在 GROUP BY 之前過濾掉提高 GROUP BY 語句的效率,可以通過將不需要的記錄在 GROUP BY 之前過濾掉。

下面兩個查詢返回相同結果,但第二個明顯就快了許多。

低效:

SELECT JOB, AVG(SAL) FROM EMP GROUP BY JOB HAVING JOB = 'PRESIDENT' OR JOB = 'MANAGER' 高效:

SELECT JOB, AVG(SAL) FROM EMP WHERE JOB = 'PRESIDENT' OR JOB = 'MANAGER' GROUP BY JOB

20、避免死鎖,在你的存儲過程和觸發(fā)器中訪問同一個表時總是以相同的順序;事務應經(jīng)可能地縮短,在一個事務中應盡可能減少涉及到的數(shù)據(jù)量;永遠不要在事務中等待用戶輸入。

21、索引創(chuàng)建規(guī)則:表的主鍵、外鍵必須有索引; 數(shù)據(jù)量超過 300 的表應該有索引; 經(jīng)常與其他表進行連接的表,在連接字段上應該建立索引; 經(jīng)常出現(xiàn)在 WHERE 子句中的字段,特別是大表的字段,應該建立索引; 索引應該建在選擇性高的字段上; 索引應該建在小字段上,對于大的文本字段甚至超長字段,不要建索引; 復合索引的建立需要進行仔細分析,盡量考慮用單字段索引代替; 正確選擇復合索引中的主列字段,一般是選擇性較好的字段; 復合索引的幾個字段是否經(jīng)常同時以 AND 方式出現(xiàn)在 WHERE 子句中?單字段查詢是否極少甚至沒有?如果是,則可以建立復合索引;否則考慮單字段索引; 如果復合索引中包含的字段經(jīng)常單獨出現(xiàn)在 WHERE 子句中,則分解為多個單字段索引; 如果復合索引所包含的字段超過 3 個,那么仔細考慮其必要性,考慮減少復合的字段; 如果既有單字段索引,又有這幾個字段上的復合索引,一般可以刪除復合索引; 頻繁進行數(shù)據(jù)操作的表,不要建立太多的索引; 刪除無用的索引,避免對執(zhí)行計劃造成負面影響; 表上建立的每個索引都會增加存儲開銷,索引對于插入、刪除、更新操作也會增加處理上的開銷。另外,過多的復合索引,在有單字段索引的情況下,一般都是沒有存在價值的;相反,還會降低數(shù)據(jù)增加刪除時的性能,特別是對頻繁更新的表來說,負面影響更大。 盡量不要對數(shù)據(jù)庫中某個含有大量重復的值的字段建立索引。

22、在寫 SQL 語句時,應盡量減少空格的使用查詢緩沖并不自動處理空格,因此,在寫 SQL 語句時,應盡量減少空格的使用,尤其是在 SQL 首和尾的空格(因為查詢緩沖并不自動截取首尾空格)。

23、每張表都設置一個 ID 做為其主鍵我們應該為數(shù)據(jù)庫里的每張表都設置一個 ID 做為其主鍵,而且最好的是一個 INT 型的(推薦使用 UNSIGNED),并設置上自動增加的 AUTO_INCREMENT 標志。

24、使用explain分析你SQL執(zhí)行計劃(1)type

system:表僅有一行,基本用不到; const:表最多一行數(shù)據(jù)配合,主鍵查詢時觸發(fā)較多; eq_ref:對于每個來自于前面的表的行組合,從該表中讀取一行。這可能是最好的聯(lián)接類型,除了const類型; ref:對于每個來自于前面的表的行組合,所有有匹配索引值的行將從這張表中讀??; range:只檢索給定范圍的行,使用一個索引來選擇行。當使用=、<>、>、>=、<、<=、IS NULL、<=>、BETWEEN或者IN操作符,用常量比較關鍵字列時,可以使用range; index:該聯(lián)接類型與ALL相同,除了只有索引樹被掃描。這通常比ALL快,因為索引文件通常比數(shù)據(jù)文件??; all:全表掃描; 性能排名:system > const > eq_ref > ref > range > index > all。 實際sql優(yōu)化中,最后達到ref或range級別。 (2)Extra常用關鍵字

Using index:只從索引樹中獲取信息,而不需要回表查詢; Using where:WHERE子句用于限制哪一個行匹配下一個表或發(fā)送到客戶。除非你專門從表中索取或檢查所有行,如果Extra值不為Using where并且表聯(lián)接類型為ALL或index,查詢可能會有一些錯誤。需要回表查詢。 Using temporary:mysql常建一個臨時表來容納結果,典型情況如查詢包含可以按不同情況列出列的GROUP BY和ORDER BY子句時;

25、當只要一行數(shù)據(jù)時使用 LIMIT 1 :當你查詢表的有些時候,你已經(jīng)知道結果只會有一條結果,但因為你可能需要去fetch游標,或是你也許會去檢查返回的記錄數(shù)。

在這種情況下,加上 LIMIT 1 可以增加性能。

這樣一來,MySQL 數(shù)據(jù)庫引擎會在找到一條數(shù)據(jù)后停止搜索,而不是繼續(xù)往后查少下一條符合記錄的數(shù)據(jù)。

26、將大的DELETE,UPDATE、INSERT 查詢變成多個小查詢能寫一個幾十行、幾百行的SQL語句是不是顯得逼格很高?然而,為了達到更好的性能以及更好的數(shù)據(jù)控制,你可以將他們變成多個小查詢。

27、合理分表 盡量控制單表數(shù)據(jù)量的大小,建議控制在500萬以內(nèi)500萬并不是MySQL數(shù)據(jù)庫的限制,過大會造成修改表結構,備份,恢復都會有很大的問題。

可以用歷史數(shù)據(jù)歸檔(應用于日志數(shù)據(jù)),分庫分表(應用于業(yè)務數(shù)據(jù))等手段來控制數(shù)據(jù)量大小。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SQL
    SQL
    +關注

    關注

    1

    文章

    764

    瀏覽量

    44127
  • MySQL
    +關注

    關注

    1

    文章

    809

    瀏覽量

    26558
收藏 人收藏

    評論

    相關推薦

    數(shù)據(jù)庫SQL優(yōu)化

    數(shù)據(jù)庫執(zhí)行SQL都會先進行語義解析,然后將SQL分成一步一步可執(zhí)行的計劃,然后逐步執(zhí)行。通過分析執(zhí)行計劃,我們可以清晰的看到數(shù)據(jù)庫執(zhí)行的操作,這對于數(shù)據(jù)庫SQL優(yōu)化具有重大意義。 1
    的頭像 發(fā)表于 10-09 15:43 ?1050次閱讀
    數(shù)據(jù)庫<b class='flag-5'>SQL</b>的<b class='flag-5'>優(yōu)化</b>

    MySQL的執(zhí)行過程 SQL語句性能優(yōu)化常用策略

    回顧 MySQL 的執(zhí)行過程,幫助介紹如何進行 sql 優(yōu)化
    的頭像 發(fā)表于 12-12 10:26 ?661次閱讀
    MySQL的執(zhí)行過程 <b class='flag-5'>SQL</b>語句性能<b class='flag-5'>優(yōu)化</b>常用策略

    Spark SQL的工作原理和性能優(yōu)化

    Spark SQL(九):工作原理和性能優(yōu)化
    發(fā)表于 06-12 16:21

    30種SQL語句優(yōu)化總結

    必須掌握的30種SQL語句優(yōu)化
    發(fā)表于 04-21 11:38

    數(shù)據(jù)庫設計及開發(fā)規(guī)范之sql性能優(yōu)化

    數(shù)據(jù)庫設計及開發(fā)規(guī)范,sql性能優(yōu)化
    發(fā)表于 05-08 10:58

    SQL語句怎么優(yōu)化

    SQL語句優(yōu)化——結合書籍論壇小結
    發(fā)表于 06-14 14:46

    內(nèi)存條配置優(yōu)化SQL Server服務器性能

    內(nèi)存條配置優(yōu)化SQL Server服務器性能  Microsoft SQL Server 2000 的 內(nèi)存管理組件消除了對 SQL Server 可用的內(nèi)存進行手工管理的需要。
    發(fā)表于 01-11 11:00 ?1064次閱讀

    PCB優(yōu)化設計淺談

    PCB優(yōu)化設計淺談,如題。
    發(fā)表于 12-16 21:20 ?0次下載

    SQL后悔藥,SQL性能優(yōu)化SQL規(guī)范優(yōu)雅

    每一個好習慣都是一筆財富,本文基于MySQL,分SQL后悔藥, SQL性能優(yōu)化,SQL規(guī)范優(yōu)雅三個方向,分享寫SQL的21個好習慣,謝謝閱讀
    的頭像 發(fā)表于 11-14 09:54 ?1831次閱讀

    30種SQL語句優(yōu)化方法

    SQL查詢中為了提高查詢效率,我們常常會采取一些措施對查詢語句進行SQL優(yōu)化,下面總結一些方法,供大家參考。 01 對查詢進行優(yōu)化,應盡量避免全表掃描,首先應考慮在 where 及
    的頭像 發(fā)表于 11-19 16:05 ?1999次閱讀

    SQL子查詢優(yōu)化是怎么回事

    子查詢 (Subquery)的優(yōu)化一直以來都是 SQL 查詢優(yōu)化中的難點之一。 關聯(lián)子查詢的基本執(zhí)行方式類似于 Nested-Loop,但是這種執(zhí)行方式的效率常常低到難以忍受。 當數(shù)據(jù)量稍大時,必須
    的頭像 發(fā)表于 02-01 13:55 ?2052次閱讀
    <b class='flag-5'>SQL</b>子查詢<b class='flag-5'>優(yōu)化</b>是怎么回事

    SQL優(yōu)化技巧分享

    一、查詢SQL盡量不要使用select *,而是具體字段
    的頭像 發(fā)表于 09-06 10:24 ?1413次閱讀

    sql優(yōu)化常用的幾種方法

    前言 1.慢SQL優(yōu)化思路。 1.1 慢查詢?nèi)罩居涗浡?b class='flag-5'>SQL 1.2 explain查看分析SQL的執(zhí)行計劃 1.3 profile 分析執(zhí)行耗時 1.4 Optimizer Trac
    的頭像 發(fā)表于 11-14 15:04 ?5062次閱讀

    一文終結SQL子查詢優(yōu)化

    子查詢(Subquery)的優(yōu)化一直以來都是 SQL 查詢優(yōu)化中的難點之一。關聯(lián)子查詢的基本執(zhí)行方式類似于 Nested-Loop,但是這種執(zhí)行方式的效率常常低到難以忍受。
    的頭像 發(fā)表于 04-28 14:19 ?760次閱讀
    一文終結<b class='flag-5'>SQL</b>子查詢<b class='flag-5'>優(yōu)化</b>

    Oracle長耗時SQL優(yōu)化案例

    最近在生產(chǎn)客服平臺,運營崗老師反饋,一個2w人的企業(yè),在信息詳情查詢時,加載時間過長,越70s左右出結果,需要后臺優(yōu)化SQL。
    的頭像 發(fā)表于 05-19 15:02 ?1028次閱讀