關系數據庫在表中表示組織的數據,這些表使用具有不同數據類型的列,允許它們存儲有效值。開發(fā)人員和DBA需要知道并理解每一列的適當數據類型,以獲得更好的查詢性能。
本文將討論流行的數據類型VARCHAR()和NVARCHAR()、它們的比較以及SQLServer 中的性能評估。
SQL中的VARCHAR[ ( n | max ) ]
該VARCHAR數據類型表示非Unicode可變長度的字符串的數據類型。您可以在其中存儲字母、數字和特殊字符。
N表示以字節(jié)為單位的字符串大小。
VARCHAR數據類型列最多可存儲8000個非Unicode字符。
VARCHAR數據類型每個字符占用1個字節(jié)。如果您沒有明確指定N的值,則它需要1個字節(jié)的存儲空間。
注意:不要將N與表示字符串中字符數的值混淆。
以下查詢使用100個字節(jié)的數據定義VARCHAR數據類型。
它返回長度為17,因為每個字符1個字節(jié),包括一個空格字符。
以下查詢定義了沒有任何N值的VARCHAR數據類型。因此,SQLServer 將默認值視為1個字節(jié),如下所示。
我們還可以通過CAST或CONVERT函數使用VARCHAR。例如,在下面的兩個示例中,我們聲明了一個長度為100字節(jié)的變量,然后使用了CAST運算符。
第一個查詢返回長度為30,因為我們沒有在CAST運算符VARCHAR數據類型中指定N。默認長度為30。
但是,如果字符串長度小于30,則取字符串的實際大小。
SQL中的NVARCHAR[ ( n | max ) ]
所述NVARCHAR數據類型是用于Unicode的可變長度的字符數據類型。這里,N指的是國家語言字符集,用于定義Unicode字符串。您可以存儲非Unicode和Unicode字符(日語漢字、韓文等)。
N表示以字節(jié)為單位的字符串大小。
它最多可以存儲4000個Unicode和非Unicode字符。
VARCHAR數據類型每個字符占用2個字節(jié)。如果不為N指定任何值,則需要2個字節(jié)的存儲空間。
以下查詢使用100個字節(jié)的數據定義VARCHAR數據類型。
它返回36的字符串長度,因為NVARCHAR每個字符存儲占用2個字節(jié)。
與VARCHAR數據類型類似,NVARCHAR也有1個字符(2個字節(jié))的默認值,而沒有為N指定顯式值。
如果我們使用CAST或CONVERT函數應用NVARCHAR轉換而沒有任何顯式N值,則默認值為30個字符,即60個字節(jié)。
以VARCHAR數據類型存儲Unicode和非Unicode值
假設我們有一個表,記錄來自電子購物門戶的客戶反饋。為此,我們有一個包含以下查詢的SQL表。
我們在這個表中插入幾個英語、日語和印地語的示例記錄。[Comment]的數據類型是VARCHAR,[NewComment]是NVARCHAR()。
查詢成功執(zhí)行,并在從中選擇一個值時給出以下行。對于第二和第三行,如果數據不是英語的,它就不能識別數據。
VARCHAR和NVARCHAR數據類型:性能比較
我們不應在JOIN或WHERE謂詞中混合使用VARCHAR和NVARCHAR數據類型。它使現(xiàn)有索引無效,因為SQLServer 要求JOIN兩側的數據類型相同。如果不匹配,SQLServer 會嘗試使用CONVERT_IMPLICIT()函數進行隱式轉換。
SQLServer 使用數據類型優(yōu)先級來確定目標數據類型。NVARCHAR的優(yōu)先級高于VARCHAR數據類型。因此,在數據類型轉換期間,SQLServer 會將現(xiàn)有的VARCHAR值轉換為NVARCHAR。
現(xiàn)在,讓我們執(zhí)行兩個SELECT語句,根據它們的數據類型檢索記錄。
這兩個查詢都使用索引查找運算符和我們之前定義的索引。
現(xiàn)在,我們切換數據類型值以與WHERE謂詞進行比較。第1列具有VARCHAR數據類型,但我們指定N'A'將其作為NVARCHAR數據類型。
類似地,col2是NVARCHAR數據類型,我們指定了引用VARCHAR數據類型的值“C”。
在查詢實際執(zhí)行計劃中,您得到一個索引掃描,SELECT語句有一個警告符號。
此查詢工作正常,因為NVARCHAR()數據類型可以同時具有Unicode和非Unicode值。
現(xiàn)在,第二個查詢使用索引掃描并在SELECT運算符上發(fā)出警告符號。
將鼠標懸停在發(fā)出有關隱式轉換的警告的SELECT語句上。SQLServer 無法正確使用現(xiàn)有索引。這是由于VARCHAR和NVARCHAR數據類型的數據排序算法不同。
如果表有數百萬行,SQLServer必須做額外的工作并使用隱式數據轉換來轉換數據。它可能會對您的查詢性能產生負面影響。因此,在優(yōu)化查詢時應避免混合和匹配這些數據類型。
結論
您應該在適當地設計數據庫表及其列數據類型時查看您的數據要求。通常,VARCHAR數據類型可以滿足您的大部分數據需求。但是,如果需要在列中同時存儲Unicode和非Unicode數據類型,則可以考慮使用NVARCHAR。但是,在做出最終決定之前,您應該查看其性能影響、存儲大小。
審核編輯 :李倩
-
數據庫
+關注
關注
7文章
3799瀏覽量
64389 -
函數
+關注
關注
3文章
4331瀏覽量
62618 -
數據類型
+關注
關注
0文章
236瀏覽量
13624
原文標題:SQL Server 中的VARCHAR和NVARCHAR數據類型
文章出處:【微信號:哲想軟件,微信公眾號:哲想軟件】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論