SQL数据类型

  |  

摘要: SQL 都有哪些数据类型

【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】
我的网站:潮汐朝夕的生活实验室
我的公众号:算法题刷刷
我的知乎:潮汐朝夕
我的github:FennelDumplings
我的leetcode:FennelDumplings


数据类型是定义列中【可以存储什么数据】以及【该数据实际怎样存储】的基本规则。

数据类型用于以下目的。

  • 数据类型允许限制可存储在列中的数据。例如,数值数据类型列只能接受数值。
  • 数据类型允许在内部更有效地存储数据。可以用一种比文本字符串更简洁的格式存储数值和日期时间值。
  • 数据类型允许变换排序顺序。如果所有数据都作为字符串处理,则 1 位于 10 之前,而 10 又位于 2 之前(字符串以字典顺序排序,从左边开始比较,一次一个字符)。作为数值数据类型,数值才能正确排序。

在设计表时,应该特别重视所用的数据类型。使用错误的数据类型可能会严重影响应用程序的功能和性能。更改包含数据的列不是一件小事(而且这样做可能会导致数据丢失)。

本文介绍主要的数据类型、用途、兼容性等问题。


1. 字符串数据类型

最常用的数据类型是字符串数据类型。它们存储字符串,如名字、地址、电话号码、邮政编码等。有两种基本的字符串类型,分别为定长字符串和变长字符串。

数据类型 说明
CHAR 1~255个字符的定长字符串。它的长度必须在创建时规定
NCHAR CHAR 的特殊形式,用来支持多字节或Unicode字符(此类型的不同实现变化很大)
TEXT (也称为 LONG 、 MEMO 变长文本或 VARCHAR ) 变长文本
NVARCHAR TEXT 的特殊形式,用来支持多字节或Unicode字符(此类型的不同实现变化很大)
  • 定长字符串: 接受长度固定的字符串,其长度是在创建表时指定的。例如,名字列可允许 30 个字符,而社会安全号列允许 11 个字符(允许的字符数目中包括两个破折号)。定长列不允许多于指定的字符数目。它们分配的存储空间与指定的一样多。因此,如果字符串 Ben 存储到 30 个字符的名字字段,则存储的是 30 个字符,缺少的字符用空格填充,或根据需要补为 NULL。
  • 变长字符串: 存储任意长度的文本(其最大长度随不同的数据类型和 DBMS 而变化)。有些变长数据类型具有最小的定长,而有些则是完全变长的。不管是哪种,只有指定的数据得以保存(额外的数据不保存)。

关于字符串数据类型的几个问题

(1) 为什么需要定长字符串

既然变长数据类型这样灵活,为什么还要使用定长数据类型?答案是性能。DBMS 处理定长列远比处理变长列快得多。此外,许多 DBMS 不允许对变长列(或一个列的可变部分)进行索引,这也会极大地影响性能。

(2) 字符串值必须用单引号

不管使用何种形式的字符串数据类型,字符串值都必须括在单引号内

(3) 数字字符串的用法

你可能会认为电话号码和邮政编码应该存储在数值字段中(数值字段只存储数值数据),但是这样做并不可取。如果在数值字段中存储邮政编码 01234,则保存的将是数值 1234,实际上丢失了一位数字。

关于数字字符串,需要遵守的基本规则是:如果数值是计算(求和、平均等)中使用的数值,则应该存储在数值数据类型列中;如果作为字符串(可能只包含数字)使用,则应该保存在字符串数据类型列中。


2. 数值数据类型

数值数据类型存储数值。多数 DBMS 支持多种数值数据类型, 每种存储的数值具有不同的取值范围。显然, 支持的取值范围越大, 所需存储空间越多。此外,有的数值数据类型支持使用十进制小数点(和小数), 而有的则只支持整数。

下表列出常用的数值数据类型,注意并非所有 DBMS 都支持所列出的名称约定和描述。

数据类型 说明
BIT 单个二进制位值,或者为0或者为1,主要用于开/关标志
DECIMAL (或 NUMERIC ) 定点或精度可变的浮点值
FLOAT (或 NUMBER ) 浮点值
INT (或 INTEGER ) 4字节整数值,支持2147483648~2147483647的数
REAL 4字节浮点值
SMALLINT 2字节整数值,支持32768~32767的数
TINYINT 1字节整数值,支持0~255的数

关于货币数据类型

多数 DBMS 支持一种用来存储货币值的特殊数值数据类型。一般记为 MONEYCURRENCY ,这些数据类型基本上是有特定取值范围的 DECIMAL 数据类型,更适合存储货币值。


3. 日期和时间数据类型

所有 DBMS 都支持用来存储日期和时间值的数据类型。与数值一样,多数 DBMS 都支持多种数据类型,每种具有不同的取值范围和精度。

数据类型 说明
DATE 日期值
DATETIME (或 TIMESTAMP ) 日期时间值
SMALLDATETIME 日期时间值,精确到分(无秒或毫秒)
TIME 时间值

关于日期的格式

不存在所有 DBMS 都理解的定义日期的标准方法。多数实现都理解诸如 2015-12-30 或 Dec 30th, 2015 等格式,但即使这样,有的 DBMS还是不理解它们。至于具体的 DBMS 能识别哪些日期格式,参阅相应的文档。

关于 ODBC 日期

因为每种 DBMS 都有自己特定的日期格式,所以 ODBC 创建了一种自己的格式,在使用 ODBC 时对每种数据库都起作用。ODBC 格式对于日期类似于 {d '2005-12-30'}, 对于时间类似于 {t '21:46:29'}, 而对于日期时间类似于 {ts '2005-12-30 21:46:29'}。如果通过 ODBC 使用 SQL, 应该以这种方式格式化日期和时间。


4. 二进制数据类型

二进制数据类型是最不具有兼容性(幸运的是,也是最少使用)的数据类型。与迄今为止介绍的所有数据类型(它们具有特定的用途)不一样,二进制数据类型可包含任何数据,甚至可包含二进制信息,如图像、多媒体、字处理文档等。

数据类型 说明
BINARY 定长二进制数据(最大长度从255B到8000B,有赖于具 体的实现)
LONG RAW 变长二进制数据,最长2 GB
RAW (某些实现为 BINARY ) 定长二进制数据,最多255B
VARBINARY 变长二进制数据(最大长度一般在255B到8000B间变 化,依赖于具体的实现)

Share