Microsoft SQL Server 生成随机数字、字符串、日期、验证码以及 UUID

作者: 不剪发的Tony老师
毕业于北京航空航天大学,十多年数据库管理与开发经验,目前在一家全球性的金融公司从事数据库架构设计。CSDN学院签约讲师以及GitChat专栏作者。csdn上的博客收藏于以下地址:https://tonydong.blog.csdn.net


文章目录

        生成随机数字
            生成 0 到 1 之间的随机数
            生成指定范围内的随机数
            生成 6 位数字手机验证码
            生成遵循正态分布的随机数
        生成随机字符串
            生成固定长度的随机字符串
            生成可变长度的随机字符串
        生成随机日期和时间
        生成 UUID
        获取表中的随机记录
        总结

大家好,我是只谈技术不剪发的 Tony 老师。

随机数对于我们而言并不陌生,例如手机短信验证码就是一个随机的数字字符串;对于统计分析、机器学习等领域而言,通常也需要生成大量的随机数据用于测试、数据抽样、算法验证等。那么今天我们就来介绍一下如何在 Microsoft SQL Server 中生成随机数据,包括随机数字、验证码、随机字符串以及随机日期和时间等。

如果觉得文章有用,欢迎评论📝、点赞👍、推荐🎁

    📝计算机生成的都是伪随机数,并不是真正的物理随机数。

生成随机数字
生成 0 到 1 之间的随机数

Microsoft SQL Server 提供了内置的RAND()函数,可以用于生成一个大于 0 小于 1 的随机数字。例如:

SELECT RAND() AS rd;
rd                |
------------------|
0.8186902226508435|

SELECT RAND() AS rd;
rd                |
------------------|
0.7467745597058656|



该函数返回的数据类型为 float,每次调用都会返回不同的结果。

如果想要重现某些场景,需要确保每次运行时生成相同的随机数。这种情况下可以为 RAND 函数传递一个输入参数,设置一个随机数种子。例如:

SELECT RAND(1) AS rd;
rd                |
------------------|
0.7135919932129235|

SELECT RAND(1) AS rd;
rd                |
------------------|
0.7135919932129235|


从结果可以看出,设置相同的种子之后,函数返回了相同的随机数。
生成指定范围内的随机数

基于 RAND() 函数和一些运算,就可以返回任意两个数字之间的随机数:

low + RAND() * (high - low)



以上表达式将会返回一个大于 low,小于 high 的随机数。例如:

SELECT 10 + RAND() * 10 AS rd;
rd               |
-----------------|
13.43443392823765|



以上示例返回了一个大于 10 且小于 20 的随机数字。

如果想要生成某个范围内的随机整数,可以加上 FLOOR 函数。例如:

SELECT FLOOR(10 + RAND() * 10) AS rd;
rd  |
----|
17.0|



该语句返回了一个大于等于 10,小于(不等于)20的随机整数。
生成 6 位数字手机验证码

我们已经知道了如何获取指定范围内的随机数,再加上字符串格式化就可以生成由 6 位数字字符组成的手机验证码。例如:

SELECT RIGHT(CONCAT('000000',FLOOR(RAND()* 1000000)),6) AS captcha;
captcha|
-------|
925656 |



CONCAT 函数可以确保数据不够 6 位时在前面补足 0,然后通过 RIGHT 函数返回右侧的 6 个数字。
生成遵循正态分布的随机数

RAND 函数生成的是一个遵循均匀分布的随机数,Microsoft SQL Server没有提供生成遵循正态分布(normal distribution)的随机数。我们可以模拟生成遵循正态分布的随机数:

SELECT (sqrt(-2 * log(rand())) * cos(2 * pi() * rand())) * @stdev + @mean;



以上查询利用 Box-Muller 变换算法通过两个平均分布的随机数生成正态分布的随机数,@stdev 是标准差,@mean 是均值。例如,以下查询生成了一个均值为 0,标准差为 1 的正态分布随机数:

SELECT (sqrt(-2 * log(rand())) * cos(2 * pi() * rand())) * 1 + 0 AS rd;
rd                 |
-------------------|
-0.4356079973405327|



我们可以验证一下这种方式生成的随机数是否遵循正态分布,例如:

CREATE TABLE #t(val float);

BEGIN   
  DECLARE @counter INT = 1

  WHILE @counter <= 1000000
  BEGIN
    INSERT INTO #t
    SELECT (sqrt(-2 * log(rand())) * cos(2 * pi() * rand())) * 1 + 0
    SET @counter = @counter + 1
  END
 
END;

SELECT avg(val) avg, stdev(val) stdev FROM #t;
avg               |stdev             |
------------------|------------------|
0.0009166176910995|1.0014773595001807|



通过运行 1000000 次计算,这些数据的平均值和标准差非常接近 0 和 1。
生成随机字符串
生成固定长度的随机字符串

除了随机数字之外,有时候我们也需要生成一些随机的字符串。Microsoft SQL Server 没有提供专门生成随机字符串的函数,但是可以通过其他函数进行模拟。例如:

SELECT CHAR(RAND() * 26 + 65) ch;
ch|
--|
D |



以上查询返回了一个随机的大写字母,CHAR 函数用于将 ASCII 编码转换为对应的字符。我们可以基于该查询进一步创建一个存储函数:

CREATE VIEW v_rand
AS
SELECT RAND() AS val;

CREATE OR ALTER FUNCTION rand_num(@n INT)
RETURNS INT
AS BEGIN
    SELECT @n=@n * val FROM v_rand
    RETURN @n
END;

CREATE OR ALTER FUNCTION random_string(
  @num INT,
  @chars VARCHAR(1024) = '0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz'
) RETURNS VARCHAR(1024)
AS
BEGIN
  DECLARE @res_str VARCHAR(1024) = ''
  DECLARE @i INT=0

  WHILE(@i<@num)BEGIN
        SET @res_str = @res_str + SUBSTRING(@chars, FLOOR(dbo.rand_num(len(@chars))) + 1, 1)
        SET @i = @i + 1
  END
 
  RETURN @res_str
END;



random_string 函数可以返回由指定字符(默认为所有数字、大小写字母)组成的随机字符串。例如:

SELECT dbo.random_string(10,DEFAULT) AS rs;
rs        |
----------|
3CBFEPKYTd|



以上示例返回了一个由字母和数字组成、长度为 10 的随机字符串。以下语句也可以用于返回一个 6 位随机数字组成的手机验证码:

SELECT random_string(6, '0123456789');
random_string|
-------------|
082661       |



生成可变长度的随机字符串

那么,怎么返回一个长度可变的随机字符串呢?很简单,为 random_string 函数指定一个随机的长度参数即可。例如:

SELECT dbo.random_string(10 + rand() * 11, DEFAULT) AS rs;
rs             |
---------------|
5ikNBTJLj1vKUKz|



以上示例返回了一个长度大于等于 10 且小于等于 20 的随机字符串。
生成随机日期和时间

将指定日期增加一个随机的数字,就可以得到随机的日期。例如:

SELECT DATEADD(DAY, rand() * 15, CAST(GETDATE()AS date)) AS rand_date;
rand_date |
----------|
2020-12-18|



DATEADD 函数用于日期的加减运算,CAST 函数用于类型转换。以上示例返回了当前日期加上 14 天之内的某个随机日期。

同样,以下语句返回了一天中的某个随机时间:

SELECT CAST(DATEADD(SECOND, rand() * 86400, GETDATE()) AS TIME) AS rand_time;
rand_time|
---------|
 14:14:10|



生成 UUID

UUID(Universal Unique Identifier)或者 GUID(Globally Unique Identifier)是一个 128 比特的数字,可以用于唯一标识每个网络对象或资源。由于它的生成机制,一个 UUID 可以保证几乎不会与其他 UUID 重复,因此常常用于生成数据库中的主键值。

Microsoft SQL Server 提供了一个系统函数 NEWID,可以用于生成 UUID。例如:

SELECT NEWID() AS uuid;
uuid                                |
------------------------------------|
88E68504-7384-4AB8-A796-D13A8528AC21|



该函数返回的数据类型为 uniqueidentifier。如果想要生成没有中划线(-)的 UUID 字符串,可以使用 REPLACE 函数:

SELECT REPLACE(NEWID(),'-','') AS uuid;
uuid                            |
--------------------------------|
037C73E57F084E33AE026C949454AFF9|



获取表中的随机记录

对于返回多行数据的查询语句,RAND 函数每次都会返回相同的随机值。例如:

SELECT RAND() AS rd FROM employee;
rd                |
------------------|
0.9915256467818716|
0.9915256467818716|
0.9915256467818716|
...



因此,我们不能利用 RAND 函数从表中返回随机的数据行,不过可以使用 NEWID 函数。例如:

SELECT TOP(5) emp_id, emp_name
FROM employee
ORDER BY NEWID();
emp_id|emp_name|
------|--------|
    18|法正    |
     8|孙丫鬟  |
    24|简雍    |
     2|关羽    |
     7|孙尚香  |

 

以上示例从 employee 表中返回了 5 个随机记录。该方法需要为表中的每行数据都生成一个随机数,然后进行排序;所以会随着表中的数据量增加而逐渐变慢。

另外,Microsoft SQL Server 中的查询语句支持 TABLESAMPLE 子句,可以实现数据的近似抽样,不过需要数据量大的时候才比较合适。
总结

本文介绍了在 Microsoft SQL Server 中生成随机数据的方法,包括随机数字、验证码、随机字符串以及随机日期和时间等,同时还介绍了如何生成 UUID,以及如何从表中返回随机记录。