Microsoft SQL Server 生成随机数字、字符串、日期、验证码以及 UUID
作者: 不剪发的Tony老师
毕业于北京航空航天大学,十多年数据库管理与开发经验,目前在一家全球性的金融公司从事数据库架构设计。CSDN学院签约讲师以及GitChat专栏作者。csdn上的博客收藏于以下地址:https://tonydong.blog.csdn.net
文章目录
生成随机数字
生成 0 到 1 之间的随机数
生成指定范围内的随机数
生成 6 位数字手机验证码
生成遵循正态分布的随机数
生成随机字符串
生成固定长度的随机字符串
生成可变长度的随机字符串
生成随机日期和时间
生成 UUID
获取表中的随机记录
总结
大家好,我是只谈技术不剪发的 Tony 老师。
随机数对于我们而言并不陌生,例如手机短信验证码就是一个随机的数字字符串;对于统计分析、机器学习等领域而言,通常也需要生成大量的随机数据用于测试、数据抽样、算法验证等。那么今天我们就来介绍一下如何在 Microsoft SQL Server 中生成随机数据,包括随机数字、验证码、随机字符串以及随机日期和时间等。
如果觉得文章有用,欢迎评论📝、点赞👍、推荐🎁
📝计算机生成的都是伪随机数,并不是真正的物理随机数。
生成随机数字
生成 0 到 1 之间的随机数
Microsoft SQL Server 提供了内置的RAND()函数,可以用于生成一个大于 0 小于 1 的随机数字。例如:
SELECT RAND() AS rd;
rd |
------------------|
0.8186902226508435|
SELECT RAND() AS rd;
rd |
------------------|
0.7467745597058656|
该函数返回的数据类型为 float,每次调用都会返回不同的结果。
如果想要重现某些场景,需要确保每次运行时生成相同的随机数。这种情况下可以为 RAND 函数传递一个输入参数,设置一个随机数种子。例如:
SELECT RAND(1) AS rd;
rd |
------------------|
0.7135919932129235|
SELECT RAND(1) AS rd;
rd |
------------------|
0.7135919932129235|
从结果可以看出,设置相同的种子之后,函数返回了相同的随机数。
生成指定范围内的随机数
基于 RAND() 函数和一些运算,就可以返回任意两个数字之间的随机数:
low + RAND() * (high - low)
以上表达式将会返回一个大于 low,小于 high 的随机数。例如:
SELECT 10 + RAND() * 10 AS rd;
rd |
-----------------|
13.43443392823765|
以上示例返回了一个大于 10 且小于 20 的随机数字。
如果想要生成某个范围内的随机整数,可以加上 FLOOR 函数。例如:
SELECT FLOOR(10 + RAND() * 10) AS rd;
rd |
----|
17.0|
该语句返回了一个大于等于 10,小于(不等于)20的随机整数。
生成 6 位数字手机验证码
我们已经知道了如何获取指定范围内的随机数,再加上字符串格式化就可以生成由 6 位数字字符组成的手机验证码。例如:
SELECT RIGHT(CONCAT('000000',FLOOR(RAND()* 1000000)),6) AS captcha;
captcha|
-------|
925656 |
CONCAT 函数可以确保数据不够 6 位时在前面补足 0,然后通过 RIGHT 函数返回右侧的 6 个数字。
生成遵循正态分布的随机数
RAND 函数生成的是一个遵循均匀分布的随机数,Microsoft SQL Server没有提供生成遵循正态分布(normal distribution)的随机数。我们可以模拟生成遵循正态分布的随机数:
SELECT (sqrt(-2 * log(rand())) * cos(2 * pi() * rand())) * @stdev + @mean;
以上查询利用 Box-Muller 变换算法通过两个平均分布的随机数生成正态分布的随机数,@stdev 是标准差,@mean 是均值。例如,以下查询生成了一个均值为 0,标准差为 1 的正态分布随机数:
SELECT (sqrt(-2 * log(rand())) * cos(2 * pi() * rand())) * 1 + 0 AS rd;
rd |
-------------------|
-0.4356079973405327|
我们可以验证一下这种方式生成的随机数是否遵循正态分布,例如:
CREATE TABLE #t(val float);
BEGIN
DECLARE @counter INT = 1
WHILE @counter <= 1000000
BEGIN
INSERT INTO #t
SELECT (sqrt(-2 * log(rand())) * cos(2 * pi() * rand())) * 1 + 0
SET @counter = @counter + 1
END
END;
SELECT avg(val) avg, stdev(val) stdev FROM #t;
avg |stdev |
------------------|------------------|
0.0009166176910995|1.0014773595001807|
通过运行 1000000 次计算,这些数据的平均值和标准差非常接近 0 和 1。
生成随机字符串
生成固定长度的随机字符串
除了随机数字之外,有时候我们也需要生成一些随机的字符串。Microsoft SQL Server 没有提供专门生成随机字符串的函数,但是可以通过其他函数进行模拟。例如:
SELECT CHAR(RAND() * 26 + 65) ch;
ch|
--|
D |
以上查询返回了一个随机的大写字母,CHAR 函数用于将 ASCII 编码转换为对应的字符。我们可以基于该查询进一步创建一个存储函数:
CREATE VIEW v_rand
AS
SELECT RAND() AS val;
CREATE OR ALTER FUNCTION rand_num(@n INT)
RETURNS INT
AS BEGIN
SELECT @n=@n * val FROM v_rand
RETURN @n
END;
CREATE OR ALTER FUNCTION random_string(
@num INT,
@chars VARCHAR(1024) = '0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz'
) RETURNS VARCHAR(1024)
AS
BEGIN
DECLARE @res_str VARCHAR(1024) = ''
DECLARE @i INT=0
WHILE(@i<@num)BEGIN
SET @res_str = @res_str + SUBSTRING(@chars, FLOOR(dbo.rand_num(len(@chars))) + 1, 1)
SET @i = @i + 1
END
RETURN @res_str
END;
random_string 函数可以返回由指定字符(默认为所有数字、大小写字母)组成的随机字符串。例如:
SELECT dbo.random_string(10,DEFAULT) AS rs;
rs |
----------|
3CBFEPKYTd|
以上示例返回了一个由字母和数字组成、长度为 10 的随机字符串。以下语句也可以用于返回一个 6 位随机数字组成的手机验证码:
SELECT random_string(6, '0123456789');
random_string|
-------------|
082661 |
生成可变长度的随机字符串
那么,怎么返回一个长度可变的随机字符串呢?很简单,为 random_string 函数指定一个随机的长度参数即可。例如:
SELECT dbo.random_string(10 + rand() * 11, DEFAULT) AS rs;
rs |
---------------|
5ikNBTJLj1vKUKz|
以上示例返回了一个长度大于等于 10 且小于等于 20 的随机字符串。
生成随机日期和时间
将指定日期增加一个随机的数字,就可以得到随机的日期。例如:
SELECT DATEADD(DAY, rand() * 15, CAST(GETDATE()AS date)) AS rand_date;
rand_date |
----------|
2020-12-18|
DATEADD 函数用于日期的加减运算,CAST 函数用于类型转换。以上示例返回了当前日期加上 14 天之内的某个随机日期。
同样,以下语句返回了一天中的某个随机时间:
SELECT CAST(DATEADD(SECOND, rand() * 86400, GETDATE()) AS TIME) AS rand_time;
rand_time|
---------|
14:14:10|
生成 UUID
UUID(Universal Unique Identifier)或者 GUID(Globally Unique Identifier)是一个 128 比特的数字,可以用于唯一标识每个网络对象或资源。由于它的生成机制,一个 UUID 可以保证几乎不会与其他 UUID 重复,因此常常用于生成数据库中的主键值。
Microsoft SQL Server 提供了一个系统函数 NEWID,可以用于生成 UUID。例如:
SELECT NEWID() AS uuid;
uuid |
------------------------------------|
88E68504-7384-4AB8-A796-D13A8528AC21|
该函数返回的数据类型为 uniqueidentifier。如果想要生成没有中划线(-)的 UUID 字符串,可以使用 REPLACE 函数:
SELECT REPLACE(NEWID(),'-','') AS uuid;
uuid |
--------------------------------|
037C73E57F084E33AE026C949454AFF9|
获取表中的随机记录
对于返回多行数据的查询语句,RAND 函数每次都会返回相同的随机值。例如:
SELECT RAND() AS rd FROM employee;
rd |
------------------|
0.9915256467818716|
0.9915256467818716|
0.9915256467818716|
...
因此,我们不能利用 RAND 函数从表中返回随机的数据行,不过可以使用 NEWID 函数。例如:
SELECT TOP(5) emp_id, emp_name
FROM employee
ORDER BY NEWID();
emp_id|emp_name|
------|--------|
18|法正 |
8|孙丫鬟 |
24|简雍 |
2|关羽 |
7|孙尚香 |
以上示例从 employee 表中返回了 5 个随机记录。该方法需要为表中的每行数据都生成一个随机数,然后进行排序;所以会随着表中的数据量增加而逐渐变慢。
另外,Microsoft SQL Server 中的查询语句支持 TABLESAMPLE 子句,可以实现数据的近似抽样,不过需要数据量大的时候才比较合适。
总结
本文介绍了在 Microsoft SQL Server 中生成随机数据的方法,包括随机数字、验证码、随机字符串以及随机日期和时间等,同时还介绍了如何生成 UUID,以及如何从表中返回随机记录。