Redis 6.0 新特性篇:Client Side Cache 是嘛玩意?

为啥需要客户端缓存
Redis 的Tracking Feature 的实现代码在: https://github.com/antirez/redis/blob/unstable/src/tracking.c。

很多公司使用 Redis 做缓存系统,并且很好的提高了数据访问的性能,为了进一步应对热点数据,还是会在 Redis 的 Client 端缓存一部分热点数据,用来应对「吃瓜事件」。

比如,「这该死的 996 福报」、「吴亦凡之大方牢房」、「时间管理大师」、「思聪舔我不得就锤我」、「吴秀波之谈恋爱么,能坐牢的那种」……

除了使用 Redis 缓存避免直接访问数据库以外,还会加更多的cache 层,比如采用 Memcachced 作为热点数据的本地缓存:

先去 Memcachced中查询数据,命中直接返回。
Memcachced 未命中,则再从 Redis 查询,命中则返回数据,并在 Memcachced 保存这个数据。
Redis 未命中,则去 MySQL中查询,并依次设置到 Redis 和 Memcachced中。
访问本地内存的的性能必然比通过网络访问 Redis 快,所以这种模式可以极大地减少获取数据的延迟,并且可以减少 Redis 的负载,提高性能。

访问 Redis 获取数据,服务器响应。








查询Redis
使用客户端缓存,应用程序将获取的热门的数据存储在应用程序中,无需再次通过网络访问 Redis。



应该缓存什么

我们不应该缓存不断变化的键。
我们不该缓存很少请求的键。
我们希望缓存经常请求并以合理速率更改的键。对于没有稳定变化速度的例子,比如不断被INCR修改的全局计数器,就不应该缓存。
客户端缓存实现原理

码老湿, Redis 中的数据修改或者失效了,如何及时同步告知客户端失效了呢?自己实现也太复杂了。

Redis 实现的是一个服务端协助的客户端缓存,叫做tracking。客户端缓存的命令是:

CLIENT TRACKING ON|OFF [REDIRECT client-id] [PREFIX prefix] [BCAST] [OPTIN] [OPTOUT] [NOLOOP]
Redis 6.0 实现 Tracking 功能提供了两种模式解决这个问题,分别是使用RESP3 协议版本的普通模式和广播模式,以及使用 RESP2 协议版本的转发模式。



普通模式
当tracking开启时, Redis会「记住」每个客户端请求的 key,当 key的值发现变化时会发送失效信息给客户端 (invalidation message)。

失效信息可以通过 RESP3协议发送给请求的客户端,或者转发给一个不同的连接 (支持 RESP2 + Pub/Sub) 的客户端。

Server 端将 Client 访问的 key以及该 key 对应的客户端 ID 列表信息存储在全局唯一的表(TrackingTable),当表满了,回移除最老的记录,同时触发该记录已过期的通知给客户端。
每个 Redis 客户端又有一个唯一的数字 ID,TrackingTable 存储着每一个 Client ID,当连接断开后,清除该 ID 对应的记录。
TrackingTable 表中记录的 Key 信息不考虑是哪个 database 的,虽然访问的是 db1 的 key,db2 同名 key 修改时会客户端收到过期提示,但这样做会减少系统的复杂性,以及表的存储数据量。

码老湿,可以说下这个 TrackingTable 原理么?

Redis 服务端使用 TrackingTable存储普通模式的客户端数据,它的数据类型是基数树 ( radix tree)。

基数树是针对稀疏的长整型数据查找的多叉搜索树,能快速且节省空间的完映射。

Redis 用它存储键的指针和客户端 ID 的映射关系。因为键对象的指针就是内存地址,也就是长整型数据。客户端缓存的相关操作就是对该数据的增删改查:


























图片来源-程序员厉小冰
注意

服务端对于记录的 key 只会报告一次 invalidate 消息,也就是说,服务端在给客户端发送过一次 invalidate 消息后,如果 key 再被修改,此时,服务端就不会再次给客户端发送 invalidate 消息。

只有下次客户端再次执行只读命令被 track,才会进行下一次消息通知 。






客户端默认不开启 track 模式,我们需要在获取执行指令之前执行开启命令:

CLIENT TRACKING ON|OFF
+OK
GET user:211
$3
公众号:码哥字节
广播模式(BCAST)
当广播模式 (broadcasting) 开启时,服务器不会记住给定客户端访问了哪些键,因此这种模式在服务器端根本不消耗任何内存。

在这个模式下,服务端会给客户端广播所有 key 的失效情况,如果 key 被频繁修改,服务端会发送大量的失效广播消息,这就会消耗大量的网络带宽资源。

所以,在实际应用中,我们设置让客户端注册只跟踪指定前缀的 key,当注册跟踪的 key 前缀匹配被修改,服务端就会把失效消息广播给所有关注这个 key前缀的客户端。

client tracking on bcast prefix user
这种监测带有前缀的 key 的广播模式,和我们对 key 的命名规范非常匹配。我们在实际应用时,会给同一业务下的 key 设置相同的业务名前缀,所以,我们就可以非常方便地使用广播模式。


























图片来源-程序员厉小冰
广播模式与普通模式类似,Redis 使用 PrefixTable 存储广播模式下的客户端数据,它存储**前缀字符串指针和(需要通知的 key 和客户端 ID)**的映射关系。

转发模式
普通模式与广播模式,需要客户端使用 RESP 3 协议,他是 Redis 6.0 新启用的协议。

对于使用 RESP 2 协议的客户端来说,实现客户端缓存则需要另一种模式:重定向模式(redirect)。

RESP 2 无法直接 PUSH 失效消息,所以 需要另一个支持 RESP 3 协议的客户端 告诉 Server 将失效消息通过 Pus/Sub 通知给 RESP 2 客户端。

在重定向模式下,想要获得失效消息通知的客户端,就需要执行订阅命令 SUBSCRIBE,专门订阅用于发送失效消息的频道 _redis_:invalidate。

同时,再使用另外一个客户端,执行 CLIENT TRACKING 命令,设置服务端将失效消息转发给使用 RESP 2 协议的客户端。



图片来源-程序员厉小冰
假设客户端 B 想要获取失效消息,但是客户端 B 只支持 RESP 2 协议,客户端 A 支持 RESP 3 协议。我们可以分别在客户端 B 和 A 上执行 SUBSCRIBE 和 CLIENT TRACKING,如下所示:

//客户端B执行,客户端 B 的 ID 号是 606
SUBSCRIBE _redis_:invalidate

//客户端 A 执行
CLIENT TRACKING ON BCAST REDIRECT 606
B 客户端就可以通过 _redis_:invalidate 频道获取失效消息了。

参考文档

https://redis.io/topics/client-side-caching

https://colobu.com/2020/05/02/redis-client-side-caching/

https://time.geekbang.org/column/article/310838

https://juejin.cn/post/6844904153827786760

作者:码哥字节


欢迎关注微信公众号 :码哥字节