当前位置:   article > 正文

字节二面:Spring Boot Redis 可重入分布式锁实现原理?

字节二面:Spring Boot Redis 可重入分布式锁实现原理?

我是码哥,可以叫我靓仔。

书接上回,码哥上一篇《纠正误区:这才是 SpringBoot Redis 分布式锁的正确实现方式》分享了分布式锁如何从错误到残缺,再到青铜版本的高性能 Redis 分布式锁代码实战,让你一飞冲天。

这是我们最常用的分布式锁方案,今天码哥给你来一个进阶。

Chaya:「码哥,上次的分布式锁版本虽然好,但是不支持可重入获取锁,还差一点点意思。」

Chaya 别急,今日码哥给你带来一个高性能可重入 Redis 分布式锁解决方案,直捣黄龙,一笑破苍穹。

什么是可重入锁

当一个线程执行一段代码成功获取锁之后,继续执行时,又遇到加锁的代码,可重入性就就保证线程能继续执行,而不可重入就是需要等待锁释放之后,再次获取锁成功,才能继续往下执行。

  1. public synchronized void a() {
  2.     b();
  3. }
  4. public synchronized void b() {
  5.     // doWork
  6. }

假设 X 线程在 a 方法获取锁之后,继续执行 b 方法,如果此时不可重入,线程就必须等待锁释放,再次争抢锁。

锁明明是被 X 线程拥有,却还需要等待自己释放锁,然后再去抢锁,这看起来就很奇怪,我释放我自己~

可重入锁实现原理

Chaya:「Redis String 数据结构无法满足可重入锁,key 表示锁定的资源,value 是客户端唯一标识,可重入没地方放了。」

我们可以使用 Redis hash 结构实现,key 表示被锁的共享资源, hash 结构的 fieldKey 存储客户端唯一标识,fieldKey 的 value 则保存加锁的次数。

3717b8e387d4ced667adeccdc7b22d60.png
图 5-26

加锁原理

可重入锁加锁的过程中有以下场景需要考虑。

  1. 锁已经被 A 客户端获取,客户端 B 获取锁失败。

  2. 锁已经被客户端 A 获取,客户端 A 多次执行获取锁操作。

  3. 锁没有被其他客户端获取,那么此刻获取锁的客户端可以获取成功。

按照之前的经验,多个操作的原子性可以用 lua 脚本实现。可重入锁加锁 lua 脚本如下。

  1. if ((redis.call('exists', KEYS[1]) == 0) or
  2.    (redis.call('hexists', KEYS[1], ARGV[2]) == 1)) then
  3.     redis.call('hincrby', KEYS[1], ARGV[2], 1);
  4.     redis.call('pexpire', KEYS[1], ARGV[1]);
  5.   return nil;
  6. end;
  7. return redis.call('pttl', KEYS[1]);
  • KEYS[1]是 lockKey 表示获取的锁资源,比如 lock:168

  • ARGV[1] 表示表示锁的有效时间(单位毫秒)。

  • ARGV[2] 表示客户端唯一标识,在 Redisson 中使用 UUID:ThreadID

下面我来接下是这段脚本的逻辑。

  1. 锁不存在或者锁存在且值与客户端唯一标识匹配,则执行 'hincrby'pexpire指令,接着 return nil。表示的含义就是锁不存在就设置锁并设置锁重入计数值为 1,设置过期时间;锁存在且唯一标识匹配表明当前加锁请求是锁重入请求,锁从如计数 +1,重新锁超时时间。

  • redis.call('exists', KEYS[1]) == 0判断锁是否存在,0 表示不存在。

  • redis.call('hexists', KEYS[1], ARGV[2]) == 1)锁存在的话,判断 hash 结构中 fieldKey 与客户端的唯一标识是否相等。相等表示当前加锁请求是锁重入。

  • redis.call('hincrby', KEYS[1], ARGV[2], 1)将存储在 hash 结构的 ARGV[2] 的值 +1,不存在则支持成 1。

  • redis.call('pexpire', KEYS[1], ARGV[1])KEYS[1] 设置超时时间。

锁存在,但是唯一标识不匹配,表明锁被其他线程持有,调用 pttl返回锁剩余的过期时间。

Chaya:「“脚本执行结果返回 nil、锁剩余过期时间有什么目的?”」

当且仅当返回 nil才表示加锁成功;客户端需要感知锁是否成功的结果。

解锁原理

解锁逻辑复杂一些,不仅要保证不能删除别人的锁。还要确保,重入次数为 0 才能解锁。

解锁代码执行方式与加锁类似,三个返回值含义如下。

  • 1 代表解锁成功,锁被释放。

  • 0 代表可重入次数被减 1。

  • nil 代表其他线程尝试解锁,解锁失败。

  1. if (redis.call('hexists', KEYS[1], ARGV[2]) == 0) then
  2.     return nil;
  3. end;
  4. local counter = redis.call('hincrby', KEYS[1], ARGV[2], -1);
  5. if (counter > 0) then
  6.     redis.call('pexpire', KEYS[1], ARGV[1]);
  7.     return 0;
  8. else
  9.     redis.call('del', KEYS[1]);
  10.     return 1;
  11. end;
  12. return nil;
  • KEYS[1]是 lockKey,表示锁的资源,比如 lock:order:pay

  • ARGV[1],锁的超时时间。

  • ARGV[2],Hash 表的 FieldKey。

首先使用 hexists 判断 Redis 的 Hash 表是否存在 fileKey,如果不存在则直接返回 nil解锁失败。

若存在的情况下,且唯一标识匹配,使用 hincrby 对 fileKey 的值 -1,然后判断计算之后可重入次数。当前值 > 0 表示持有的锁存在重入情况,重新设置超时时间,返回值 1;

若值小于等于 0,表明锁释放了,执行 del释放锁。

Chaya:“可重入锁很好,依然存在的一个问题是:加锁后,业务逻辑执行耗时超过了 lockKey 的过期时间,lockKey 会被 Reids 删除。”

这个时间不能瞎写,一般要根据在测试环境多次测试,然后压测多轮之后,比如计算出接口平均执行时间 200 ms。那么锁的超时时间就放大为平均执行时间的 3~5 倍。

Chaya:“锁的超时时间怎么计算合适呢?”

这个时间不能瞎写,一般要根据在测试环境多次测试,然后压测多轮之后,比如计算出接口平均执行时间 200 ms。那么锁的超时时间就放大为平均执行时间的 3~5 倍。

Chaya:“为啥要放大呢?”

因为如果锁的操作逻辑中有网络 IO 操作、JVM FullGC 等,线上的网络不会总一帆风顺,我们要给网络抖动留有缓冲时间。

Chaya:“有没有完美的方案呢?不管时间怎么设置都不大合适。”

我们可以让获得锁的线程开启一个守护线程,用来给当前客户端快要过期的锁续航,续命的前提是,得判断是不是当前进程持有的锁,如果不是就不进行续。

如果快要过期,但是业务逻辑还没执行完成,自动对这个锁进行续期,重新设置过期时间。

12691df129a78f683dffbe110c4955d3.png
图 5-27

这就是下一篇我要说的超神方案,加入看门狗机制实现锁自动续期。不过锁自动续期比较复杂,今天的 Redis 可重入分布式锁王者方案已经可以让你称霸武林,接下来上实战。

可重入分布式锁实战

关于 Spring Boot 的环境搭建以及普通分布式锁实战详见上一篇《纠正误区:这才是 SpringBoot Redis 分布式锁的正确实现方式》。今天直接上可重入锁核心代码。

ReentrantDistributedLock

可重入锁由ReentrantDistributedLock标识,它实现 Lock接口,构造方法实现 resourceNameStringRedisTemplate 的属性设置。

客户端唯一标识使用uuid:threadId 组成。

  1. public class ReentrantDistributedLock implements Lock {
  2.     /**
  3.      * 锁超时时间,默认 30 秒
  4.      */
  5.     protected long internalLockLeaseTime = 30000;
  6.     /**
  7.      * 标识 id
  8.      */
  9.     private final String id = UUID.randomUUID().toString();
  10.     /**
  11.      * 资源名称
  12.      */
  13.     private final String resourceName;
  14.     private final List<String> keys = new ArrayList<>(1);
  15.     /**
  16.      * Redis 客户端
  17.      */
  18.     private final StringRedisTemplate redisTemplate;
  19.     public ReentrantDistributedLock(String resourceName, StringRedisTemplate redisTemplate) {
  20.         this.resourceName = resourceName;
  21.         this.redisTemplate = redisTemplate;
  22.         keys.add(resourceName);
  23.     }
  24. }

加锁 tryLock、lock

tryLock 以阻塞等待 waitTime 时间的方式来尝试获取锁。获取成功则返回 true,反之 false。

tryLock不同的是, lock 一直尝试自旋阻塞等待获取分布式锁,直到获取成功为止。而 tryLock 只会阻塞等待 waitTime 时间。

  1. @Override
  2. public boolean tryLock(long waitTime, long leaseTime, TimeUnit unit) throws InterruptedException {
  3.     long time = unit.toMillis(waitTime);
  4.     long current = System.currentTimeMillis();
  5.     long threadId = Thread.currentThread().getId();
  6.     // lua 脚本获取锁
  7.     Long ttl = tryAcquire(leaseTime, unit, threadId);
  8.     // lock acquired
  9.     if (ttl == null) {
  10.         return true;
  11.     }
  12.     time -= System.currentTimeMillis() - current;
  13.     // 等待时间用完,获取锁失败
  14.     if (time <= 0) {
  15.         return false;
  16.     }
  17.     // 自旋获取锁
  18.     while (true) {
  19.         long currentTime = System.currentTimeMillis();
  20.         ttl = tryAcquire(leaseTime, unit, threadId);
  21.         // lock acquired
  22.         if (ttl == null) {
  23.             return true;
  24.         }
  25.         time -= System.currentTimeMillis() - currentTime;
  26.         if (time <= 0) {
  27.             return false;
  28.         }
  29.     }
  30. }
  31. @Override
  32. public void lock(long leaseTime, TimeUnit unit) {
  33.     long threadId = Thread.currentThread().getId();
  34.     Long ttl = tryAcquire(leaseTime, unit, threadId);
  35.     // lock acquired
  36.     if (ttl == null) {
  37.         return;
  38.     }
  39.     do {
  40.         ttl = tryAcquire(leaseTime, unit, threadId);
  41.         // lock acquired
  42.     } while (ttl != null);
  43. }
  44. private Long tryAcquire(long leaseTime, TimeUnit unit, long threadId) {
  45.     // 执行 lua 脚本
  46.     DefaultRedisScript<Long> redisScript = new DefaultRedisScript<>(LuaScript.reentrantLockScript(), Long.class);
  47.     return redisTemplate.execute(redisScript, keys, String.valueOf(unit.toMillis(leaseTime)), getRequestId(threadId));
  48. }
  49. private String getRequestId(long threadId) {
  50.     return id + ":" + threadId;
  51. }

解锁 unlock

  1. public void unlock() {
  2.         long threadId = Thread.currentThread().getId();
  3.         // 执行 lua 脚本
  4.         DefaultRedisScript<Long> redisScript = new DefaultRedisScript<>(LuaScript.reentrantUnlockScript(), Long.class);
  5.         Long opStatus = redisTemplate.execute(redisScript, keys, String.valueOf(internalLockLeaseTime), getRequestId(threadId));
  6.         if (opStatus == null) {
  7.             throw new IllegalMonitorStateException("attempt to unlock lock, not locked by current thread by node id: "
  8.                     + id + " thread-id: " + threadId);
  9.         }
  10.     }

LuaScript

这个脚本就是在讲解可重入分布式锁原理具体逻辑已经解释过,这里就不再重复分析。

  1. public class LuaScript {
  2.     private LuaScript() {
  3.     }
  4.     /**
  5.      * 可重入分布式锁加锁脚本
  6.      *
  7.      * @return 当且仅当返回 `nil`才表示加锁成功;返回锁剩余过期时间是让客户端感知锁是否成功。
  8.      */
  9.     public static String reentrantLockScript() {
  10.         return "if ((redis.call('exists', KEYS[1]) == 0) " +
  11.                 "or (redis.call('hexists', KEYS[1], ARGV[2]) == 1)) then " +
  12.                 "redis.call('hincrby', KEYS[1], ARGV[2], 1); " +
  13.                 "redis.call('pexpire', KEYS[1], ARGV[1]); " +
  14.                 "return nil; " +
  15.                 "end; " +
  16.                 "return redis.call('pttl', KEYS[1]);";
  17.     }
  18.     /**
  19.      * 可重入分布式锁解锁脚本
  20.      *
  21.      * @return 当且仅当返回 `nil`才表示解锁成功;
  22.      */
  23.     public static String reentrantUnlockScript() {
  24.         return "if (redis.call('hexists', KEYS[1], ARGV[2]) == 0) then " +
  25.                 "return nil;" +
  26.                 "end; " +
  27.                 "local counter = redis.call('hincrby', KEYS[1], ARGV[2], -1); " +
  28.                 "if (counter > 0) then " +
  29.                 "redis.call('pexpire', KEYS[1], ARGV[1]); " +
  30.                 "return 0; " +
  31.                 "else " +
  32.                 "redis.call('del', KEYS[1]); " +
  33.                 "return 1; " +
  34.                 "end; " +
  35.                 "return nil;";
  36.     }
  37. }

RedisLockClient

最后,还需要提供一个客户端给方便使用。

  1. @Component
  2. public class RedisLockClient {
  3.     @Autowired
  4.     private StringRedisTemplate redisTemplate;
  5.     /**
  6.      * 获取可重入分布式锁
  7.      * @param name
  8.      * @return
  9.      */
  10.     public Lock getReentrantLock(String name) {
  11.         return new ReentrantDistributedLock(name, redisTemplate);
  12.     }
  13. }

单元测试走一个,验证下分布式锁是否支持可重入。

  1. @Slf4j
  2. @SpringBootTest(classes = RedisApplication.class)
  3. public class RedisLockTest {
  4.     @Autowired
  5.     private RedisLockClient redisLockClient;
  6.     @Test
  7.     public void testTryReentrantLockSuccess() throws InterruptedException {
  8.         Lock lock = redisLockClient.getReentrantLock("order:pay");
  9.         try {
  10.             boolean isLock = lock.tryLock(1030, TimeUnit.SECONDS);
  11.             if (!isLock) {
  12.                 log.warn("加锁失败");
  13.                 return;
  14.             }
  15.             // 重复加锁
  16.             reentrant(lock);
  17.             log.info("业务逻辑执行完成");
  18.         } finally {
  19.             lock.unlock();
  20.         }
  21.     }
  22.     private void reentrant(Lock lock) throws InterruptedException {
  23.         try {
  24.             boolean isLock = lock.tryLock(1030, TimeUnit.SECONDS);
  25.             if (!isLock) {
  26.                 log.warn("加锁失败");
  27.                 return;
  28.             }
  29.             log.info("业务逻辑执行完成");
  30.         } finally {
  31.             lock.unlock();
  32.         }
  33.     }
  34. }

有两个点需要注意。

  1. 释放锁的代码一定要放在 finally{} 块中。否则一旦执行业务逻辑过程中抛出异常,程序就无法执行释放锁的流程。只能干等着锁超时释放。

  2. 加锁的代码应该写在 try {} 代码中,放在 try 外面的话,如果执行加锁异常(客户端网络连接超时),但是实际指令已经发送到服务端并执行,就会导致没有机会执行解锁的代码。

CHaya:“码哥,这个方案确实很王者,大开眼界,接下来的超神版可以实现看门狗自动续期么?”

鉴于篇幅有限,今天就跟大家介绍 Redis 可重入分布式锁王者方案,关注我,下一篇给你分享、超神版分布式锁解决方案。

下期见~

往期推荐

纠正误区:这才是 SpringBoot Redis 分布式锁的正确实现方式

Tomcat 架构设计 25 年后依旧能打!我学到了什么?

3 万字 + 40 张图 | Redis  霸道面试题(2024 版本)

Tomcat 架构原理解析到架构设计借鉴

深入解析 Redis 执行命令流程:I/O 事件、文件事件和客户端交互

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/article/detail/58210
推荐阅读
相关标签
  

闽ICP备14008679号