解决死锁需打破互斥、持有并等待、不可剥夺和循环等待四个条件,常见策略包括:按序请求资源避免循环等待,使用tryLock设置超时打破持有并等待,利用volatile防止双重检查锁因重排序导致问题,StampedLock等新型锁机制也提供非阻塞或超时机制;设计高并发系统时应减少锁范围、采用无锁数据结构、Actor模型或消息队列解耦,并通过工具如JStack、VisualVM结合日志进行死锁诊断。
线程死锁是指两个或多个线程无限期地相互等待,导致程序停滞不前。解决死锁的关键在于打破形成死锁的四个必要条件:互斥、持有并等待、不可剥夺和循环等待。
解决方案
-
避免循环等待: 这是最常见的死锁预防策略。通过定义资源获取的全局顺序,强制所有线程按照相同的顺序请求资源。如果线程需要多个资源,必须按照预先定义的顺序获取。
// 资源类 class Resource { public int id; public Resource(int id) { this.id = id; } } // 假设资源1的id是1,资源2的id是2,必须先获取id小的资源 public void transferMoney(Account fromaccount, Account toAccount, int amount) { Resource lock1 = fromAccount.id < toAccount.id ? fromAccount : toAccount; Resource lock2 = fromAccount.id < toAccount.id ? toAccount : fromAccount; synchronized (lock1) { synchronized (lock2) { if (fromAccount.getBalance() < amount) { throw new InsufficientFundsException(); } fromAccount.debit(amount); toAccount.credit(amount); } } }
-
使用超时机制: 在尝试获取锁时设置超时时间。如果线程在指定时间内未能获得锁,则放弃并释放已持有的资源,稍后重试。这可以打破“持有并等待”的条件。
立即学习“Java免费学习笔记(深入)”;
Lock lock = new ReentrantLock(); try { if (lock.tryLock(10, TimeUnit.MILLISECONDS)) { try { // 访问共享资源 } finally { lock.unlock(); } } else { // 超时处理:记录日志、重试或放弃 System.out.println("获取锁超时"); } } catch (InterruptedException e) { Thread.currentThread().interrupt(); }
-
资源分配图算法: 在复杂的系统中,可以使用资源分配图来检测死锁。资源分配图是一种有向图,表示线程对资源的请求和分配情况。通过检测图中是否存在环路,可以判断是否存在死锁。这种方法更偏向理论,实际应用中实现较为复杂。
-
避免持有并等待: 尽量避免线程在持有资源的同时等待其他资源。可以一次性请求所有需要的资源,或者在释放所有资源后再次请求。
-
死锁检测与恢复: 定期检测系统中是否存在死锁,如果检测到死锁,则采取措施进行恢复,例如终止一个或多个线程,或者强制释放某些资源。这种方式相对激进,需要谨慎使用。
死锁发生后如何诊断?
jstack
命令,可以打印 jvm 中所有线程的堆栈信息。通过分析堆栈信息,可以找到哪些线程正在等待哪些锁,从而确定死锁的发生。
例如,执行
jstack <pid>
(pid 是 Java 进程的 ID) 可以得到线程的dump信息,找到处于BLOCKED状态的线程,查看其等待的锁。一些高级的监控工具,如 JConsole、VisualVM,也提供了死锁检测功能。
此外,良好的日志记录习惯也很重要。在关键代码段中记录锁的获取和释放情况,可以帮助快速定位死锁问题。
为什么单例模式的双重检查锁容易出现死锁?
虽然双重检查锁(double-Checked Locking)在某些情况下可以提高性能,但如果实现不当,也容易出现死锁。这主要是因为指令重排序的问题。
public class Singleton { private static Singleton instance; private Singleton() {} public static Singleton getInstance() { if (instance == NULL) { synchronized (Singleton.class) { if (instance == null) { instance = new Singleton(); // 这行代码可能存在问题 } } } return instance; } }
在
instance = new Singleton();
这行代码中,JVM 可能会进行指令重排序,导致以下步骤:
- 分配 Singleton 对象的内存空间。
- 将
instance
变量指向分配的内存空间。
- 初始化 Singleton 对象。
如果线程 A 执行到步骤 2,但尚未执行步骤 3,此时线程 B 进入
getInstance()
方法,发现
instance
不为 null,直接返回
instance
。但此时
instance
指向的对象尚未初始化,线程 B 使用该对象可能会导致错误,甚至死锁。
解决这个问题的方法是使用
volatile
关键字修饰
instance
变量,禁止指令重排序。
private volatile static Singleton instance;
除了ReentrantLock,还有其他避免死锁的锁吗?
ReentrantLock
提供了
tryLock()
方法,可以设置超时时间,从而避免死锁。但其他类型的锁,例如
StampedLock
,也提供了一些避免死锁的机制。
StampedLock
提供了三种模式:写锁、悲观读锁和乐观读锁。其中,乐观读锁是非阻塞的,可以避免读读之间的死锁。写锁和悲观读锁也提供了
tryLock()
方法,可以设置超时时间。
另外,使用
java.util.concurrent
包提供的并发工具类,例如
ExecutorService
、
CountDownLatch
、
CyclicBarrier
等,可以简化多线程编程,降低死锁发生的概率。
如何设计一个高并发且避免死锁的系统?
设计高并发且避免死锁的系统是一个复杂的问题,需要综合考虑多个因素。以下是一些建议:
-
尽量减少锁的范围: 只在必要的时候才使用锁,尽量缩短锁的持有时间。
-
使用无锁数据结构: 例如
ConcurrentHashMap
、
ConcurrentLinkedQueue
等。这些数据结构使用 CAS (Compare and Swap) 操作来实现并发,避免了锁的使用,从而降低了死锁的风险。
-
使用 Actor 模型: Actor 模型是一种并发编程模型,将系统分解为多个独立的 Actor,每个 Actor 维护自己的状态,并通过消息传递进行通信。Actor 之间不存在共享状态,因此可以避免死锁。
-
使用消息队列: 消息队列可以解耦不同的组件,降低系统之间的依赖性。如果一个组件需要等待另一个组件的响应,可以将请求放入消息队列,异步处理,避免阻塞。
-
进行代码审查和测试: 定期进行代码审查,检查是否存在潜在的死锁风险。编写单元测试和集成测试,模拟并发场景,尽早发现死锁问题。
最后,没有银弹。在实际开发中,需要根据具体的业务场景和系统架构,选择合适的并发策略和锁机制,才能设计出高并发且避免死锁的系统。
评论(已关闭)
评论已关闭