并发环境下Double-check模型的改进

lovnet

浏览: 6705083 次
性别:
来自: 武汉

最近访客更多访客>>

u012363178

jx_colin

MauerSu

wangyy

博主相关

博客

微博

相册

留言

关于我

文章分类

全部博客 (7414)

社区版块

存档分类

2013-03 ( 20)
2013-02 ( 53)
2013-01 ( 90)
更多存档...

扩展阅读

http://www.51myit.com/thread-45338-1-1.html

public class Singleton {

private static Singleton instance = null;

public static Singleton getInstance() {
if (instance == null) {
synchronized (Singleton.class) {
if (instance == null) {
instance = new Singleton();
}
}
}
return instance;
}
}

简单场景：
多线程环境，每个线程携带惟一的key去组装数据，相同的key会有相同的数据结果。为了提高响应速度，在线程访问的入口处设置缓存。线程根据key先从缓存中取数据，如果缓存中没有，线程就去做具体的逻辑处理。

模型如下图：假定每个线程的key如A, B等，同时有多个携带同一key的线程进来。

最基本的处理方式如此：

Java代码

privatestaticMap<String,Object>cache
=newConcurrentHashMap<String,Object>();
//Entry
publicObjectrun(Stringkey){
Objectresult=cache.get(key);
if(result==null){
result=doHardWork(key);
cache.put(key,result);
}
returnresult;
}
privateObjectdoHardWork(Stringkey){
Objectresult=null;
//Concretework
returnresult;
}

它的缺点很明显，同时会有多个相同key的线程在做事，资源浪费严重。

先看段使用Double-check模式来完成相同功能的代码：

Java代码

privatestaticMap<String,Object>cache
=newConcurrentHashMap<String,Object>();
publicObjectrun(Stringkey){
Objectresult=cache.get(key);//Firstchecking
if(result==null){
synchronized(cache){
result=cache.get(key);//Secondchecking
if(result==null){
result=doHardWork(key);
cache.put(key,result);
}
}
}
returnresult;
}
privateObjectdoHardWork(Stringkey){
Objectresult=null;
//Concretework
returnresult;
}

假定某个线程T1的参数是A，如果它能从Cache中取到之前A的执行结果，就立马返回。否则在同步块外等待，期望此时在同步块中有另外一个参数也是A的线程T2正在运行，然后将运行结果放入缓存中，在T2执行完成退出同步块后，T1可以从Cache读取T2的执行结果，退出请求。Double-check模型有两次对Cache内容的check，一次在同步块外，一次在同步块里面。它的执行流程如图：

系统初始时，假定有30个参数，每个参数有10个请求线程，那么同时会有300个线程从Cache中读数据，在没有读到任何数据时，只会有一个线程进入同步块，其它299个线程在外面等着。Double-check的好处在于，每个参数第一个进入同步块的线程才会去执行正式逻辑，其它拥有同样参数的线程只要从Cache中取数据即可，效率很高。如果参数A的某个线程之前执行过，其它参数A的线程在进入同步块后，能从Cache中取到数据，立马退出同步块。但同时它的缺点就是因为有同步块的存在，每个参数的第一个线程不能并行进入具体逻辑执行过程，得一个一个的来。如此30个参数，每个参数的第一个线程得依次串行进入具体逻辑。

对于这样的应用场景，最好的流程是：相同参数的线程只有一个进入具体逻辑，其它线程等待这个参数的执行结果，在得到结果后，直接返回；不同参数的线程在具体逻辑阶段可以并发执行。期望的执行流程如下图：

这篇帖子的目的是改进Double-check模型的这种缺点，但不是修改Double-check来满足需求。实现可以很简单，一是多个线程的数据共享，二是对于同样参数多个线程的通知。具体模型如下图：

从代码来看：

Java代码

/**
*用来标识当前参数有线程正在做具体逻辑
*/
publicstaticObjectlock=newObject();
/**
*假定参数为'A',系统初始时检查lockMap中‘A’的value是否为null，如果为null，那当前线程就得做具体逻辑，把'A'的value设置为固定的lock,其它线程看到有这个lock就什么事也不做，然后suspend。当有返回数据时，将value由lock替换为正式返回数据，以在多个线程间共享
*/
rivateMap<String,Object>lockMap
=newConcurrentHashMap<String,Object>();
/**
*所有suspend的线程都要在这里注册，以便随后得到通知
*/
privateMap<String,List<Thread>>caller=newConcurrentHashMap<String,List<Thread>>();