NO END FOR LEARNING

Writing blog if you feel tired | 学海无涯 苦写博客

Servlet多线程安全问题和LocalThread

| Comments

Servlet线程不安全

以下内容摘录自Java™ Servlet Specification,在开始阅读本文章之前,请仔细阅读:

2.1 Request Handling Methods

The handling of concurrent requests to a Web application generally requires that the Web Developer design servlets that can deal with multiple threads executing within the service method at a particular time.
Generally the Web container handles concurrent requests to the same servlet by concurrent execution of the service method on different threads.

2.2 Number of Instances

For a servlet not hosted in a distributed environment (the default), the servlet container must use only one instance per servlet declaration. However, for a servlet implementing the SingleThreadModel interface, the servlet container may instantiate multiple instances to handle a heavy request load and serialize requests to a particular instance. …

2.3.3.1 Multithreading Issues

Although it is not recommended, an alternative for the Developer is to implement the SingleThreadModel interface which requires the container to guarantee that there is only one request thread at a time in the service method. A servlet container may satisfy this requirement by serializing requests on a servlet, or by maintaining a pool of servlet instances. If the servlet is part of a Web application that has been marked as distributable, the container may maintain a pool of servlet instances in each JVM that the application is distributed across.

For servlets not implementing the SingleThreadModel interface, if the service method (or methods such as doGet or doPost which are dispatched to the service method of the HttpServlet abstract class) has been defined with the synchronized keyword, the servlet container cannot use the instance pool approach, but must serialize requests through it. It is strongly recommended that Developers not synchronize the service method (or methods dispatched to it)

默认情况下,非分布式系统,Servlet容器只会维护一个Servlet的实例,当多个请求到达同一个Servlet,Servlet容器会启动多个线程分配给不同请求来执行同一个Servlet实例中的服务方法。为什么这么做?有效利用JVM允许多个线程访问同一个实例的特性,来提高服务器性能。因为,无论是同步线程对Servlet的调用,还是为每一个线程初始化一个Servlet实例,都会带来巨大的性能问题。

这也就是为什么Servlet会存在多线程安全问题。

大部分线程安全问题出现的原因都是Servlet实现者在不经意间创建了一个Servlet的实例变量(成员变量),而导致多个线程公有这个实例变量,存在不同阶段对该变量的读写操作。

预防它很简单:就是避免这样写,用方法中的本地变量替代它。

“Java虚拟机栈(Java Virtual Machine Stacks)也是线程私有的,它的生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法被执行的时候都会同时创建一个栈帧用于存储局部变量表、操作栈、动态链接、方法出口等信息。每一个方法被调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。”
—深入理解Java虚拟机

ThreadLocal

那如果你希望定义一个变量,让每一个线程都拥有不同的拷贝,应该怎么办?答案是ThreadLocal。

ThreadLocal是Java语言包提供的一个实现类,与其命名ThreadLocal,叫它thread-local variables更合适。和普通变量不同,通过该对象的set和get方法,可以给每一个调用它的线程保存一个独立的变量的拷贝。什么意思?也就是说,该变量保存下来的变量和当时调用该方法的线程是绑定的,不同线程的值是不一样的。

在Java Doc中介绍过:定义该变量的典型方法是private static

1
private static final ThreadLocal<Integer> threadId = new ThreadLocal<Integer>();

当要保存时,调用它的set方法,获取时,调用get方法。

1
2
threadId.set(10);
threadId.get();

下面看一个例子,单例类中定义了两个变量,实例变量和ThreadLocal变量,多线程读写,并随机等待一段时间,得到的结果会是普通实例变量和time的值不一致,而threadLocal是一致的:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
package me.zeph.relations;

import java.util.Random;

public class Singleton {

  private int value;

  private static Singleton instance;

  private static ThreadLocal<Integer> threadLocal = new ThreadLocal<>();

  private Singleton() {
  }

  public void set(int value) {
      threadLocal.set(value);
  }

  public int get() {
      return threadLocal.get();
  }

  public static synchronized Singleton getInstance() {
      if (instance == null) {
          instance = new Singleton();
      }
      return instance;
  }

  public int getValue() {
      return value;
  }

  public void setValue(int value) {
      this.value = value;
  }

  public static void main(String args[]) {
      final Singleton singleton = Singleton.getInstance();
      for (int i = 0; i < 10; i++) {
          Thread thread = new Thread() {
              @Override
              public void run() {
                  int time = new Random(System.currentTimeMillis()).nextInt(2000);
                  singleton.set(time);
                  singleton.setValue(time);
                  try {
                      Thread.sleep(time);
                  } catch (InterruptedException e) {
                      e.printStackTrace();
                  }
                  System.out.println(time + "---ThreadLocal---" + singleton.get());
                  System.out.println(time + "---NonThreadLocal-----" + singleton.getValue());
              }
          };
          thread.start();
          try {
              Thread.sleep(1000);
          } catch (InterruptedException e) {
              e.printStackTrace();
          }
      }
  }
}

了解到它的作用和如何使用之后,你肯定在想,它是怎么实现的?

一种办法是:在这个对象的里面存放一个map对象,map对象的key就是Thread.currentThread()的一些信息,value就是对应的值。这是最显而易见而直接的实现方式。

但是,它不是这么实现的!!!是反过来的!!!

在当前的线程对象里面存放一个Map,Map的key是当前的ThreadLocal对象,value是对应的值。

那么当程序中有多个ThreadLocal是就不是每个threadLocal对象维护一个线程的map,而是每个线程有一个map来维护所有的ThreadLocal。

这么做有什么好处?

我的猜测是,资源释放问题,如果是第一种方式,线程已经完成了它的任务,但是ThreadLocal仍然保存它的引用,那么线程资源就不会立刻释放(根据不同的垃圾回收策略,可能不同)。

以上只是Servlet线程安全问题中一种常见情况,Servlet线程安全问题还有很多,比如Session的访问,但重点是,需要大家意识到Servlet是线程不安全的,于是在编写代码的时候一定要多思考,这样写是否存在线程安全问题。

参考资料:
1.Servlet Specification
2.深入理解Java虚拟机

Gradle深入与实战(四)自定义集成测试任务

| Comments

由于本小节,涉及到自定义任务,所以穿插一点自定义任务的知识。

Gradle Task

在前面已经介绍过Gradle和Ant相似,由任务驱动,以任务依赖的方式形成任务链,从而实现构建生命周期。所以,任务是Gradle中一个完整的可执行单元。

如何定义任务:

1
2
3
task hello {
    println 'hello Gradle'
}

执行该任务,只需要输入命令gradle hello。定义task的方式有很多种:

1
2
3
4
5
task myTask
task myTask { configure closure }
task myType << { task action }
task myTask(type: SomeType)
task myTask(type: SomeType) { configure closure }

其中有一种定义方式,传入了一个参数type,作用是预定义该task的类型,指定类型之后,在传入的闭包中就可以使用该类型task提供的特殊变量或函数。

比如一个拷贝类型的task

1
2
3
4
task copyDocs(type: Copy) {
    from 'src/main/doc'
    into 'build/target/doc'
}

更过关于Task的内容,在以后的章节中再介绍。

自定义集成测试任务

现在我们开始写一个集成测试的task,需求是这样的:

作为一个Java的程序员,我想要将单元测试和集成测试分离

1.我想要 将单元测试全部放在src/test/unit目录中,将集成测试全部放在src/test/intgetaion中
2.我想要 能够单独运行我的集成测试
3.我想要 在运行build命令时,同时跑单元测试和集成测试

根据这样的一个需求,划分几步来做:
1.建立目录
2.目录结构已经和原来的默认规约不同,所以要更改Java插件提供的SourceSet test,来映射单元测试目录结构
3.需要新建一个SourceSet intTest,来映射集成测试目录结构
4.Java插件会给新建的SourceSet intTest定义两个Configuration,分别是intTestCompile和intTestRuntime,那么就需要给这两个分组指定构件内容和依赖
5.定义一个名字叫做integrationTest的测试的task

那么我们从第二步和第三步开始,修改Java插件提供的SourceSet test和新建SourceSet intTest:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
// 定义一些常量,在其他位置使用
ext {
    unitJavaSrcDir = 'src/test/unit/java'
    unitResourcesSrcDir = 'src/test/unit/resources'
    intJavaSrcDir = 'src/test/integration/java'
    intResourcesSrcDir = 'src/test/integration/resources'
}

sourceSets {
    test {
        java {
            srcDir unitJavaSrcDir
        }
        resources {
            srcDir unitResourcesSrcDir
        }
    }
    intTest {
        java {
            srcDir intJavaSrcDir
        }
        resources {
            srcDir intResourcesSrcDir
        }
    }
}

第三步,给intTestCompile和intTestRuntime指定指定构件内容(产品代码)和依赖

1
2
3
4
5
6
7
dependencies {
    testCompile 'junit:junit:4.11'
    testCompile 'org.mockito:mockito-core:1.9.5'

    intTestCompile sourceSets.main.output // 将sourceSets.main中的输出class指定到intTestCompile中
    intTestCompile configurations.testCompile // 将configurations.testCompile的依赖拿过来
}

最后一步,定义一个test类型的task,并让check任务依赖于它

1
2
3
4
5
6
task integrationTest(type: Test) {
    testClassesDir = sourceSets.intTest.output.classesDir
    classpath = sourceSets.intTest.runtimeClasspath
}

check.dependsOn integrationTest

然后,你就可以在命令行中运行gradle integrationTest。

完整版本如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
apply plugin: 'java'
apply plugin: 'idea'

ext {
    unitJavaSrcDir = 'src/test/unit/java'
    unitResourcesSrcDir = 'src/test/unit/resources'
    intJavaSrcDir = 'src/test/integration/java'
    intResourcesSrcDir = 'src/test/integration/resources'
}

sourceSets {
    test {
        java {
            srcDir unitJavaSrcDir
        }
        resources {
            srcDir unitResourcesSrcDir
        }
    }
    intTest {
        java {
            srcDir intJavaSrcDir
        }
        resources {
            srcDir intResourcesSrcDir
        }
    }
}

repositories {
    mavenCentral()
}

dependencies {
    testCompile 'junit:junit:4.11'
    testCompile 'org.mockito:mockito-core:1.9.5'

    intTestCompile sourceSets.main.output
    intTestCompile configurations.testCompile
}

task integrationTest(type: Test) {
    testClassesDir = sourceSets.intTest.output.classesDir
    classpath = sourceSets.intTest.runtimeClasspath
}

check.dependsOn integrationTest

idea {
    module {
        testSourceDirs += file(unitJavaSrcDir)
        testSourceDirs += file(unitResourcesSrcDir)
        testSourceDirs += file(intJavaSrcDir)
        testSourceDirs += file(intResourcesSrcDir)
    }
}

参考资料:
1.Gradle官方文档
2.http://selimober.com/blog/2014/01/24/separate-unit-and-integration-tests-using-gradle/