JAVA线程模型
线程的实现主要有3种方式:
- 使用内核线程实现(1:1)
- 使用用户线程实现(1:N)
- 使用用户线程加轻量级进程实现(N:M)
使用内核线程实现(Kernel-Level Thread, KLT)(1:1)
内核线程就是直接由操作系统内核支持的线程,这种线程由内核来完成线程的切换,内核通过操作调度器对线程进行调度,并负责将线程的任务映射到各个处理器上。
程序一般不会直接去使用内核,而是去使用线程的一种高级接口——轻量级进程(Light Weight Process,LWP),轻量级进程就是我们通常意义上的线程,由于每个轻量级进程都是由一个内核线程支持的,因此只有先支持内核线程,才能有轻量级进程。这种轻量级进程与内核线程直接1:1的关系称为一对一线程模型。
优点:实现简单
缺点:
- 线程的各种操作都需要系统调度,需要在用户态和内核态中来回切换,系统调用的代价相对较高;
- 其次,每个轻量级继承都需要一个内核线程来支持,因此轻量级进程要消耗一定的内核资源,一个系统支持的轻量级进程数量有限,如果系统出现大量线程,会对系统性能有影响;
使用用户线程实现 (1:N)
广义上来说,一个线程只要不是内核线程,就可以认为是用户线程(User Thread,UT),从这个角度来看,轻量级进程也就是用户线程,但是轻量级进程始终是和内核线程有关系的,效率终究会受到限制。
狭义上来说,用户线程指的是完全建立在用户空间的线程库上,系统内核不能感知到线程存在的实现。用户线程的建立、同步、调度和销毁完全在用户态完成,不需要内核的帮助。这种线程不需要切换到内核态,所以可以是非常快速且低消耗的,也可以支持更大规模的线程数量。这种进程与用户线程之间1:N的关系称为一对多线程模型。
优点:
- 不需要系统内核线程的支持,用户线程的很多操作对内核来说都是透明的,不需要用户态和内核态的频繁切换,使线程的创建、调度、同步等非常快;
缺点:
- 需要用户程序自己处理线程的所有操作,JAVA曾经使用过用户线程,最终放弃使用。
- 由于多个用户线程对应到同一个内核线程,如果其中一个用户线程阻塞,那么该其他用户线程也无法执行;
- 内核并不知道用户态有哪些线程,无法像内核线程一样实现较完整的调度、优先级等;
使用用户线程加轻量级进程实现 N:M)
将内核线程与用户线程一起使用的组合方式,为N:M的关系,这种就是多对多线程模型。
优点:
- 兼具多对一模型的轻量;
- 由于对应了多个内核线程,则一个用户线程阻塞时,其他用户线程仍然可以执行;
- 由于对应了多个内核线程,则可以实现较完整的调度、优先级等;
缺点:
- 实现复杂
Go语言中的goroutine调度器就是采用的这种实现方案
JAVA线程的实现
在JDK1.2之前,JAVA线程是基于称为“绿色线程(Green Thread)”的用户线程来实现的,而在JDK1.2中,线程模型替换为基于操作系统原生线程模型来实现的。
在目前的JDK版本中,操作系统支持怎样的线程模型,很大程度上决定了JAVA虚拟机的线程是怎样映射的,在不同的平台上实现可能是不一样的,线程模型只对线程的并发规模和操作成本产生影响,对JAVA程序的编码和运行过程来说,差异都是透明的。
对于Sun JDK 来说,它的Windows版本和 Linux 版本都是使用的一对一线程模型来实现的,即一条线程就映射到一条轻量级进程中,因为 Windows 系统和 Linux 系统提供的线程模型都是一对一的。
JAVA线程调度
线程调度是说系统为线程分配处理器使用权的过程。主要的调度方式有两种:
-
协同式线程调度
线程的执行时间是由线程本身控制的,线程工作执行完成之后,需要主动通知系统切换到另一个线程上。Lua 语言中的“协同例程”就是这类实现。
好处:实现简单
缺点:线程执行时间不可控,可能会一直阻塞,导致系统崩溃
-
抢占式线程调度
每个线程由系统来分配执行时间,线程的切换不由线程本身来决定(在JAVA中,Thread.yield() 可以主动让出CPU使用权,但要获取,线程本身是没有任何办法的)
优点:线程的执行时间系统可控,不会有一个线程阻塞而导致整个进程阻塞
JAVA 使用的是抢占式调度方式
JAVA线程状态
JAVA 定义了5种线程状态,在任意一个时间点上,线程有且只能有一个状态;5个状态分别如下:
- 新建(New) 创建后尚未启动的线程所处的状态
- 运行(Runable) Runable 包括了操作系统线程状态的Running 和 Ready,也就是处于此状态的 JAVA 线程可能正在运行,也有可能正在等待分配CPU时间片
- 无限期等待(Waiting) 处于这种状态的线程不会被分配CPU 时间片,需要等待被其他线程显式地唤醒。 以下方法会让线程进入到无限期等待:- 调用没有设置 timeout 参数的 Object.wait() 方法 - 调用没有设置 timeout 参数的 Thread.join() 方法 - 调用LockSuport.park() 方法
- 有限期等待(Timed Waiting) 处于这种状态的线程也不会被分配CPU 时间片,但是不需要其他线程显式地唤醒,而是等待一定时间后会由系统自动唤醒 以下方法会让线程进入到有限期等待:- Thread.sleep() 方法 - 调用设置了 timeout 参数的 Object.wait() 方法 - 调用设置了 timeout 参数的 Thread.join() 方法 - 调用LockSuport.parkNanos(long nanos) 方法 - 调用LockSuport.parkUntil(long deadline) 方法
- 阻塞(Blocked) 线程被阻塞了,“阻塞状态”与“等待状态”的区别是: 阻塞状态在等待获取一个排它锁;等待状态则是在等待一段时间,或者唤醒动作的发生。在使用了 synchronized 等同步语句时会进入这种状态。
- 结束(Terminated) 终止线程的线程状态,线程已完成执行。