Java 类加载机制深度剖析

Java

Posted by 王明高 on March 28, 2020

1 类加载机制

多个 java 文件经过编译打包后生成可运行 jar 包,最终由 java 命令运行某个主类的 main 函数启动程序,这里首先需要通过类加载器把主类加载到 JVM。

主类在运行过程中如果使用到其它类,会逐步加载这些类。

注意:jar 包里的类不是一次性全部加载的,是使用到时才加载。

类加载到使用整个过程有如下几步:

加载 » 验证 » 准备 » 解析 » 初始化 » 使用 » 卸载

  • 加载:在硬盘上查找并通过 IO 读入字节码文件,使用到类时才会加载,例如:调用类的 Main() 方法,new 对象等等
  • 验证:校验字节码文件的正确性
  • 准备:给类的静态变量分配内存,并赋予默认值
  • 解析:将符号引用替换为直接引用,该阶段会把一些静态变量(符号引用,比如:Main() 方法)替换为指向数据所存内存的指针或句柄等(直接引用),这是所谓的静态链接过程(类加载期间完成),动态链接是在程序运行期间完成的将符号引用替换为直接引用
  • 初始化:对类的静态变量初始化为指定的值,执行静态代码块

类加载过程图

2 类加载器和双亲委派机制

上面的类加载过程主要是通过类加载器来实现的,Java 里有如下几种类加载器:

  • 启动类加载器:负责加载支撑 JVM 运行的位于 JRE 的 lib 目录下的核心类库,比如 rt.jar、charset.jar 等
  • 扩展类加载器:负责加载支撑 JVM 运行的位于 JRE 的 lib 目录下的 ext 扩展目录中的 JAR 类包
  • 应用程序类加载器:负责加载 ClassPath 路径下的类包,主要加载你自己写的那些类
  • 自定义加载器: 负责加载用户自定义路径下的类包

类加载器示例:

...
import com.sun.crypto.provider.DESKeyFactory;

public class TestClassLoader {

    public static void main(String[] args) {

        System.out.println(String.class.getClassLoader());
        System.out.println(DESKeyFactory.class.getClassLoader().getClass().getName());
        System.out.println(TestClassLoader.class.getClassLoader().getClass().getName());
        System.out.println(ClassLoader.getSystemClassLoader().getClass().getName());
    }
}

运行结果:

null // 启动类加载器是C++语言实现,所以打印不出来
sun.misc.Launcher$ExtClassLoader
sun.misc.Launcher$AppClassLoader
sun.misc.Launcher$AppClassLoader

2.1 自定义一个类加载器示例:

自定义类加载器只需要继承 java.lang.ClassLoader 类,该类有两个核心方法,一个是 loadClass(String, boolean),实现了双亲委派机制,大体逻辑:

  • 首先,检查一下指定名称的类是否已经加载过,如果加载过了,就不需要再加载,直接返回
  • 如果此类没有加载过,那么再判断一下是否有父加载器;如果是父加载器,则由父加载器加载(即调用 parent.loadClass(name, false);),或者是调用 bootstrap 类加载器来加载
  • 如果父加载器及 bootstrap 类加载器都没有找到指定的类,那么调用当前类加载器的 findClass 方法完成类加载

findClass 方法默认实现是抛出异常,所以我们自定义类加载器主要是重写 findClass 方法,示例如下:

...
import java.io.FileInputStream;
import java.lang.reflect.InvocationTargetException;
import java.lang.reflect.Method;

public class MyClassLoaderTest {

    static class MyClassLoader extends ClassLoader {

        private final String classPath;

        public MyClassLoader(String classPath) {
            this.classPath = classPath;
        }

        private byte[] loadByte(String name) throws Exception {

            name = name.replaceAll("\\.", "/");
            FileInputStream fis = new FileInputStream(classPath + "/" + name + ".class");
            int len = fis.available();
            byte[] data = new byte[len];
            fis.read(data);
            fis.close();
            return data;
        }

        protected Class<?> findClass(String name) throws ClassNotFoundException {

            try {
                byte[] data = loadByte(name);
                // defineClass 将一个字节数组转为 Class 对象,这个字节数组是 class 文件读取后最终的字节数组。
                return defineClass(name, data, 0, data.length);
            } catch (Exception e) {
                e.printStackTrace();
                throw new ClassNotFoundException();
            }
        }
    }

    public static void main(String[] args) throws ClassNotFoundException, IllegalAccessException,
            InstantiationException, NoSuchMethodException, InvocationTargetException {

        MyClassLoader myClassLoader = new MyClassLoader("D:/test");
        Class<?> clazz = myClassLoader.loadClass("com.wmg.jvm.user");
        Object obj = clazz.newInstance();
        Method method = clazz.getDeclaredMethod("sout", null);
        method.invoke(obj, null);
        System.out.println(clazz.getClassLoader().getClass().getName());
    }

运行结果:

=======自己的加载器加载类调用方法=======
com.wmg.jvm.MyClassLoaderTest$MyClassLoade    

2.2 双亲委派机制

JVM 类加载器双亲委派结构图:

这里类加载其实就有一个双亲委派机制,加载某个类时会先委托加载器寻找目标类,找不到再委托上层加载器加载,如果所有父加载器在自己的加载类路径下都找不到目标类,则在自己的类加载路径中查找并载入目标类。

比如我们的 Math 类,最先会找应用程序加载器加载,应用程序类加载器会先委托扩展类加载器加载,扩展类加载器在委托启动类加载器,顶层启动类加载器在自己的类加载路径里没有找到 Math 类,则向下退回加载 Math 类的请求,扩展类加载器收到回复就自己加载,在自己的类加载路径里中找也没找到 Math 类,又向下退回 Math 类的加载请求给应用程序类加载器,应用程序类于是在自己的类加载路径里找 Math 类,结果找到了就自己加载。

双亲委派机制简单点说就是,先找父亲加载,不行再有儿子自己加载

为什么要设计双亲委派机制?

  • 沙箱安全机制:自己写的 java.lang.String.class 类不会被加载,这样便可以防止核心 API 库被随意篡改
  • 避免类的重复加载:当父亲已经加载了该类时,就没有必要子 ClassLoader 再加载一次,保证被加载类的唯一性

一个类的加载示例:

public class String {

    public static void main(String[] args) {

        System.out.println("---------my String class----------");
    }
}

运行结果:

错误在类 java.lang.String 中找不到 main 方法请将 main 方法定义为
public static void main(String[] args)
否则 JavaFx 应用程序类必须扩展 javafx.application.Applicatizon

再来一个沙箱安全机制示例,尝试打破双亲委派机制,用自定义加载器加载我们自己实现 java.lang.String.class

import java.io.FileInputStream;
import java.lang.reflect.InvocationTargetException;
import java.lang.reflect.Method;

public class MyClassLoaderTest2 {

    static class MyClassLoader2 extends ClassLoader {

        private final String classPath;

        public MyClassLoader2(String classPath) {
            this.classPath = classPath;
        }

        private byte[] loadByte(String name) throws Exception {

            name = name.replaceAll("\\.", "/");
            FileInputStream fis = new FileInputStream(classPath + "/" + name + ".class");
            int len = fis.available();
            byte[] data = new byte[len];
            fis.read(data);
            fis.close();
            return data;
        }

        protected Class<?> findClass(String name) throws ClassNotFoundException {

            try {
                byte[] data = loadByte(name);
                // defineClass 将一个字节数组转为 Class 对象,这个字节数组是 class 文件读取后最终的字节数组。
                return defineClass(name, data, 0, data.length);
            } catch (Exception e) {
                e.printStackTrace();
                throw new ClassNotFoundException();
            }
        }

        /**
         * 重新类加载方法,实现自己的加载逻辑,不委派给双亲加载
         * @param name
         * @param resolve
         * @return
         */
        protected Class<?> loadClass(String name, boolean resolve) throws ClassNotFoundException{

            synchronized (getClassLoadingLock(name)){
                // First, check if the class has already been loaded
                Class<?> c = findLoadedClass(name);
                if(c == null) {
                    // If still no found, then invoke findClass in order
                    // to find the class
                    long t1 = System.nanoTime();

                    // this is the defining class loader; record the status
                    sun.misc.PerfCounter.getFindClassTime().addElapsedTimeFrom(t1);
                    sun.misc.PerfCounter.getFindClasses().increment();
                }
                if(resolve) {
                    resolveClass(c);
                }
                return c;
            }
        }
    }

    public static void main(String[] args) throws ClassNotFoundException, IllegalAccessException,
            InstantiationException, NoSuchMethodException, InvocationTargetException {

        MyClassLoaderTest.MyClassLoader myClassLoader = new MyClassLoaderTest.MyClassLoader("D:/test");
        Class<?> clazz = myClassLoader.loadClass("java.lang.String");
        Object obj = clazz.newInstance();
        Method method = clazz.getDeclaredMethod("sout", null);
        method.invoke(obj, null);
        System.out.println(clazz.getClassLoader().getClass().getName());
    }

运行结果:

java.lang.SecurityException: Prohibited package name: java.lang
at java.lang.ClassLoader.preDefineClass(ClassLoader.java:659)
at java.lang.ClassLoader.defineClass(ClassLoader.java:758)    

打破双亲委派

以 Tomcat 类加载为例,Tomcat 如果使用默认的双亲委派加载机制行不行?

我们思考一下:Tomcat 是个 web 容器,那么他要解决什么问题:

  • 一个 web 容器可能需要部署两个应用程序,不同的应用程序可能会依赖同一个第三方类的不同版本,不能要求同一个类库在同一个服务器只有一份,因此要保证每个应用程序的类库都是是独立的,保证相互隔离
  • 部署在同一个 web 容器中相同的类库相同的版本可以共享。否则,如果服务器有 10 个应用程序,那么要有 10 份相同的类库加载进虚拟机
  • web 容器也有自己依赖的类库,不能与应用程序的类库混淆。基本安全考虑,应该让容器的类库和程序的类库隔离开来
  • web 容器要支持 jsp 的修改,我们知道,jsp 文件最终也是要编译成 class 文件才能在虚拟机中运行,但程序运行后修改 jsp 已经是司空见惯的事情,web 容器需要支持 jsp 修改后不用重启

答案是:使用 默认的双亲委派类加载机制是不行的。

第一个问题,如果使用默认的类加载器机制,那么是无法加载两个相同类库的不同版本的,默认的类加载器是不管你是什么版本,只在乎你的全限定类名,并且只有一份。

第二个问题,默认的类加载器是能够实现的,因为他的职责是保证唯一性。

第三个问题和第一个问题一样。

第四个问题,我们想要怎么实现 jsp 文件的热加载,jsp 文件其实也就是 class 文件,那么如果修改了,但类名还是一样,类加载器会直接取方法区中已经存在的,修改后的 jsp 是不会重新加载的。那么怎么办?我们可以直接卸载这 jsp 文件的类加载器,所以应该想到了,每个 jsp 文件对应一个唯一的类加载器,当一个 jsp 文件修改了,就直接卸载这个 jsp 类加载器。重新创建类加载器,重新加载 jsp 文件。

Tomcat自定义加载器详解

tomcat 的几个主要类加载器:

  • CommonClassLoader:Tomcat 最基本的类加载器,加载路径中的 class 可以被 Tomcat 容器本身以及各个 Webapp 访问
  • CatalinaClassLoader:Tomcat 容器私有的类加载器,加载路径中年的 class 对于 Webapp 不可见
  • ShareClassLoader:各个 Webapp 共享的类加载器,加载路径中的 class 对于所有 Webapp 可见,但是对于 Tomcat 容器不可见
  • WebappClassLoader:各个 Webapp 私有的类加载器,加载路径转给你的 class 只对当前 Webapp 可见

从图中的委派关系中可以看出:

CommonClassLoader 能加载的类都可以被 CatalinaClassLoader 和 ShareClassLoader 使用,从而实现了公有类的公用,而 CatalinaClassLoader 和 ShareClassLoader 自己能加载的类则与对方隔离。

WebAppClassLoader 可以使用 ShareClassLoader 加载到的类,但各个 WebAppClassLoader 实例直接相互隔离。

而 JasperClassLoader 的加载范围仅仅是这个 jsp 文件所编译出来的哪一个 .Class 文件,他出现的目的就是为了被丢弃:当 Web 容器检测到 jsp 被修改时,会替换掉目前的 JasperClassLoader的实例,并通过在建立一个新的 jsp 类加载器实现 jsp 文件的热加载功能。

tomcat 这种类加载机制违背了 java 推荐的双亲委派模型乱码?答案是:违背了。

双亲委派要求出了顶层的启动类加载器之外,其余的类加载器都应答由自己的父类加载器加载。

很显然,tomcat 不是这样实现,tomcat 为了实现隔离,没有遵守这个约定,每个 WebAppClassLoader 加载自己的目录下的 class 文件,不会传递给父类加载器,打破了双亲委派机制。