参考笔记

JVM探究

  • 请你谈谈你对JVM的理解?java虚拟机和之前的变化更新?
  • 什么是OOM,什么是栈溢出StackOverFlowError?怎么分析?
  • JVM的常用调优参数有哪些?
  • 内存快照如何抓取,怎么分析Dump文件?知道吗?
  • 谈谈JVM中,类加载器你的认识?

    知识点

    c++–减的但是指针和内存管理

    JVM的位置

  1. JVM运行在操作系统(Window,Linux,Mac)上
  2. JVM底层用C写的
  3. 虚拟机之外的程序与JVM并列
  4. JRE包含JVM

JVM的体系结构

  1. .java文件经过javac命令编译成.class文件
  2. 经过类装载器Class Loader加载到JVM环境中,同时JVM返回与类加载器互动
  3. 执行引擎运行java

类加载器

作用:加载Class文件~

例如:Student student = new Student();引用放在栈中,new的实体对象存放在堆中。

  1. Car.class进入到JVM中的Class Loader加载、初始化Car Class
    //类是模板,对象是具体的
    Class<Car> carClass = Car.class;
  2. 通过Car Class实例化(new)car对象,反过来通过getClass()获取Car Class

    可以通过Car.class获取运行时类,也可以通过实例化对象getClass()方法获取运行时类

  3. Car Class通过getClassLoader获取Class Loader

类加载器

  • 虚拟机自带的加载器

  • 启动类(根)加载器(bootstrap class loader)
    它用来加载 Java 的核心类,是用原生代码来实现的,并不继承自 java.lang.ClassLoader(负责加载$JAVA_HOME中jre/lib/rt.jar里所有的class,由C++实现,不是ClassLoader子类)。由于引导类加载器涉及到虚拟机本地实现细节,开发者无法直接获取到启动类加载器的引用,所以不允许直接通过引用进行操作。

  • 扩展类加载器(ExtClassloader)
    它负责加载JRE的扩展目录,lib/ext或者由java.ext.dirs系统属性指定的目录中的JAR包的类。由Java语言实现,父类加载器为null。

  • 应用程序(系统类)加载器(AppClassloader)
    被称为系统(也称为应用)类加载器,它负责在JVM启动时加载来自Java命令的-classpath选项、java.class.path系统属性,或者CLASSPATH换将变量所指定的JAR包和类路径。程序可以通过ClassLoader的静态方法getSystemClassLoader()来获取系统类加载器。如果没有特别指定,则用户自定义的类加载器都以此类加载器作为父加载器。由Java语言实现,父类加载器为ExtClassLoader。

双亲委派机制 ***

双亲委派机制:保证安全,防止核心API库被随意篡改
它会先向上委托,App-》Ext-》Boot

由于双亲委派机制逐级向上委托;当boot找到该类则加载,否则报错通知Exc执行;Exc无该类加载报错通知App执行;App执行类加载

总结

  1. 类加载器收到类加载的请求
  2. 将这个请求向上委托给父类加载器去完成,一直向上委托,直到启动类(根)加载器 Boot
  3. 启动类加载器(根)检查是否能够加载当前这个类,能加载则结束,使用当前的加载器,否则,抛出异常,通知子加载类进行加载
  4. 重复步骤3
    如果最终都没有找到该类,则会报出经典错误Class Not Found~

沙箱安全机制

组成沙箱的基本组件:

  • 字节码校验器(bytecode verifier):确保Java文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有类文件都会经过字节码校验,比如核心类。
  • 类装载器(class loader):其中类装载器在3个方面对Java沙箱起作用
    1. 它防止恶意代码去干涉善意的代码; //双亲委派机制
    2. 它守护了被信任的类库边界;
    3. 它将代码归入保护域,确定了代码可以进行哪些操作。

native ***

public static void main(String[] args) {

new Thread(()->{},"my thread name").start();
}

// native:凡是带了native关键字的方法,说明java的作用范围达不到了,回去调用底层C语言的库!
// 会进入本地方法栈
// 调用本地方法本地接口 JNI 【Java Native Interface】
// JNI作用:扩展Java的使用,融合不同的编程语言为Java所用! 最初:C、C++
// Java诞生的时候C、C++ 横行,想要立足,必须要有调用C、C++的程序~
// 它在内存区域中专门开辟了一块标记区域:Native Method Stack,登记native 方法
// 在最终执行的时候,加载本地方法库中的方法通过JNI

//Java程序驱动打印机,管理系统,掌握即可,在企业级应用中较为少见
private native void start0();

//调用其他接口: Socket..WebService..http~

PC寄存器

程序技术器: Program Count Register
每个线程都有一个程序计数器,是线程私有的,就是一个指针,指向方法区中的方法字节码(用来存储指向像一条指令的地址,也即将要执行的指令代码),在执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不计

方法区


Method Area 方法区
方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间;

必背:静态变量static、常量final、类Class信息(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关

1.栈:数据结构
程序 = 数据结构+算法

栈:先进后出、后进先出
队列:先进先出 (FIFO:First Input First Output)

总结:
喝多了吐就是栈,吃多了拉就是队列

栈:栈内存,主管程序的运行,生命周期和线程同步;
线程结束,栈内存也就释放;
对于栈来说,不存在垃圾回收问题;
一旦线程结束,栈就Over!

栈:8大基本数据类型+对象引用+实例方法


栈满了则会抛出StackOverflowError

栈+堆+方法区:交互关系

三种JVM

  • Sun公司HotSpot Java HotSpot(TM) 64-Bit Server VM (build 25.131-b11, mixed mode)
  • BEA JRockit
  • IBM J9VM

我们学习都是:HotSpot

Heap,一个JVM只有一个堆内存,堆内存的大小是可以调节的。
类加载器读取了类文件后,一般会把什么东西放到堆中?类,方法,常量,变量~,保存我们所有引用类型的真实对象;
堆内存中还要细分为三个区域:

  • 新生区(伊甸园区) Young/New
  • 老年区 Old
  • 永久区 Per

    GC垃圾回收,主要是在伊甸园区和老年区~
    假设内存满了,OOM,堆内存不够!java.lang.OutOfMemoryError:Java heap space
    在JDK8以后,永久存储区改了个名字(元空间);

新生区(伊甸园区)

轻GC:Young GC
重GC:Full GC
Old GC :指的是老年区垃圾回收
假设伊甸园区只能存10个对象,当满了10个以后就会触发轻GC,如果有的对象还存在引用,则存活下来进入幸存者区;反之没用则死亡。轻GC后将幸存者区中的对象放回伊甸园区重复上操作;

老年区

当新生区(伊甸园区和幸存者区)都满的情况,则触发重GC,将清理幸存者区并且将幸存区存活下来的对象移到养老区,如果清理过后幸存区仍然放不下对象,则重GC会将对象直接放到养老区中,如果养老区也不足以放下对象,则会产生OOM;

真理:经过研究,99%的对象都是临时对象!

永久区

这个区域常驻内存的。用来存放JDK自身携带的Class对象,Interface元数据,存储的是Java运行时的一些环境或类信息这个区域不存在垃圾回收!关闭JVM虚拟机就会释放这个区域的内存
一个启动类,加载了大量的第三方jar包。Tomcat部署了太多的应用,大量动态生成的反射类。不断的被加载。直到内存满,就会出现OOM;

  • JDK1.6之前:永久代,常量池在方法区
  • JDK1.7:永久代,但是慢慢的退化了,去永久代,常量池在堆中
  • JKD1.8之后:无永久代,常量池在元空间

代码探究JVM


public static void main(String[] args) {
//返回虚拟机试图使用的最大内存
long max = Runtime.getRuntime().maxMemory();//字节 1024*1024
//返回jvm的初始化总内存
long total = Runtime.getRuntime().totalMemory();

System.out.println("max="+max+"字节\t"+(max/(double)1024/1024)+"MB");
System.out.println("total="+total+"字节\t"+(total/(double)1024/1024)+"MB");
//默认情况下:分配的总内存 是电脑内存的1/4,而初始化的内存:1/64
}

//OOM:
//1.尝试扩大推内存看结果
//JVM设置:-Xms1024m -Xmx1024m -XX:+PrintGCDetails
//2.分析内存,看一下那个地方出现了问题(专业工具)

//305664K + 699392K = 1,005,056K = 981.5MB

结果

max=1029177344字节	981.5MB
total=1029177344字节 981.5MB
Heap
PSYoungGen total 305664K, used 20971K [0x00000000eab00000, 0x0000000100000000, 0x0000000100000000)
eden space 262144K, 8% used [0x00000000eab00000,0x00000000ebf7afb8,0x00000000fab00000)
from space 43520K, 0% used [0x00000000fd580000,0x00000000fd580000,0x0000000100000000)
to space 43520K, 0% used [0x00000000fab00000,0x00000000fab00000,0x00000000fd580000)
ParOldGen total 699392K, used 0K [0x00000000c0000000, 0x00000000eab00000, 0x00000000eab00000)
object space 699392K, 0% used [0x00000000c0000000,0x00000000c0000000,0x00000000eab00000)
Metaspace used 3533K, capacity 4502K, committed 4864K, reserved 1056768K
class space used 391K, capacity 394K, committed 512K, reserved 1048576K

Process finished with exit code 0

在一个项目中,突然出现了OOM故障,那么该如何排除~研究为什么出错~

  • 能够看到代码第几行出错:内存快照分析工具,MAT,Jprofiler
  • DeBug,一行行分析代码!

MAT,Jrofiler作用:

  • 分析Dump内存文件,快速定位内存泄露;
  • 获取堆中数据
  • 获得大的对象~

测试JProfiler

//Dump
//-Xms 设置初始化内存分配大小 默认1/64
//-Xmx 设置最大分配内存 默认1/4
//-XX:+PrintGCDetails //打印GC垃圾回收信息
//-XX:+HeapDumpOnOutOfMemoryError //oom DUMP

//-Xms1m -Xmx8m -XX:+HeapDumpOnOutOfMemoryError
public class Demo3 {
byte[] arr = new byte[1*1024*1024];//1m

public static void main(String[] args) {

ArrayList<Demo3> list = new ArrayList<Demo3>();
int count = 0;

try {
while(true){
list.add(new Demo3());//问题所在
count= count +1;
}
} catch (Error e) {
System.out.println("count:"+count);
e.printStackTrace();
}
}
}

GC:垃圾回收

GC的作用区域在堆+方法区
JVM在进行GC时,并不是对着三个区域统一回收。大部分时候,回收都是新生代~

  • 新生代
  • 幸存区(from,to)
  • 老年区
    GC两种类:轻GC(普通的GC),重GC(全局GC)

GC题目:

  • JVM的内存模型和分区~详细到每个区放什么?
  • 堆里面的分区有哪些?Eden,from,to,老年区,说说他们的特点!
  • GC的算法有哪些?标记清除法,标记压缩,复制算法,引用计数器,怎么用的?
  • 轻GC和重GC分别在什么时候发生?

引用计数法


计数为0的被清除

复制算法


复制算法为了保证to区干净,所以谁空谁是幸运区to

  1. 每次GC 都会将Eden存活的对象移到幸存区中;一旦Eden区被GC后,就会是空的!
  2. 当一个对象经历了15次GC,都还没有死 -XX:MaxTenuringThreshold=15通过这个参数可以设定进入老年代的时间

优缺点:

  • 好处:没有内存的碎片~
  • 坏处:浪费了内存空间~:多了一般空间永远是空to。假设对象100%存活(极端情况)

复制算法最佳使用场景:对象存货度较低的时候;新生区~

标记清除算法

优缺点

  • 优点:不需要额外的空间!
  • 缺点:两次扫描,严重浪费时间,会产生内存碎片。

标记压缩

对标记清除再优化
先标记清除几次,再进行标记压缩

算法总结

内存效率:复制算法>标记清楚算法>标记压缩算法(时间复杂度)
内存整齐度:复制算法=标记压缩算法>标记清除算法
内存利用率:标记压缩算法=标记清除算法>复制算法

思考一个问题:难道没有最优算法吗?
答案:没有,没有最好的算法,只有最合适的算法—>GC:分代收集算法

年轻代:

  • 存活率低
  • 复制算法!

老年代:

  • 区域大:存活率大
  • 标记清除(内存碎片不是太多)+标记压缩混合实现

JMM:Java Memory Model

  1. 什么是JMM?
    JMM:(Java Memory Model)
  2. 它干嘛的?:官方,其他人的博客,对应的视频!
    作用:缓存一致性协议,用于定义数据读写的规则(遵守,找到这个规则)
    JMM定义了线程工作内存和主内存之间的抽象关系:线程之间的共享变量存储在主内存(Main Memory)中,每个线程都有一个私有的本地内存(Local Memory)

    解决共享对象可见性这个问题:volatile
  3. 它该如何学习?
    JMM:抽象的概念,理论
    JMM对这8种指令的使用,制定了如下规则:
  • 不允许read和load、store和write操作之一单独出现。即使用了read必须load,使用store必须write
  • 不允许线程丢弃他最近assign操作,即工作变量的数据改变了之后,必须告知主存
  • 不允许一个线程将没有assign的数据从工作内存同步回主内存
  • 一个新的变量必须在主内存中诞生,不允许工作内存直接是哦那个一个未被初始化的变量。就是怼变量实施use、store操作之前,必须经过assign和load操作
  • 一个变量同一时间只有一个线程能对其进行lock。多次lock后,必须执行相同次数的unlock才能解锁
  • 如果对一个变量进行lock操作,会清空所有工作内存中此变量的值,在执行引擎使用这个变量前,必须重新load或则assign操作初始化变量的值
  • 如果一个变量没有被lock,就不能对其进行unlock操作。也不能unlock一个被其他线程锁住的变量
  • 对一个变量进行unlock操作之前,必须把此变量同步回主内存
    JMM对着8种操作规则和对volatile的一些特殊规则就能确定哪里操作是线程安全,哪些操作是线程不安全的了。但是这些规则实在复杂,很难在实践种直接分析。所以一般我们也不会通过上述规则进行分析。更多的时候,使用java的happen-before规则来进行分析。