学习来源:Java八股文网
ArrayList
简介
ArrayList底层基于数组实现,可以随机访问,内部使用一个Object数组来保存元素。它维护了一个 elementData 数组和一个 size 字段,elementData数组用来存放元素,size字段用于记录元素个数。它允许元素是null,可以动态扩容。
初始化
源码:
// 默认容量大小,当你使用无参构造器 new ArrayList() 创建对象时,第一次添加元素(调用 add 方法)时,数组长度会被扩容为这个值(10)
private static final int DEFAULT_CAPACITY = 10;
// 用于空实例的共享空数组实例(当用户显式指定容量为 0 时使用)
private static final Object[] EMPTY_ELEMENTDATA = {};
// 用于默认大小空实例的共享空数组实例(当用户使用无参构造器时使用)
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
// 存储元素的数组,transient 表示该字段不参与默认的序列化过程
// 原因:elementData 的长度通常比实际存储的数据 size 大(比如数组长 10,但只存了 1 个数)。如果直接序列化整个数组,会把后面 9 个 null 也序列化进去,浪费空间。
transient Object[] elementData;
// 数组中元素个数,默认是0,注意区分 size 和 elementData.length(容量),size是当前元素个数,length是数组的容量空间
private int size;
// 无参初始化,默认是空数组
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
// 有参初始化,指定容量大小
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
// 直接使用指定的容量大小
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+initialCapacity);
}
}
为什么要有两个空数组?
这两个数组的作用是为了在第一次添加元素(扩容)时,让代码知道该怎么扩容。
当调用 add() 方法添加第一个元素时,ArrayList 会调用 calculateCapacity 方法来计算新容量:
如果你用的是
DEFAULTCAPACITY_EMPTY_ELEMENTDATA(场景 B):系统会认为:“哦,这个用户是用无参构造器创建的,他想要默认体验。”
于是,直接把容量从 0 跳变为 10 (
DEFAULT_CAPACITY)。目的: 避免刚开始添加几个元素就频繁扩容(0->1->2->3...),一步到位给 10 个空间,提升性能。
如果你用的是
EMPTY_ELEMENTDATA(场景 A):系统会认为:“这个用户显式指定了容量为 0,可能他真的只想存很少的数据,或者想自己控制。”
于是,它不会直接扩容到 10,而是按照最小需求(比如扩容到 1)开始增长。
序列化
序列化(Serializable):就是把内存中立体的、有结构的对象,转换成扁平的、连续的二进制字节流(010101...)的过程
反序列化 (Deserialization):就是把二进制字节流,重新恢复成内存中可用的对象的过程
在 Java 程序运行的时候,对象是活在内存(堆)里的。一旦程序关掉,内存清空,对象就没了。
如果你想让对象“活”得更久,或者“跑”到别的地方去,就需要序列化。
实现序列化:
implements Serializable:
Serializable接口里面没有任何方法!它只是一个“标记接口”。就像给箱子贴个“可空运”的贴纸,告诉 Java 虚拟机(JVM):“这个类的对象允许被拆解和组装”。serialVersionUID:相当于“版本号”。
现在主要用的是 JSON 序列化:
工具: Jackson, Gson, Fastjson.
过程: 把 Java 对象变成
{"name": "张三", "age": 24}这样的字符串。优点: 任何语言都认识字符串,轻量,可读性好。
添加元素
往ArrayList种添加元素时,调用的 add() 方法源码:
// 添加元素
public boolean add(E e) {
// 确保数组容量够用,size是元素个数
ensureCapacityInternal(size + 1);
// 直接在下个位置赋值
elementData[size++] = e;
return true;
}
// 确保数组容量够用
private void ensureCapacityInternal(int minCapacity) {
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}
// 计算所需最小容量
private static int calculateCapacity(Object[] elementData, int minCapacity) {
// 如果数组等于空数组,就设置默认容量为10
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
return Math.max(DEFAULT_CAPACITY, minCapacity);
}
return minCapacity;
}
// 确保容量够用
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
// 如果所需最小容量大于数组长度,就进行扩容
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}有关modcount
modCount并不是在ArrayList中定义的,而是在它的父类AbstractList中定义的,它的核心作用只有一个:防止在遍历(迭代)集合的过程中,集合的内容被意外修改。我们看看
ArrayList内部类Itr(迭代器)的源码:private class Itr implements Iterator<E> { // 1. 迭代器创建时,先把 ArrayList 的 modCount 抄下来 int expectedModCount = modCount; public E next() { // 2. 每次获取下一个元素前,先检查一下: // 现在的 modCount 和我当初抄下来的 expectedModCount 还一样吗? checkForComodification(); // ... 取元素逻辑 ... } final void checkForComodification() { // 3. 如果不一样,说明有人动过集合,直接报错! if (modCount != expectedModCount) throw new ConcurrentModificationException(); } }结构性修改(Structural Modification) 会增加
modCount:
add():增加元素 ✅ (modCount++)
remove():删除元素 ✅ (modCount++)
clear():清空集合 ✅ (modCount++)
ensureCapacity():扩容(虽然不改内容,但改了内部结构) ✅如果在遍历 ArrayList 时,我一定要删除元素怎么办?
错误写法(会报错):
for (String s : list) { if ("bad".equals(s)) { list.remove(s); // ❌ 这里调用的是 ArrayList 的 remove,会 modCount++,导致下次循环报错 } }正确写法(使用迭代器的 remove),或者使用
remove(int index)或者removeIf()方法:Iterator<String> it = list.iterator(); while (it.hasNext()) { String s = it.next(); if ("bad".equals(s)) { it.remove(); // ✅ 调用的是 Iterator 的 remove } } // 使用 remove(int index) 删除元素 for (int i = 0; i < list.size(); i++) { if (list.get(i).equals(2)) { list.remove(i); } } // 使用removeIf删除元素 list.removeIf(key -> key.equals(2));
扩容逻辑:
// 扩容,就是把旧数据拷贝到新数组里面
private void grow(int minCapacity) {
int oldCapacity = elementData.length;
// 计算新数组的容量大小,是旧容量的1.5倍
int newCapacity = oldCapacity + (oldCapacity >> 1);
// 如果扩容后的容量小于最小容量,扩容后的容量就等于最小容量
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
// 如果扩容后的容量大于Integer的最大值,就用Integer最大值
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// 扩容并赋值给原数组
elementData = Arrays.copyOf(elementData, newCapacity);
}
扩容的触发条件是数组全部被占满
扩容是以旧容量的1.5倍扩容,并不是2倍扩容,如果扩容后小于最小容量,就直接用最小容量。
最大容量是Integer的最大值
添加元素时,没有对元素校验,允许为null,也允许元素重复。
再看一下数组拷贝的逻辑,这里都是Arrays类里面的方法了:
/**
* @param original 原数组
* @param newLength 新的容量大小
*/
public static <T> T[] copyOf(T[] original, int newLength) {
return (T[]) copyOf(original, newLength, original.getClass());
}
public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {
// 如果原数组本身就是 Object[] 类型,直接 new Object[]
// 如果原数组是 String[] 等子类型,需要用反射 Array.newInstance 创建对应类型的数组
T[] copy = ((Object)newType == (Object)Object[].class)
? (T[]) new Object[newLength]
: (T[]) Array.newInstance(newType.getComponentType(), newLength);
// 把原数组的元素拷贝到新数组
System.arraycopy(original, 0, copy, 0,
Math.min(original.length, newLength));
return copy;
}最终调用了System类的数组拷贝方法,是native方法:
/**
* @param src 原数组
* @param srcPos 原数组的开始位置
* @param dest 目标数组
* @param destPos 目标数组的开始位置
* @param length 被拷贝的长度
*/
public static native void arraycopy(Object src, int srcPos,
Object dest, int destPos,
int length);
Class<? extends T[]>
它的意思是:“传入的这个
newType参数,必须是一个类对象(Class),而且这个类必须是T[]或者T[]的子类。”在 Java 中,数组是有继承关系的:
String是Object的子类。所以,
String[]也是Object[]的子类。这意味着:
Object[] arr = new String[10];是合法的。在泛型里,关系就变了:
虽然
String是Object的子类。但
Class<String[]>不是Class<Object[]>的子类!这意味着:如果方法参数写死为
Class<T[]> newType,当你T是Object时,你只能传Object[].class,不能传String[].class,否则编译器会报错。// 假设 T 是 Number(数字的基类) // 我们想拷贝出一个 Integer[](Integer 是 Number 的子类) Number[] result = Arrays.copyOf(original, 10, Integer[].class);
因为 Java 数组是协变的,
Integer[]是Number[]的子类。所以
Integer[].class符合? extends Number[]的限制。如果源码写成
Class<T[]> newType:
当
T是Number时,参数就死板地要求必须是Class<Number[]>。你传入
Integer[].class就会直接报错,因为泛型不认父子关系。
总结一下ArrayList的 add() 方法的逻辑:
检查容量是否够用,如果够用,直接在下一个位置赋值结束。
如果是第一次添加元素,则设置容量默认大小为10。
如果不是第一次添加元素,并且容量不够用,则执行扩容操作。扩容就是创建一个新数组,容量是原数组的1.5倍,再把原数组的元素拷贝到新数组,最后用新数组对象覆盖原数组。
需要注意的是,每次扩容都会创建新数组和拷贝数组,会有一定的时间和空间开销。在创建ArrayList的时候,如果我们可以提前预估元素的数量,最好通过有参构造函数,设置一个合适的初始容量,以减少动态扩容的次数。
删除单个元素
再看一下删除元素的方法 remove() 的源码:
public boolean remove(Object o) {
// 判断要删除的元素是否为null
if (o == null) {
// 遍历数组
for (int index = 0; index < size; index++)
// 如果和当前位置上的元素相等,就删除当前位置上的元素
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else {
// 遍历数组
for (int index = 0; index < size; index++)
// 如果和当前位置上的元素相等,就删除当前位置上的元素
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}
// 删除该位置上的元素
private void fastRemove(int index) {
modCount++;
// 计算需要移动的元素的个数
int numMoved = size - index - 1;
if (numMoved > 0)
// 从index+1位置开始拷贝,也就是后面的元素整体向左移动一个位置
System.arraycopy(elementData, index+1, elementData, index, numMoved);
// 设置数组最后一个元素赋值为null,防止会导致内存泄漏
elementData[--size] = null;
}删除元素的流程是:
判断要删除的元素是否为null,如果为null,则遍历数组,使用双等号比较元素是否相等。如果不是null,则使用
equals()方法比较元素是否相等。这里就显得啰嗦了,可以使用Objects.equals()方法,合并ifelse逻辑。如果找到相等的元素,则把后面位置的所有元素整体相左移动一个位置,并把数组最后一个元素赋值为null结束。
可以看到遍历数组的时候,找到相等的元素,删除就结束了。如果ArrayList中存在重复元素,也只会删除其中一个元素
批量删除
再看一下批量删除元素方法 removeAll() 的源码:
// 批量删除ArrayList和集合c都存在的元素
public boolean removeAll(Collection<?> c) {
// 非空校验
Objects.requireNonNull(c);
// 批量删除
return batchRemove(c, false);
}
// complement:removeAll 调用时传的是 false;retainAll 调用时传的是 true
private boolean batchRemove(Collection<?> c, boolean complement){
// 将堆内存(Heap)中的实例变量,转存为栈内存(Stack)中的局部变量
final Object[] elementData = this.elementData;
int r = 0, w = 0;
boolean modified = false;
try {
for (; r < size; r++)
if (c.contains(elementData[r]) == complement)
// 把需要保留的元素左移
elementData[w++] = elementData[r];
} finally {
// 当出现异常情况的时候,可能不相等
if (r != size) {
// 可能是其它线程添加了元素,把新增的元素也左移
System.arraycopy(elementData, r,
elementData, w,
size - r);
w += size - r;
}
// 把不需要保留的元素设置为null
if (w != size) {
for (int i = w; i < size; i++)
elementData[i] = null;
modCount += size - w;
size = w;
modified = true;
}
}
return modified;
}有关堆、栈区域的划分和功能
并发修改的问题
即modcount问题