赞
踩
堆分为两种:大堆和小堆。它们之间的区别在于元素在堆中的排列顺序和访问方式。
在大堆中,父节点的值比它的子节点的值要大。也就是说,堆的根节点是堆中最大的元素。大堆被用于实现优先级队列,其中根节点的元素始终是队列中最大的元素。
在小堆中,父节点的值比它的子节点的值要小。也就是说,堆的根节点是堆中最小的元素。小堆常用于实现优先级队列,其中根节点的元素始终是队列中最小的元素。
以下是一个示例图示,展示了一个包含 7 个元素的大堆和小堆的结构:
大堆:
90
/ \
75 30
/ \ / \
20 15 10 7
小堆:
7
/ \
10 30
/ \ / \
20 15 75 90
注意:堆总是一颗完全二叉树
从堆的概念可知,堆是一棵完全二叉树,因此可以层序的规则采用顺序的方式来高效存储,
注意:对于非完全二叉树,则不适合使用顺序方式进行存储,因为为了能够还原二叉树,空间中必须要存储空节点,就会导致空间利用率比较低。
将元素存储到数组中后,可以根据二叉树章节的性质 5 对树进行还原,假设 i 为节点在数组中的下标,则有:
对于集合 { 27,15,19,18,28,34,65,49,25,37 } 中的数据,如果将其创建成小堆呢?
仔细观察上图后发现:根节点的左右子树已经完全满足堆的性质,因此只需将根节点向下调整好即可。
下面是代码实现:
// shiftDown方法用来实现下沉操作 // array参数是待构建小堆的数组 // parent参数是当前需要下沉的节点的索引 public void shiftDown(int[] array, int parent) { int length = array.length; int child = 2 * parent + 1; // 左子节点索引 while (child < length) { // 找到左右孩子中较小的孩子 if (child + 1 < length && array[child] > array[child + 1]) { child++; // 如果右子节点存在并且小于左子节点的值,则将child指向右子节点 } // 如果当前节点小于或等于左右子节点中较小的节点,说明已经符合小堆要求 if (array[parent] <= array[child]) { break; } // 否则,交换当前节点和较小子节点的值,接着需要继续向下调整 int temp = array[parent]; array[parent] = array[child]; array[child] = temp; parent = child; child = 2 * parent + 1; } }
这段代码实现了堆排序中的下沉操作(也称为向下调整或堆化)。下沉操作用于维护小堆的性质,确保父节点永远小于或等于其子节点。
时间复杂度分析:最坏的情况即图示的情况,从根一路比较到叶子,比较的次数为完全二叉树的高度,即时间复杂度为 O(log n)
那对于普通的序列 { 1,5,3,8,7,6 },即根节点的左右子树不满足大堆的特性,又该如何调整呢?
参考代码:
public static void createHeap(int[] array) {
// 找倒数第一个非叶子节点,从该节点位置开始往前一直到根节点,遇到一个节点,应用向下调整
int root = ((array.length-2)>>1);
for (; root >= 0; root--) {
shiftDown(array, root);
}
}
因为堆是完全二叉树,而满二叉树也是完全二叉树,此处为了简化使用满二叉树来证明( 时间复杂度本来看的就是近似值,多几个节点不影响最终结果 ):
因此:建堆的时间复杂度为 O(N)。
堆的插入总共需要两个步骤:
下面是堆的删除操作的代码实现:
注意:堆的删除一定删除的是堆顶元素。具体如下:
下面是堆的删除操作代码实现:
public void deleteTop() { // 将堆顶元素与堆中最后一个元素交换 array[0] = array[size - 1]; // 堆中有效数据个数减少一个 size--; // 对堆顶元素进行向下调整 int parent = 0; // 当前节点的索引 // 持续向下调整,直到满足堆的性质 while (true) { // 左孩子节点的索引 int leftChild = parent * 2 + 1; // 右孩子节点的索引 int rightChild = leftChild + 1; // 父节点与左右孩子节点中值最大的节点进行交换 int maxChild = parent; // 最大值节点的索引 // 如果左孩子存在且大于父节点,则更新最大值节点 if (leftChild < size && array[leftChild] > array[maxChild]) { maxChild = leftChild; } // 如果右孩子存在且大于当前最大值节点,则更新最大值节点 if (rightChild < size && array[rightChild] > array[maxChild]) { maxChild = rightChild; } // 如果最大值节点是当前节点本身,则调整结束 if (maxChild == parent) { break; } else { // 交换最大节点与父节点 int temp = array[parent]; array[parent] = array[maxChild]; array[maxChild] = temp; // 更新当前节点为最大值节点 parent = maxChild; } } }
前面介绍过队列,队列是一种先进先出 (FIFO) 的数据结构.
但有些情况下,操作的数据可能带有优先级,出队列时,可能需要优先级高的元素先出队列,此时使用队列显然不合适,比如:在手机上玩游戏的时候,如果有来电,那么系统应该优先处理打进来的电话;初中那会班主任排座位时可能会让成绩好的同学先挑座位。
在这种情况下,数据结构应该提供两个最基本的操作,一个是返回最高优先级对象,一个是添加新的对象。这种数据结构就是优先级队列(Priority Queue)。
Java 集合框架中提供了 PriorityQueue 和 PriorityBlockingQueue 两种类型的优先级队列,PriorityQueue 是线程不安全的,PriorityBlockingQueue 是线程安全的,本文主要介绍 PriorityQueue。
关于 PriorityQueue 的使用要注意:
PriorityQueue 中常见的构造方法:
构造器 | 功能介绍 |
---|---|
PriorityQueue() | 创建一个空的优先级队列,默认容量是11 |
PriorityQueue(int initialCapacity) | 创建一个初始容量为 initialCapacity 的优先级队列,注意: initialCapacity 不能小于 1,否则会抛 IllegalArgumentException 异常 |
PriorityQueue(Collection<? extends E> c) | 用一个集合来创建优先级队列 |
下面是使用示例:
static void TestPriorityQueue(){ // 创建一个空的优先级队列,底层默认容量是11 PriorityQueue<Integer> q1 = new PriorityQueue<>(); // 创建一个空的优先级队列,底层的容量为initialCapacity PriorityQueue<Integer> q2 = new PriorityQueue<>(100); ArrayList<Integer> list = new ArrayList<>(); list.add(4); list.add(3); list.add(2); list.add(1); // 用ArrayList对象来构造一个优先级队列的对象 // q3中已经包含了三个元素 PriorityQueue<Integer> q3 = new PriorityQueue<>(list); System.out.println(q3.size());//4 System.out.println(q3.peek());//1 }
默认情况下,PriorityQueue 队列是小堆,如果需要大堆需要用户提供比较器
// 用户自己定义的比较器:直接实现Comparator接口,然后重写该接口中的compare方法即可 class IntCmp implements Comparator<Integer>{ @Override public int compare(Integer o1, Integer o2) { // 比较器 return o2-o1; } } public class TestPriorityQueue { public static void main(String[] args) { PriorityQueue<Integer> p = new PriorityQueue<>(new IntCmp()); p.offer(4); p.offer(3); p.offer(2); p.offer(1); p.offer(5); System.out.println(p.peek()); } }
下面是 PriorityQueue 中常用的方法:
函数名 | 功能介绍 |
---|---|
boolean offer(E e) | 插入元素e,插入成功返回 true,如果 e 对象为空,抛出 NullPointerException 异常,注意:空间不够时候会进行扩容 |
E peek() | 获取优先级最高的元素,如果优先级队列为空,返回null |
E poll() | 移除优先级最高的元素并返回,如果优先级队列为空,返回null |
int size() | 获取有效元素的个数 |
void clear() | 清空 |
boolean isEmpty() | 检测优先级队列是否为空,空返回true |
下面是这些方法的使用示例:
import java.util.PriorityQueue; public class Main { public static void main(String[] args) { PriorityQueue<Integer> heap = new PriorityQueue<>(); // 测试插入元素 heap.offer(10); // 返回 true heap.offer(5); // 返回 true heap.offer(15); // 返回 true heap.offer(2); // 返回 true // 测试获取优先级最高的元素 // 结果为 2 System.out.println(heap.peek()); // 测试移除优先级最高的元素 // 结果为 2 System.out.println(heap.poll()); // 测试获取有效元素的个数 // 结果为 3 System.out.println(heap.size()); // 测试清空优先级队列 heap.clear(); // 测试检测优先级队列是否为空 // 结果为 true System.out.println(heap.isEmpty()); } }
以下是 JDK 1.8 中,PriorityQueue 的扩容方式:
MAX_ARRAY_SIZE 等于 Integer.MAX_VALUE - 8,等于 2,147,483,639。
我们通过堆可以模拟实现优先级队列,因为堆具有以下特性:
优先性在优先级队列中体现在以下方面:
通过以上方式,可以使用堆来实现优先级队列,确保具有更高优先级的元素优先被处理或删除,下面我们基于堆来模拟实现一个优先级队列:
public class MyPriorityQueue { // 演示作用,不再考虑扩容部分的代码 private int[] array = new int[100]; // 使用数组来存储元素 private int size = 0; // 当前队列的大小 // 向优先队列中插入元素 public void offer(int e) { array[size++] = e; // 将元素插入数组末尾 shiftUp(size - 1); // 对插入的元素进行上浮操作,以保持堆的性质 } // 弹出并返回优先队列中最高优先级的元素 public int poll() { int oldValue = array[0]; // 保存堆顶元素的值 array[0] = array[--size]; // 将堆尾元素移到堆顶 shiftDown(0); // 对堆顶元素进行下沉操作,以保持堆的性质 return oldValue; // 返回弹出的元素值 } // 返回优先队列中最高优先级的元素 public int peek() { return array[0]; // 直接返回堆顶元素的值 } } //扩容代码
堆排序即利用堆的思想来进行排序,总共分为两个步骤:
升序:建大堆
降序:建小堆
建堆和堆删除中都用到了向下调整,因此掌握了向下调整,就可以完成堆排序。
TOP-K 问题:即求数据集合中前 K 个最大的元素或者最小的元素,一般情况下数据量都比较大。
比如:专业前 10 名、世界 500 强、富豪榜、游戏中前 100 的活跃玩家等 , 我们可以通过使用堆来解决 TOP-K 问题,具体步骤如下:
下面是一个使用 Java 实现堆解决 TOP-K 问题的示例代码:
import java.util.PriorityQueue; public class TopK { public static void main(String[] args) { int[] nums = {9, 3, 7, 5, 1, 8, 2, 6, 4}; int k = 4; findTopK(nums, k); } private static void findTopK(int[] nums, int k) { PriorityQueue<Integer> minHeap = new PriorityQueue<>(); for (int num : nums) { if (minHeap.size() < k) { minHeap.offer(num); } else if (num > minHeap.peek()) { minHeap.poll(); minHeap.offer(num); } } System.out.println("Top " + k + " elements:"); while (!minHeap.isEmpty()) { System.out.print(minHeap.poll() + " "); } } }
以上示例中,对数组 nums
求前4个最小元素,使用了 PriorityQueue
实现了一个小顶堆。遍历数组时,根据堆的大小和当前元素与堆顶元素的比较进行插入和调整。最后,打印出堆中的元素即为前 4 个最小的元素。
优先级队列在插入元素时有个要求:插入的元素不能是 null 或者元素之间必须要能够进行比较,为了简单起见,我们只是插入了 Integer 类型,那优先级队列中能否插入自定义类型对象呢?
class Card { public int rank; // 数值 public String suit; // 花色 public Card(int rank, String suit) { this.rank = rank; this.suit = suit; } } public class TestPriorityQueue { public static void TestPriorityQueue() { PriorityQueue<Card> p = new PriorityQueue<>(); p.offer(new Card(1, "♠")); p.offer(new Card(2, "♠")); } public static void main(String[] args) { TestPriorityQueue(); } }
优先级队列底层使用堆,而向堆中插入元素时,为了满足堆的性质,必须要进行元素的比较,而此时 Card 是没有办法直接进行比较的,因此抛出异常。
因为 Card 是引用类型,所以当我们需要比较他们的时候,需要重写 equals 方法,通过这个方法来告诉程序比较的规则是什么。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。