您现在的位置是:首页 >其他 >堆的应用(堆排序、TOP - K问题)网站首页其他

堆的应用(堆排序、TOP - K问题)

硕硕C语言 2024-07-11 06:01:02
简介堆的应用(堆排序、TOP - K问题)

前言

时间复杂度:

堆排序的最坏时间复杂度为 :O(n*lg(n))

TOP - K问题的最坏时间复杂度为:O(n*lg(k))

    ?前面我们学习了二叉树、以及堆的结构,也用顺序表的结构成功的把堆的结构一步一步的敲出来了。IT公司的吉祥“树” 二叉树-(堆)C语言创建_硕硕C语言的博客-CSDN博客(里面有一些树的基础知识,没有了解过的可以看一看,顺便来个三连应该不过分吧?)
,下面我将带领着大家来了解一下堆有什么应用、怎么用、用这个有什么好处。

堆排序

        ?堆排序即利用堆的思想来进行排序,总共分为两个步骤:

1. 建堆

?升序:建大堆
?降序:建小堆

 2. 利用堆删除思想来进行排序

? 建堆和堆删除中都用到了向下调整,因此掌握了向下调整,就可以完成堆排序。

思路:

⭕1.首先将待排序的数组构造成一个大根堆,此时,整个数组的最大值就是堆结构的顶端

⭕2.将顶端的数与末尾的数交换,此时,末尾的数为最大值,剩余待排序数组个数为n-1

⭕3.将剩余的n-1个数再构造成大根堆,再将顶端数与n-1位置的数交换,如此反复执行,便能得到有序数组

最详细的堆排序---排序算法,思路清晰动图讲解,五分钟搞懂!_Steve_hanhaiLong的博客-CSDN博客_堆排序

python-列表排序_QFIUNE的博客-CSDN博客_python列表排序

3. 代码: 

    //堆排序
    public static void heapSort(int[] arr) {
        //构造大根堆
        heapInsert(arr);
        int size = arr.length;
        while (size > 1) {
            //固定最大值
            swap(arr, 0, size - 1);
            size--;
            //构造大根堆
            heapify(arr, 0, size);
 
        }
 
    }
 
    //构造大根堆(通过新插入的数上升)
    public static void heapInsert(int[] arr) {
        for (int i = 0; i < arr.length; i++) {
            //当前插入的索引
            int currentIndex = i;
            //父结点索引
            int fatherIndex = (currentIndex - 1) / 2;
            //如果当前插入的值大于其父结点的值,则交换值,并且将索引指向父结点
            //然后继续和上面的父结点值比较,直到不大于父结点,则退出循环
            while (arr[currentIndex] > arr[fatherIndex]) {
                //交换当前结点与父结点的值
                swap(arr, currentIndex, fatherIndex);
                //将当前索引指向父索引
                currentIndex = fatherIndex;
                //重新计算当前索引的父索引
                fatherIndex = (currentIndex - 1) / 2;
            }
        }
    }
    //将剩余的数构造成大根堆(通过顶端的数下降)
    public static void heapify(int[] arr, int index, int size) {
        int left = 2 * index + 1;
        int right = 2 * index + 2;
        while (left < size) {
            int largestIndex;
            //判断孩子中较大的值的索引(要确保右孩子在size范围之内)
            if (arr[left] < arr[right] && right < size) {
                largestIndex = right;
            } else {
                largestIndex = left;
            }
            //比较父结点的值与孩子中较大的值,并确定最大值的索引
            if (arr[index] > arr[largestIndex]) {
                largestIndex = index;
            }
            //如果父结点索引是最大值的索引,那已经是大根堆了,则退出循环
            if (index == largestIndex) {
                break;
            }
            //父结点不是最大值,与孩子中较大的值交换
            swap(arr, largestIndex, index);
            //将索引指向孩子中较大的值的索引
            index = largestIndex;
            //重新计算交换之后的孩子的索引
            left = 2 * index + 1;
            right = 2 * index + 2;
        }
 
    }
    //交换数组中两个元素的值
    public static void swap(int[] arr, int i, int j) {
        int temp = arr[i];
        arr[i] = arr[j];
        arr[j] = temp;
    }

 TOP - K问题

        ?TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,基本思路如下:

1. 用数据集合中前K个元素来建堆

        ⭕前k个最大的元素,则建小堆
        ⭕前k个最小的元素,则建大堆

??注意:只找到TopK,不排序TopK。

 2. 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素

 ?将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素。

图解:( 找前K大的数据 )?

还是老套路上图解释(这里以找前K大的数据为例子)

        ?1.  先用前k个元素生成一个小顶堆,这个小顶堆用于存储,当前最大的k个元素。

       ? 2. 接着,从第k+1个元素开始扫描,和堆顶(堆中最小的元素)比较,如果被扫描的元素大于堆顶,则替换堆顶的元素,并调整堆,以保证堆内的k个元素,总是当前最大的k个元素。

        ?3. 扫描完所有n-k个元素,最终堆中的k个元素,就是前K大的数据。

时间复杂度

? TOP - K问题的时间复杂度为:O(n*lg(k))

? 堆排序的最坏时间复杂度为 :O(n*lg(n))

风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。