您现在的位置是:首页 >技术杂谈 >C++【实现红黑树(核心插入)】网站首页技术杂谈

C++【实现红黑树(核心插入)】

7昂7. 2024-07-11 08:06:33
简介C++【实现红黑树(核心插入)】

一、红黑树概念介绍

概念:
红黑树,也是一种二叉搜索树,它是在每个结点上增加一个存储位表示结点的颜色,可以是红或黑,然后通过对任何一条从根到叶子的路径上各个结点着色方式的限制,保证了没有一条路径会能超过其他路径的俩倍,因而是近似平衡的。map和set的底层数据结构就是用红黑树来封装的。
性质:
1.根节点是黑色的
2.不能出现连续的红色节点
3. 每条路径上有相同数量的黑色节点
4. 每个叶子(空节点)结点都是黑色
5. 每个结点不是红色就是黑色
满足上面的性质,红黑树就能保证:最长路径中节点个数不会超过最短路径节点个数的2倍。
优势:
假设全部的黑色节点有N个 最短路径长度是logN 整棵树的节点数量:[N,2N],最长路径长度:2logN。假设10亿个节点,AVL:最多查找30次左右;RB:最多查找60次左右。
综合而言,其实对于查找大量数据30次和60次没太大差别,而红黑树不要求绝对平衡,只需保证最长路径不超过最短路径的2倍,相对来说降低了插入和旋转的次数,所以在经常进行增删的结构中性能比AVL树更优。

二、红黑树模拟实现

(1)红黑树节点

enum Color
{
	RED=0,
	BLACK,
};
template<class K,class V>
struct RbTreeNode
{
	RbTreeNode<K, V>* _left;
	RbTreeNode<K, V>* _right;
	RbTreeNode<K, V>* _parent;
	pair<K, V>_kv;
	Color _col;
	RbTreeNode(const pair<K, V>& kv)
		:_left(nullptr)
		, _right(nullptr)
		, _parent(nullptr)
		, _kv(kv)
		, _col(RED)
	{}
};

里面同样用三叉链,要有左孩子右孩子,父节点,以及pair类的类型来存储kv两个相同或不同类型的值(当我们使用make_pair函数创建一个pair对象,该函数会自动推断参数类型),并在里面增加一个枚举,用来表示一个节点不是红色就是黑色。关于构造函数里面的颜色初始化为黑色还是红色,在插入会讲解。

(2)红黑树插入分析(核心)

插入和前面的AVL插入部分是一样的,在里面如果是根节点,那就把跟点为置为黑色。
那这有一个问题就是节点构造函数里面的一个问题:我们在申请一个新节点时,宁愿新增红色还是黑色?
因为不管是增哪种颜色,本质上是违反规则三还是违反规则四的问题,如果插入黑色,一定违反规则四,但它代价太大,违反规则三就不一定,因为它的父节点可能为红色也可能为黑色,如果在黑色节点下面插入就没影响,反之就会影响。
对于上面的做法会出现下面的两大情况,第一GPC为一一条直线,第二GPC为折线。
如图:
在这里插入图片描述
G为祖父节点,P为父亲节点,C为当前节点,U为叔父节点
1、先解决当GPC为一条直线的时候
(1)如果U存在且为红色,P必须变黑,U也得变黑,左右都增加了黑,那就把G变红,这样久能保持黑色节点不变,因为G现在变成红了,但是G的父节点如果是红色的还得继续处理 ,那就把G当成C节点,继续算它的祖父,再看U,如果U是红再把它变成黑。
在这里插入图片描述
它的所对应的抽象图以及具象图:
在这里插入图片描述

(2)如果U不存在或者存在且为黑又是两种情况
如果U不存在,再增加红节点,且有连续的红色节点,有可能会超过它的最短路径,只能旋转来降高度。把P变黑,把G给P的左,再把P作为左,同时把原来的G变红,这里就是左单旋加G和P变色。
如下例图:
在这里插入图片描述
它所对应的抽象及具象图:
在这里插入图片描述

如果U存在且为黑色
U存在且为黑是由第一种请况变化而来,这里发生了右单旋,P的左孩子作为G的左孩子,而G又作为P的右孩子,且P变为黑,G变为红。
在这里插入图片描述
对于上面的U不存在或者存在为黑两种情况进行总结: P为G的左孩子时,C为P的左孩子进行右单旋转,如果P为G的右孩子,C为P的右孩子,进行左单旋转。P变为黑色,G变为红色。
旋转的目的就是为了防止最长路径超过最短路径的2倍。GPC为一条线的时候就是左单旋转或右单旋。

2、再解决GPC为折线的情况
(1)U存在且为黑
出现这种折线情况的原因是由第一种情况先变色而产生,然后p变成g的左,c变成p的右,c为红,p为红,g为黑,接着我们先以p为轴进行左旋转进行降低高度,在以g为轴进行右旋,且g变红,c变黑,因为这样才能保证不出现连续红结点且保证每个路径黑色数量一样。以上实际进行了双旋。
在这里插入图片描述

(2)U不存在,直接右单旋

(3)插入代码思路(如何快速写插入算法)

在这里插入图片描述

(一)先看左面这种大情况
插入C1肯定为红节点,P1如果是红,就需要开始作处理:先利用三叉链,从P1得出G1,进入核心环节:左面的这种情况是P1是G1的左孩子时,里面又要有分两种情况:
(1)如果是U存在且为红,我们把P1和U变为黑,G1变为红,更新C1到G1的位置,继续往上调整;
(2)如果是U不存在或黑(是一种情况)如果U不存在就不能变黑,而且就算存在为黑说明是一定是由继续往上调整的那一步(情况(1))而来的即继续往上处理,我们还是是增加了节点,就可能导致最长路径超过最短路径的2倍或者一直用情况(1)的方式最终导致每条路径黑色数量不相等。这时候我们就要通过旋转方式降低高度加变色来解决。所以在这里又分两种:G1P1C1为直线和G1P1C1为折线:

  • 如果是C1P1在一条直线上即C1是P1的左孩子,我们以G1为轴进行右单旋(哪边高往哪边降),G1要变红,P1要变成黑,因为G1下来了P1作为根,不能出现连续的红节点P要变黑,又因为保证黑色数量相等,G1要变红。
  • 如果是C1和P1,G1是折线的时候即C1是P1的右孩子,这时候需要先以P1为轴进行左单旋,再以G1为轴进行右单旋,最终C1做了根节点,G1是右孩子,因为P1是红,C1是红不能出现连续红节点,需把C1变黑,但是还要保证黑色数量相等,就把G1变红。最后结束break,只有情况(1)才会继续向上来回处理。
    (二)再看右面这种大情况
    和(一)情况类似
    P2是G2的右孩子,同理那旋转方式就根上面相反。
    所以我们的插入函数:
bool Insert(const pair<K, V>& kv)
	{
		if (_root == nullptr)
		{
			_root = new Node(kv);
			_root->_col = BLACK;
			return true;
		}

		Node* parent = nullptr;
		Node* cur = _root;
		while (cur)
		{
			if (cur->_kv.first < kv.first)
			{
				parent = cur;
				cur = cur->_right;
			}
			else if (cur->_kv.first > kv.first)
			{
				parent = cur;
				cur = cur->_left;
			}
			else
			{
				return false;
			}
		}

		cur = new Node(kv);
		if (parent->_kv.first > kv.first)
		{
			parent->_left = cur;
		}
		else
		{
			parent->_right = cur;
		}
		cur->_parent = parent;

		while (parent && parent->_col == RED)
		{
			Node* grandf = parent->_parent;
			if (grandf->_left == parent)
			{
				Node* unc = grandf->_right;
				if (unc && unc->_col == RED)//u存在且为红,变色处理
				{
					parent->_col = BLACK;
					unc->_col = BLACK;
					grandf->_col = RED;

					cur = grandf;//继续往上调整
					parent = cur->_parent;
				}
				else//u不存在或者黑
				{
					if (parent->_left == cur)
					{
						RotateR(grandf);
						parent->_col = BLACK;
						grandf->_col = RED;
						
					}
					else
					{
						RotateL(parent);
						RotateR(grandf);
						cur->_col = BLACK;
						grandf->_col = RED;
					}
					break;
				}
			}
			else
			{
				Node* unc = grandf->_left;
				if (unc && unc->_col == RED)
				{
					parent->_col = BLACK;
					unc->_col = BLACK;
					grandf->_col = RED;

					cur = grandf;
					parent = cur->_parent;
				
				}
				else
				{
					if (parent->_right == cur)
					{
						RotateL(grandf);
						parent->_col = BLACK;
						grandf->_col = RED;
					}
					else
					{
						RotateR(parent);
						RotateL(grandf);
						cur->_col = BLACK;
						grandf->_col = RED;

					}
					break;
				}
			}
		}
		_root->_col = BLACK;
		return true;
	}

(4)判断平衡函数

bool IsBalance()
	{
		if (_root && _root->_col == RED)
		{
			cout << "根节点颜色错误" << endl;
			return false;
		}
		int Bsign = 0;
		Node* cur = _root;
		while (cur)
		{
			if (cur->_col == BLACK)
			{
				++Bsign;
			}
			cur = cur->_left;
		}
		return _check(_root, 0, Bsign);

	}
	bool _check(Node* root, int Bnum, int Bsign)
	{
		if (root == nullptr)
		{
		
			if (Bnum != Bsign)
			{
				cout << "黑色节点数量不相等" << endl;
				return false;
			}
			return true;
		}
		if (root->_col == BLACK)
		{
			++Bnum;
		}
		if (root->_col == RED && root->_parent && root->_parent->_col == RED)
		{
			cout << "连续红色节点" << endl;
			return false;
		}
		return _check(root->_left,Bnum,Bsign) && _check(root->_right, Bnum, Bsign);
	}
	void _Destroy(Node* root)
	{
		if (root == nullptr)
		{
			return;
		}

		_Destroy(root->_left);
		_Destroy(root->_right);
		delete root;
	}

首先不能以最长路径不超过最短路径2倍为准则判断平衡,它只是结果。
还是要以前面说的规则:
第一个:先检查根是不是黑色的;
第二个:再检查连续的红色节点:如果是红色的就去检查儿子,这种方式不行,因为孩子可能不存在,可以改为它的父亲,如果是红一定有父亲,如果父亲为红就存在连续红色节点直接返回假;
还有一个:最重要的规则:判断黑色节点的数量是否相等,我们需要先记录一下黑色数量,我们可以先获取一条路径的黑色数量Bsign,然后以它为标准,如何让每条路径以它标准判断是否相等?我们可以在参数里面的形参传值Bnum,往下递归就会往下传,下一层++不会影响上一层++,因为下一层是上一层的拷贝,只要有一条不相等就返回假。

(5)查找函数

Node* Find(const K& key)
	{
		Node* cur = _root;
		while (cur)
		{
			if (cur->_kv.first < key)
			{
				cur = cur->_right;
			}
			else if (cur->_kv.first > key)
			{
				cur = cur->_left;
			}
			else
			{
				return cur;
			}
		}

		return nullptr;
	}

从根开始走,如果比它大,就往右边走,如果比它小,就往左边走,如果相等说明找到,否则返回空。

(6)测试函数

void Test()
{

	int arr[] = { 33, 22, 6, 1, 3, 5, 66, 7, 16, 14, 16, 3, 7, 11, 9, 36, 18, 14, 15 };
	RbTree<int, int> t;
	for (auto n : arr)
	{
	
		t.Insert(make_pair(n, n));
	}

	t.Inorder();
	cout << endl;
	cout << t.IsBalance() << endl;
	cout << "高度:"<<t.height() << endl;

	cout << endl;
	cout << "随机数据测试:" << endl;

	srand(time(0));
	const size_t N = 100000;
	RbTree<int, int> r;
	for (size_t i = 0; i < N; ++i)
	{
		size_t x = rand() + i;
		r.Insert(make_pair(x, x));

	}

	cout << r.IsBalance() << endl;
	cout <<"高度:"<< r.height() << endl;
}

(7)测试结果

在这里插入图片描述

三、红黑树源代码

(1)RbTree.h

#pragma once
#include<iostream>
#include<utility>
#include<ctime>
using namespace std;
enum Color
{
	RED=0,
	BLACK,
};
template<class K,class V>
struct RbTreeNode
{
	RbTreeNode<K, V>* _left;
	RbTreeNode<K, V>* _right;
	RbTreeNode<K, V>* _parent;
	pair<K, V>_kv;
	Color _col;
	RbTreeNode(const pair<K, V>& kv)
		:_left(nullptr)
		, _right(nullptr)
		, _parent(nullptr)
		, _kv(kv)
		, _col(RED)
	{}
};
template <class K,class V>
class RbTree
{
	typedef RbTreeNode<K, V> Node;
public:
	~RbTree()
	{
		_Destroy(_root);
		_root = nullptr;
	}
	bool Insert(const pair<K, V>& kv)
	{
		if (_root == nullptr)
		{
			_root = new Node(kv);
			_root->_col = BLACK;
			return true;
		}

		Node* parent = nullptr;
		Node* cur = _root;
		while (cur)
		{
			if (cur->_kv.first < kv.first)
			{
				parent = cur;
				cur = cur->_right;
			}
			else if (cur->_kv.first > kv.first)
			{
				parent = cur;
				cur = cur->_left;
			}
			else
			{
				return false;
			}
		}

		cur = new Node(kv);
		if (parent->_kv.first > kv.first)
		{
			parent->_left = cur;
		}
		else
		{
			parent->_right = cur;
		}
		cur->_parent = parent;

		while (parent && parent->_col == RED)
		{
			Node* grandf = parent->_parent;
			if (grandf->_left == parent)
			{
				Node* unc = grandf->_right;
				if (unc && unc->_col == RED)//u存在且为红,变色处理
				{
					parent->_col = BLACK;
					unc->_col = BLACK;
					grandf->_col = RED;

					cur = grandf;//继续往上调整
					parent = cur->_parent;
				}
				else//u不存在或者黑
				{
					if (parent->_left == cur)
					{
						RotateR(grandf);
						parent->_col = BLACK;
						grandf->_col = RED;
						
					}
					else
					{
						RotateL(parent);
						RotateR(grandf);
						cur->_col = BLACK;
						grandf->_col = RED;
					}
					break;
				}
			}
			else
			{
				Node* unc = grandf->_left;
				if (unc && unc->_col == RED)
				{
					parent->_col = BLACK;
					unc->_col = BLACK;
					grandf->_col = RED;

					cur = grandf;
					parent = cur->_parent;
				
				}
				else
				{
					if (parent->_right == cur)
					{
						RotateL(grandf);
						parent->_col = BLACK;
						grandf->_col = RED;
					}
					else
					{
						RotateR(parent);
						RotateL(grandf);
						cur->_col = BLACK;
						grandf->_col = RED;

					}
					break;
				}
			}
		}
		_root->_col = BLACK;
		return true;
	}
	Node* Find(const K& key)
	{
		Node* cur = _root;
		while (cur)
		{
			if (cur->_kv.first < key)
			{
				cur = cur->_right;
			}
			else if (cur->_kv.first > key)
			{
				cur = cur->_left;
			}
			else
			{
				return cur;
			}
		}

		return nullptr;
	}
	void Inorder()
	{
		_InOrder(_root);

	}
	int height()
	{
		return _Height(_root);
	}
	bool IsBalance()
	{
		if (_root && _root->_col == RED)
		{
			cout << "根节点颜色错误" << endl;
			return false;
		}
		int Bsign = 0;
		Node* cur = _root;
		while (cur)
		{
			if (cur->_col == BLACK)
			{
				++Bsign;
			}
			cur = cur->_left;
		}
		return _check(_root, 0, Bsign);

	}
private:
	void RotateL(Node* parent)//左单旋
	{
		Node* suR = parent->_right;//11的右孩子即22
		Node* suRL = suR->_left;//11的右孩子的左孩子即b
		Node* ppnode = parent->_parent;//维护父结点的父结点


		parent->_right = suRL;//11右孩子链接b
		if (suRL)//如果b不为空
			suRL->_parent = parent;//更新双亲结点


		suR->_left = parent;//22上提,左孩子链接11
		parent->_parent = suR;//更新双亲结点

		if (ppnode == nullptr)
		{
			_root = suR;
			_root->_parent = nullptr;
		}
		else
		{
			if (ppnode->_left == parent)
			{
				ppnode->_left = suR;
			}
			else
			{
				ppnode->_right = suR;
			}
			suR->_parent = ppnode;
		}

	}
	void RotateR(Node* parent)//右单旋
	{
		Node* suL = parent->_left;
		Node* suLR = suL->_right;

		parent->_left = suLR;
		if (suLR)
			suLR->_parent = parent;

		Node* ppnode = parent->_parent;

		suL->_right = parent;
		parent->_parent = suL;


		if (parent == _root)
		{
			_root = suL;
			_root->_parent = nullptr;
		}
		else
		{
			if (ppnode->_left == parent)
			{
				ppnode->_left = suL;
			}
			else
			{
				ppnode->_right = suL;
			}
			suL->_parent = ppnode;
		}
	}

	void _InOrder(Node* root)
	{
		if (root == nullptr)
		{
			return;
		}

		_InOrder(root->_left);
		cout << root->_kv.first << " ";
		_InOrder(root->_right);
	}
	int _Height(Node* root)
	{
		if (root == NULL)
			return 0;

		int leftH = _Height(root->_left);
		int rightH = _Height(root->_right);

		return leftH > rightH ? leftH + 1 : rightH + 1;
	}
	bool _check(Node* root, int Bnum, int Bsign)
	{
		if (root == nullptr)
		{
		
			if (Bnum != Bsign)
			{
				cout << "黑色节点数量不相等" << endl;
				return false;
			}
			return true;
		}
		if (root->_col == BLACK)
		{
			++Bnum;
		}
		if (root->_col == RED && root->_parent && root->_parent->_col == RED)
		{
			cout << "连续红色节点" << endl;
			return false;
		}
		return _check(root->_left,Bnum,Bsign) && _check(root->_right, Bnum, Bsign);
	}
	void _Destroy(Node* root)
	{
		if (root == nullptr)
		{
			return;
		}

		_Destroy(root->_left);
		_Destroy(root->_right);
		delete root;
	}
	

private:
	Node* _root;
};

void Test()
{

	int arr[] = { 33, 22, 6, 1, 3, 5, 66, 7, 16, 14, 16, 3, 7, 11, 9, 36, 18, 14, 15 };
	RbTree<int, int> t;
	for (auto n : arr)
	{
	
		t.Insert(make_pair(n, n));
	}

	t.Inorder();
	cout << endl;
	cout << t.IsBalance() << endl;
	cout << "高度:"<<t.height() << endl;

	cout << endl;
	cout << "随机数据测试:" << endl;

	srand(time(0));
	const size_t N = 100000;
	RbTree<int, int> r;
	for (size_t i = 0; i < N; ++i)
	{
		size_t x = rand() + i;
		r.Insert(make_pair(x, x));

	}

	cout << r.IsBalance() << endl;
	cout <<"高度:"<< r.height() << endl;
}

(2)Test.cpp

#include"RbTree.h"
int main()
{
	Test();
	return 0;
}
风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。