C++ STL之vector基础网站首页 技术教程

C++ STL之vector基础

迷茫的启明星 2024-06-04 00:00:03

简介C++ STL之vector基础

文章目录

前言
STL之vector基础
后记

前言

本篇将学习vector的基础知识

?作者：迷茫的启明星
专栏：《C++初阶》
相关文章：《 leetcode17. 电话号码的字母组合》
?欢迎关注：?点赞?收藏✍️留言

?码字不易，你的?点赞?收藏❤️关注对我真的很重要，有问题可在评论区提出，感谢阅读！！！

持续更新中~

STL之vector基础

1. What：什么是 vector？

《vector的文档介绍》

vector是表示可变大小数组的序列容器.

它就像数组一样采用连续存储空间来存储元素，也就意味着可以使用下标对vector的元素进行访问，和数组一样高效，但是和数组不同的是，它的大小是可以动态改变的，而且它的大小会被容器自动处理。

在vector的使用中，它通过动态分配的方式来存储它的元素，比如说：当有新元素插入时，这个数组可能就要重新分配大小，为了增加存储空间，它的做法是重新分配一个数组，然后再把全部元素移到这个数组，但是这是一个比较“费劲”的任务，因为每次有新增元素时，它都要重新分配大小，所以为了避免这种情况，vector有了自己的空间分配策略。

**vector分配空间策略：**vector会分配一些额外的空间以适应可能的增长，因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何，重新分配都应该是对数增长的间隔大小，以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。

因此，vector占用了更多的存储空间，但是获得了管理存储空间的能力，并且以一种有效的方式动态增长。

与其它动态序列容器相比（deque, list and forward_list）， vector在访问元素的时候更加高效，在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作，效率更低。比起list和forward_list统一的迭代器和引用更好

2. Why：为什么使用 vector？

详细来说，为什么使用 vector 有以下几个优点：

动态扩展：vector 的容量可以在运行时动态地增加或减少，可以根据实际需求，方便地向容器中添加或移除元素。这种灵活性非常适合管理可变长度的元素序列，特别是当元素数量难以预测或者需要不断变化时。

高效的随机访问：vector 中的元素都是存储在连续的内存空间中的，因此可以通过下标或者迭代器直接访问某个特定位置的元素，检索元素的速度非常快。这比起链表等其他容器类型更加高效，并且可以方便地在元素序列中进行排序和查找等操作。

安全性：vector 在管理容量的内存时，自动负责申请和释放内存空间，减少了像数组那样的越界访问问题，提高了程序的稳定性和安全性。由于它会在插入数据时判断是否需要重新分配内存，因此不会出现数组越界的错误，大大提高了程序的健壮性。

操作丰富：vector 的成员函数以及迭代器等工具，提供了多种操作元素序列的方式，包括排序、查找、插入和删除等操作。它还支持以及其他 STL 容器类型一样的迭代器接口，方便地进行算法实现，并且不需要担心分配和释放内存的问题。

兼容性：vector 是 C++ 标准库中的标准容器类型之一，与其他容器类型兼容，并广泛支持各种编译器和平台。可以在不同的环境和项目中轻松应用，为开发者提供了极大的便利。

3. How：怎么使用vector?

3.1 vector的定义

（constructor）构造函数声明	接口功能
vector()	无参构造
vector（size_type n, const value_type& val = value_type()）	构造并初始化n个val
vector (const vector& x);	拷贝构造
vector (InputIterator first, InputIterator last);	使用迭代器进行初始化构造

演示：

#include <iostream>
#include <vector>
#include <string>
#include <algorithm>
#include <functional>
using namespace std;

int main()
{
    vector<int> v1;

    vector<int> v2(10, 1);
    cout<<"使用构造并初始化n个val后的v2：";
    for(int j=0;j<10;++j)
    {
        cout<<v2[j];
    }
    cout<<endl;

    cout<<"拷贝构造后的v3：";
    vector<int> v3(v2);
    for(int j=0;j<10;++j)
    {
        cout<<v3[j];
    }
    cout<<endl;

    for(int i=0;i<10;++i)
    {
        //先给v1赋值
        v1.push_back(i);
    }
    cout<<"使用迭代器进行初始化构造后的v4：";
    vector<int> v4(v1.begin(),v1.end());
    for(int j : v4)
    {
        cout<<j;
    }
    cout<<endl;
    return 0;
}

输出：

在这里插入图片描述

3.2 vector iterator 的使用

iterator的使用	接口说明
begin + end	获取第一个数据位置的iterator/const_iterator，获取最后一个数据的下一个位置的iterator/const_iterator
rbegin + rend	获取最后一个数据位置的reverse_iterator，获取第一个数据前一个位置的reverse_iterator

它们的位置关系就像这样：

在这里插入图片描述

演示：

#include <iostream>
#include <vector>
#include <string>
#include <algorithm>
#include <functional>
using namespace std;

int main()
{
    vector<int> v1;
    v1.push_back(1);
    v1.push_back(2);
    v1.push_back(3);
    v1.push_back(4);

    // 下标+[]
    cout<<"使用下标访问和更改数据:";
    for (size_t i = 0; i < v1.size(); ++i)
    {
        v1[i]++;
    }
    for (size_t i = 0; i < v1.size(); ++i)
    {
        cout << v1[i] << " ";
    }
    cout << endl;

    // 迭代器
    cout<<"使用迭代器访问和更改数据:";
    vector<int>::iterator it = v1.begin();
    while (it != v1.end())
    {
        (*it)--;

        cout << *it << " ";
        ++it;
    }
    cout << endl;

    //范围for的底层就是迭代器的使用而已
    cout<<"范围for的使用:";
    for (auto e : v1)
    {
        cout << e << " ";
    }
    cout << endl;
    
    return 0;
}

输出：

在这里插入图片描述

3.3 vector 空间增长问题

相关函数	接口功能
size	获取数据个数
capacity	获取容量大小
empty	判断是否为空
resize	改变vector的size
reserve	改变vector的capacity

这里我们需要注意的就是

capacity的代码在vs和g++下分别运行会发现，vs下capacity是按1.5倍增长的，g++是按2倍增长的。这个问题经常会考察，不要固化的认为，vector增容都是2倍，具体增长多少是根据具体的需求定义的。vs是PJ版本STL，g++是SGI版本STL。
reserve只负责开辟空间，如果确定知道需要用多少空间，reserve可以缓解vector增容的代价缺陷问题。
resize在开空间的同时还会进行初始化，影响size。

我们来测试一下这个问题：

下面的测试环境是clion,它是按照2倍方式扩容

#include <iostream>
#include <vector>
#include <string>
#include <algorithm>
#include <functional>
using namespace std;

int main()
{
    size_t sz;
    vector<int> v;
    //结果2
    //v.resize(100);
    
    //结果3
    // 提前将容量设置好，可以避免一遍插入一遍扩容
    //v.reserve(100);

    sz = v.capacity();
    cout << "making v grow:
";
    for (int i = 0; i < 100; ++i)
    {
        v.push_back(i);
        if (sz != v.capacity())
        {
            sz = v.capacity();
            cout << "capacity changed: " << sz << '
';
        }
    }
}

在这段代码中，空间不够就增容，一旦改变就输出改变后的空间大小

结果1：

在这里插入图片描述

结果2：

在这里插入图片描述

结果3：

在这里插入图片描述

下面的测试环境是vs，它是按照1.5倍方式扩容

结果1：

在这里插入图片描述

结果2：

在这里插入图片描述

结果3：

在这里插入图片描述

这里有一个实用的小技巧：

如果已经确定vector中要存储元素大概个数，可以提前将空间设置足够
就可以避免边插入边扩容导致效率低下的问题了

3.4 vector 增删查改

vector增删查改	接口说明
push_back	尾插
pop_back	尾删
find	查找（注意这个是算法模块实现，不是vector的成员接口）
insert	在position前插入val
erase	删除position位置的数据
swap	交换两个vector的数据空间
operator[]	像数组一样访问

演示：

#include <iostream>
#include <vector>
#include <string>
#include <algorithm>
#include <functional>
using namespace std;

int main()
{
	vector<int> v1;
	v1.push_back(1);
	v1.push_back(2);
	v1.push_back(3);
	v1.push_back(4);
	v1.push_back(300);

	cout << "在3前面插入30：";
	vector<int>::iterator pos = find(v1.begin(), v1.end(), 3);
	if (pos != v1.end())
	{
		v1.insert(pos, 30);
	}

	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;
	cout << "删除val==300的数：";
	pos = find(v1.begin(), v1.end(), 300);
	if (pos != v1.end())
	{
		v1.erase(pos);
	}

	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;

	cout << "交换0 3位置后:";
	swap(v1[0], v1[3]);
	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;

	cout << "数组尾删后：";
	v1.pop_back();
	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;
	return 0;
}

3.5 vector 迭代器失效问题

迭代器的主要作用就是让算法能够不用关心底层数据结构，其底层实际就是一个指针，或者是对指针进行了封装。

比如：vector的迭代器就是原生态指针T* 。

因此迭代器失效，实际就是迭代器底层对应指针所指向的空间被销毁了，而使用一块已经被释放的空间，造成的后果是程序崩溃(即如果继续使用已经失效的迭代器，程序可能会崩溃)。

对于vector可能会导致迭代器失效的操作有：

会引起底层空间改变的操作，都可能是迭代器失效。

比如说：resize、eserve、insert、assign、push_back等。

#include <iostream>
using namespace std;
#include <vector>
int main()
{
    vector<int> v{1,2,3,4,5,6};
    auto it = v.begin();
    
    
    // 将有效元素个数增加到100个，多出的位置使用8填充，操作期间底层会扩容
    // v.resize(100, 8);
    
    
    // reserve的作用就是改变扩容大小但不改变有效元素个数，操作期间可能会引起底层容量改变
    // v.reserve(100);
    
    
    // 插入元素期间，可能会引起扩容，而导致原空间被释放
    // v.insert(v.begin(), 0);
    // v.push_back(8);
    
    
    // 给vector重新赋值，可能会引起底层容量改变
    v.assign(100, 8);
    /*
出错原因：以上操作，都有可能会导致vector扩容，也就是说vector底层原理旧空间被释放掉，而在打印时，it还使用的是释放之间的旧空间，在对it迭代器操作时，实际操作的是一块已经被释放的空间，而引起代码运行时崩溃。
解决方式：在以上操作完成之后，如果想要继续通过迭代器操作vector中的元素，只需给it重新赋值即可。
*/
    while(it != v.end())
    {
        cout<< *it << " " ;
        ++it;
    }
    cout<<endl;
    return 0;
}

指定位置元素的删除操作–erase

#include <iostream>
using namespace std;
#include <vector>
int main()
{
    int a[] = { 1, 2, 3, 4 };
    vector<int> v(a, a + sizeof(a) / sizeof(int));
    // 使用find查找3所在位置的iterator
    vector<int>::iterator pos = find(v.begin(), v.end(), 3);
    // 删除pos位置的数据，导致pos迭代器失效。
    v.erase(pos);
    cout << *pos << endl; // 此处会导致非法访问
    return 0;
}

erase删除pos位置元素后，pos位置之后的元素会往前搬移，没有导致底层空间的改变，理论上讲迭代器不应该会失效。

但是：如果pos刚好是最后一个元素，删完之后pos刚好是end的位置，而end位置是没有元素的，那么pos就失效了。

因此删除vector中任意位置上元素时，vs就认为该位置迭代器失效了。

再来看一个问题

以下代码的功能是删除vector中所有的偶数，请你判断一下哪个是正确？为什么？

#include <iostream>
using namespace std;
#include <vector>
int main()
{
    vector<int> v{ 1, 2, 3, 4 };
    auto it = v.begin();
    while (it != v.end())
    {
        if (*it % 2 == 0)
            v.erase(it);
        ++it;
    }
    return 0;
}
int main()
{
    vector<int> v{ 1, 2, 3, 4 };
    auto it = v.begin();
    while (it != v.end())
    {
        if (*it % 2 == 0)
            it = v.erase(it);
        else
            ++it;
    }
    return 0;
}

答案揭秘：

第二段代码是正确的。

在第一段代码中，使用了一个 while 循环遍历 vector 的每个元素，当遇到偶数时使用 erase() 函数删除该元素，但是 erase() 函数会使迭代器失效，导致后面的 ++it 操作产生未定义行为，因此会导致程序错误。

而第二段代码使用了一个 while 循环遍历 vector 的每个元素，当遇到偶数时仅仅将其删除，不会使迭代器失效，因为 erase() 函数返回一个指向被删除元素之后元素的新迭代器，因此可以安全地使用 ++it 操作，从而正确地删除 vector 中所有的偶数。

与vector类似，string在插入+扩容操作+erase之后，迭代器也会失效

#include <string>
int main()
{
    string s("hello");
    auto it = s.begin();
    // 放开之后代码会崩溃，因为resize到20会string会进行扩容
    // 扩容之后，it指向之前旧空间已经被释放了，该迭代器就失效了
    // 后序打印时，再访问it指向的空间程序就会崩溃
    //s.resize(20, '!');
    while (it != s.end())
    {
        cout << *it;
        ++it;
    }
    cout << endl;
    it = s.begin();
    while (it != s.end())
    {
        it = s.erase(it);
        // 按照下面方式写，运行时程序会崩溃，因为erase(it)之后
        // it位置的迭代器就失效了
        // s.erase(it);
        ++it;
    }
}

那么我们应该怎么解决迭代器失效的问题呢？

在使用迭代器前对它重新赋值即可。

4. Where：vector 相关OJ题

电话号码的字母组合

class Solution {
    char* num[10]={"","","abc","def","ghi","jkl","mno","pqrs","tuv","wxyz"};
    public:
    void mergeCombin(string digits,int di,vector<string>& res,string ch)
    {
        if(di==digits.size())
        {
            res.push_back(ch);
            return;
        }
        int n=digits[di]-'0';
        string str=num[n];
        for(int i=0;i<str.size();++i)
        {
            mergeCombin(digits,di+1,res,ch+str[i]);
        }
    }
    vector<string> letterCombinations(string digits) {
        vector<string> res;
        if(digits.empty())
            return res;
        string ch;
        mergeCombin(digits,0,res,ch);
        return res;
    }
};

杨辉三角

class Solution {
    public:
    vector<vector<int>> generate(int numRows) {
        vector<vector<int>> vv(numRows);
        int i,j;
        for(i=0;i<numRows;++i)
        {
            vv[i].resize(i+1,1);
        }
        for(i=0;i<numRows;++i)
        {
            for(j=1;j<vv[i].size()-1;++j)
            {
                vv[i][j]=vv[i-1][j-1]+vv[i-1][j];
            }
        }
        return  vv;
    }
};