当前位置:首页 » 《休闲阅读》 » 正文

C++之打造my vector篇

26 人参与  2024年09月12日 08:44  分类 : 《休闲阅读》  评论

点击全文阅读


目录

前言

1.参照官版,打造vector的基本框架

2.丰富框架,实现接口方法

基本的迭代器实现

数据的[]访问

容量和数据空间的改变

vector空间大小的返回与判空

数据的增删

数据打印

拷贝构造和赋值重载

3.扩展延伸,深度理解代码

迭代器失效问题

使用memcpy的拷贝问题

结束语


前言

前面章节我们讲解了vector相关接口,方法的使用,本节内容我们将自己创造vector,模仿官方的接口方法。

1.参照官版,打造vector的基本框架

通过查看官方文档我们知道,vector是个可以变化的数组,是个容器,可以储存一系列数据,

是典型的模版类。

且有三个基本成员start,finish,end_of_storage,我们可以理解为指向数组的开端,数据的结尾,以及容量的结束指针。

上图为插入成员后的分布情况。

故创造了一下的基本框架,因为是我们自己的实现,所以定义了一个my_vector的命名空间,

namespace my_vector {template<class T>class vector {public:typedef T* iterator;typedef const T* const_iterator;vector() {}   ~vector() {if (_start) {delete[]_start;_start = _finish = _end_of_storage = nullptr;}}private:iterator _start = nullptr;iterator _finish=nullptr;iterator _end_of_storage=nullptr;};

这里我们采用初始化列表来进行默认构造,直接使用私有成员的缺省值,较为简便。

C++11前置生成默认构造

vector()=default;

2.丰富框架,实现接口方法

基本的迭代器实现

iterator begin() {return _start;}iterator end() {return _finish;}const_iterator begin()const {return _start;}const_iterator end() const{return _finish;}

就是比较简单的返回开始和结束的指针。

数据的[]访问

T& operator[](size_t i) {assert(i < size());return _start[i];}const T& operator[](size_t i) const{assert(i < size());return _start[i];}

顾名思义就是相似于数组的下标访问

容量和数据空间的改变

void reserve(size_t n) {if (n > capacity()) {size_t oldsize = size();T* temp = new T[n];       memcpy(tmp, _start, old_size * sizeof(T));/*for (size_t i = 0; i < oldsize; i++) {temp[i] = _start[i];}*/delete[]_start;_start = temp;_finish =temp + oldsize;_end_of_storage = temp+n;}}

对于扩容操作,我们创建了一个新的数组,然后定义一个oldsize来存储以前的数据空间,来确定之后的_finish位置,因为我们在之前释放了原来的数组了,如果不想这样操作,不想定义一个oldsize,就要把delete操作放在_finish=temp+size()之后。

这里用了memcpy函数来转移数据,但是我们会发现有一个小小的问题,当数据类型为string时,程序会崩溃,这个后续会讲解的。

void resize(size_t n, T val = T()){if (n < size()){_finish = _start + n;}else{reserve(n);while (_finish < _start + n){*_finish = val;++_finish;}}}

resize函数的作用是调整容器的大小,使其能够容纳n个元素。如果n小于当前容器的大小,则容器会被截断;如果n大于当前容器的大小,则容器会被扩展,并且新增的元素会被初始化为val的值。

T val = T():表示一个默认参数,它是容器的元素类型T的默认构造函数生成的对象。如果调用resize时没有指定这个参数,就会使用元素类型的默认值。

如果n小于当前容器的大小
_finish = _start + n;:这条语句会截断容器,使其大小变为n。这里_start是指向容器第一个元素的指针,_finish是指向容器最后一个元素的下一个位置的指针。通过将`_finish`向前移动到_start + n的位置,容器的大小就被减少了。
 如果`n`大于或等于当前容器的大小
- reserve(n);:调用reserve函数确保容器的容量至少为n。如果当前容量小于n,reserve会重新分配内存以容纳至少n个元素。
- 默认构造函数`T()`必须存在,以便能够为新元素提供默认值。如果`T`没有默认构造函数,则这段代码在尝试使用默认参数时会出错。

vector空间大小的返回与判空

size_t size()const {return _finish - _start;}size_t capacity()const {return _end_of_storage - _start;}bool empty()const {return _start == _finish;}

大小返回就是几个指针加减即可

数据的增删

对于数据的增删,模拟尾插,尾删,指定位置的插入,删除(后两者都与迭代器iterator相结合)

void push_back(const T& x) {if (_finish == _end_of_storage) {reserve(capacity() == 0 ? 4 : capacity() * 2);}*_finish = x;++_finish;}void pop_back() {assert(!empty());--_finish;}void erase(iterator pos) {assert(pos >= _start);assert(pos <= _finish);iterator it = pos + 1;while (it != end()) {*(it - 1) = *it;it++;}_finish--;}iterator insert(iterator pos,const T&x) {assert(pos >= _start  && pos<=_finish);if (_finish == _end_of_storage) {size_t len = pos - _start;reserve(capacity() == 0 ? 4 : capacity() * 2);pos = _start + len;}iterator end = _finish + 1;while (end > pos) {*end = *(end - 1);end--;}*pos = x;_finish++;return pos;}

对于插入数据的操作都要进行扩容的判断操作,对于数据的挪动我们可以采用依次赋值,就像代码中的*end=*(end-1);end--//*(it-1)=*it;it++;

通过画图可以更加清楚的理解。

数据打印

template<class T>void print_vector(const vector<T>& v) {//typename vector<T>::const_iterator it = v.begin();auto it = v.begin();while (it != v.end()) {cout << *it << " ";it++;}cout << '\n';    for  (auto e:v) {cout << e << " ";}cout << endl;}template<class Container>void print_container(const Container& v) {auto it = v.begin();while (it != v.end()) {cout << *it << " ";it++;}cout << '\n';for (auto e : v) {cout << e << " ";}cout << endl;}

规定,没有实例化的类模板里面取东西,编译器不能区分这里const_iterator是类型还是静态成员变量,所以在注释的部分我们看见前面加了个typename.

//typename vector<T>::const_iterator it = v.begin();

print_vector 函数专门用于打印 std::vector<T> 类型的容器。

print_container 函数是一个更通用的模板函数,可以用于打印任何符合容器概念的类型。

 

void vector5(){vector<string> v;v.push_back("11111111111111111111");v.push_back("11111111111111111111");v.push_back("11111111111111111111");v.push_back("11111111111111111111");print_container(v);v.push_back("11111111111111111111");print_container(v);}

拷贝构造和赋值重载

vector(const vector<T>& v) {reserve(v.size());for (auto e : v) {push_back(e);}}vector<T>operator=(const vector<T>& v) {if (this != v) {reserve(v.size());for (auto e : v) {push_back(e);}}return this;}

这一种思路是开设新空间,然后将数据一个个尾插到创建的对象中。

void swap(vector<T>& v){std::swap(_start, v._start);std::swap(_finish, v._finish);std::swap(_end_of_storage, v._end_of_storage);}// v1 = v3//vector& operator=(vector v)vector<T>& operator=(vector<T> v){swap(v);return *this;}

这种思路是交换的方式,通过调用官方库中的函数,指针交换,将v的地址给了创建的对象。

template <class InputIterator>vector(InputIterator first, InputIterator last) {while (first != last) {push_back(*first);first++;}}

通过传需要拷贝的对象的数据范围给新对象(迭代器区间),是个函数模版,可以用任意的迭代器初始化,类型匹配即可 。

模板构造函数,用于构造一个std::vector,该构造函数接受两个迭代器firstlast,它们定义了要复制到新vector中的元素的范围。

3.扩展延伸,深度理解代码

在VS环境下,比较严格,在迭代器方面比较严格,特别是失效迭代器的访问。

迭代器失效问题

在测试接口的过程中,有个bug就是迭代器失效问题

我们知道迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T*

因此迭代器失效,实际就是迭代器 底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即 如果继续使用已经失效的迭代器,程序可能会崩溃)。

1.对vector进行扩容操作,像resize,reserve等操作

还有就是在insert,push_back操作过程中涉及了扩容

#include <iostream>using namespace std;#include <vector>int main(){    vector<int> v{ 1,2,3,4,5,6 };    auto it = v.begin();    // 将有效元素个数增加到100个,多出的位置使用8填充,操作期间底层会扩容   // v.resize(100, 8);    // reserve的作用就是改变扩容大小但不改变有效元素个数,操作期间可能会引起底层容    //量改变         v.reserve(100);         // 插入元素期间,可能会引起扩容,而导致原空间被释放        v.insert(v.begin(), 0);          v.push_back(8);         // 给vector重新赋值,可能会引起底层容量改变        //v.assign(100, 8);    /*   出错原因:以上操作,都有可能会导致vector扩容,也就是说vector底层原理旧空间被释   放掉,而在打印时,it还使用的是释放之间的旧空间,在对it迭代器操作时,实际操作的是一块   已经被释放的空间,而引起代码运行时崩溃。   解决方式:在以上操作完成之后,如果想要继续通过迭代器操作vector中的元素,只需给   it重新赋值即可。   */    while (it != v.end())    {        cout << *it << " ";        ++it;    }    cout << endl;    return 0;}

修改后的代码 

#include <iostream>#include <vector>using namespace std;int main(){    vector<int> v{ 1,2,3,4,5,6 };    // 在修改vector之后,重新获取迭代器    auto it = v.begin();        v.reserve(100);    v.insert(v.begin(), 0);    v.push_back(8);    // 如果使用v.assign(100, 8);,也需要在之后重新获取迭代器    // 重新获取迭代器,因为之前的操作可能会改变vector的内存    it = v.begin();    while (it != v.end())    {        cout << *it << " ";        ++it;    }    cout << endl;    return 0;}

还有一点就是insert数据过后,即使没有扩容,指向容器中插入点之后的所有迭代器、指针和引用都可能失效。

所以当我们继续访问修改p的位置数据,已经失效了,需要更新失效的迭代器。

由于数据挪动,p的指向改变了,所以我们认为迭代器也失效了。

v.insert(p, 40);

p=v.insert(p, 40);
(*(p+1)) *= 10; 

 2.erase的删除导致的迭代器失效问题

void test_vector3(){std::vector<int> v;v.push_back(1);v.push_back(2);v.push_back(3);v.push_back(4);print_container(v);// 删除所有的偶数auto it = v.begin();while (it != v.end()){if (*it % 2 == 0){v.erase(it);}else{++it;}}print_container(v);}}

当我们用VS std中的接口时,会发现直接报错

所以我们也要进行重新的更新

it=v.erase(it); 

#include <iostream>using namespace std;#include <vector>    int main()    {        int a[] = { 1, 2, 3, 4 };        vector<int> v(a, a + sizeof(a) / sizeof(int));        // 使用find查找3所在位置的iterator        vector<int>::iterator pos = find(v.begin(), v.end(), 3);        // 删除pos位置的数据,导致pos迭代器失效。        v.erase(pos);        cout << *pos << endl; // 此处会导致非法访问        return 0;    }

使用memcpy的拷贝问题

当我们想拷贝几个字符串时,就会出现问题了。

 问题分析:

1. memcpy是内存的二进制格式拷贝,将一段内存空间中内容原封不动的拷贝到另外一段内存空间中。

2. 如果拷贝的是自定义类型的元素,memcpy既高效又不会出错,但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝。

void reserve(size_t n) {if (n > capacity()) {size_t oldsize = size();T* temp = new T[n];       memcpy(tmp, _start, old_size * sizeof(T));/*for (size_t i = 0; i < oldsize; i++) {temp[i] = _start[i];}*/delete[]_start;_start = temp;_finish =temp + oldsize;_end_of_storage = temp+n;}}

当我们使用这个memcpy版本进行扩容插入时,程序会出现问题

测试代码

void vector5() {vector<string> v;v.push_back("11111111111111111111");v.push_back("11111111111111111111");v.push_back("11111111111111111111");v.push_back("11111111111111111111");print_container(v);v.push_back("11111111111111111111");print_container(v);}

memcpy是浅拷贝,temp和原来的v指向了同一块空间,当调用了delete[]时,11111111...字符串被析构了,空间释放,变成随机值,后面又delete,free _start ,这时候temp指向的是释放的空间。

所以我们可以调用赋值,就可以解决问题,本质调用string的赋值,其他类型赋值一样的。

旧空间释放就不会影响新空间。

for (size_t i = 0; i < oldsize; i++) {
            temp[i] = _start[i];

4.完整代码复现

#pragma once#include <iostream>#include <assert.h>#include <vector>#include <string>using namespace std;namespace my_vector {template<class T>class vector {public:typedef T* iterator;typedef const T* const_iterator;vector(){}vector(const vector<T>& v) {reserve(v.size());for (auto e : v) {push_back(e);}}/*vector<T>operator=(const vector<T>& v) {if (this != v) {reserve(v.size());for (auto e : v) {push_back(e);}}return this;}*/template <class InputIterator>vector(InputIterator first, InputIterator last) {while (first != last) {push_back(*first);first++;}}void swap(vector<T>& v){std::swap(_start, v._start);std::swap(_finish, v._finish);std::swap(_end_of_storage, v._end_of_storage);}// v1 = v3//vector& operator=(vector v)vector<T>& operator=(vector<T> v){swap(v);return *this;}void clear() {_finish = _start;}~vector() {if (_start) {delete[]_start;_start = _finish = _end_of_storage = nullptr;}}iterator begin() {return _start;}iterator end() {return _finish;}const_iterator begin()const {return _start;}const_iterator end() const {return _finish;}void reserve(size_t n) {if (n > capacity()) {size_t oldsize = size();T* temp = new T[n];memcpy(temp, _start, oldsize*sizeof(T));/*for (size_t i = 0; i < oldsize; i++) {temp[i] = _start[i];}*/delete[]_start;_start = temp;_finish = temp + oldsize;_end_of_storage = temp + n;}}void resize(size_t n, T val = T()) {if (n < size()) {_finish = _start + n;}else {reserve(n);while (_finish < _start + n) {*_finish = val;_finish++;}}}void push_back(const T& x) {if (_finish == _end_of_storage) {reserve(capacity() == 0 ? 4 : capacity() * 2);}*_finish = x;++_finish;}void pop_back() {assert(!empty());--_finish;}void erase(iterator pos) {assert(pos >= _start);assert(pos <= _finish);iterator it = pos + 1;while (it != end()) {*(it - 1) = *it;it++;}_finish--;}iterator insert(iterator pos, const T& x) {assert(pos >= _start && pos <= _finish);if (_finish == _end_of_storage) {size_t len = pos - _start;reserve(capacity() == 0 ? 4 : capacity() * 2);pos = _start + len;}iterator end = _finish + 1;while (end > pos) {*end = *(end - 1);end--;}*pos = x;_finish++;return pos;}size_t size()const {return _finish - _start;}size_t capacity()const {return _end_of_storage - _start;}bool empty()const {return _start == _finish;}T& operator[](size_t i) {assert(i < size());return _start[i];}const T& operator[](size_t i) const{assert(i < size());return _start[i];}private:iterator _start = nullptr;iterator _finish = nullptr;iterator _end_of_storage = nullptr;};template<class T>void print_vector(const vector<T>& v) {//typename vector<T>::const_iterator it = v.begin();auto it = v.begin();while (it != v.end()) {cout << *it << " ";it++;}cout << '\n';for (auto e : v) {cout << e << " ";}cout << endl;}template<class Container>void print_container(const Container& v) {/*auto it = v.begin();while (it != v.end()) {cout << *it << " ";it++;}cout << '\n';*/for (auto e : v) {cout << e << " ";}cout << endl;}void vector1() {vector<int>v;v.push_back(1);v.push_back(2);v.push_back(3);v.push_back(4);v.push_back(5);v.push_back(6);int x;cin >> x;auto p = find(v.begin(), v.end(), x);if (p != v.end()) {p = v.insert(p, 40);(*(p + 1)) *= 10;}//v.pop_back();//v.pop_back();//v.insert(v.begin() + 2, 5);//v.erase(v.begin() + 3);for (size_t i = 0; i < v.size(); i++) {cout << v[i] << endl;}}void vector2() {vector<int>v;v.push_back(1);v.push_back(2);v.push_back(3);v.push_back(4);v.push_back(5);v.push_back(6);print_vector(v);vector<int>v1(v);vector <int>v2 = v;vector<int> v3(v1.begin(), v1.begin() + 3);print_container(v1);print_container(v2);print_container(v3);/*vector<double>v1;v1.push_back(1.1);v1.push_back(2.2);v1.push_back(3.3);v1.push_back(4.4);v1.push_back(5.5);v1.push_back(6.6);print_container(v1);*/}void vector3() {vector<int> v;v.resize(10, 1);v.reserve(20);print_container(v);cout << v.size() << endl;cout << v.capacity() << endl;v.resize(15, 2);print_container(v);v.resize(25, 3);print_container(v);v.resize(5);print_container(v);}void vector4() {vector<int> v;v.push_back(1);v.push_back(2);v.push_back(3);v.push_back(4);v.push_back(4);v.push_back(5);print_container(v);// 删除所有的偶数auto it = v.begin();while (it != v.end()){if (*it % 2 == 0){v.erase(it);}else {//不加else,不会删除连续的偶数,会++两次++it;}}print_container(v);}void test_vector3(){std::vector<int> v;v.push_back(1);v.push_back(2);v.push_back(3);v.push_back(4);print_container(v);// 删除所有的偶数auto it = v.begin();while (it != v.end()){if (*it % 2 == 0){it=v.erase(it);}else{++it;}}print_container(v);}void vector5() {vector<string> v;v.push_back("11111111111111111111");v.push_back("11111111111111111111");v.push_back("11111111111111111111");v.push_back("11111111111111111111");print_container(v);v.push_back("11111111111111111111");print_container(v);}}

结束语

本期博客就到此结束啦,相信通过自己对vector的实现,大家对vector有了更深的了解。

最后希望友友们给小编点点赞吧,感谢各位友友的支持!!! 


点击全文阅读


本文链接:http://zhangshiyu.com/post/158560.html

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

关于我们 | 我要投稿 | 免责申明

Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1