第三章 字符串、向量和数组
2020年11月10日大约 11 分钟
第三章 字符串、向量和数组
using声明
- 使用某个命名空间:例如
using std::cin
表示使用命名空间std
中的名字cin
。 - 头文件中不应该包含
using
声明。这样使用了该头文件的源码也会使用这个声明,会带来风险。
string
- 标准库类型
string
表示可变长的字符序列。 #include <string>
,然后using std::string;
- string对象:注意,不同于字符串字面值。
定义和初始化string对象
初始化string
对象的方式:
方式 | 解释 |
---|---|
string s1 | 默认初始化,s1 是个空字符串 |
string s2(s1) | s2 是s1 的副本 |
string s2 = s1 | 等价于s2(s1) ,s2 是s1 的副本 |
string s3("value") | s3 是字面值“value”的副本,除了字面值最后的那个空字符外 |
string s3 = "value" | 等价于s3("value") ,s3 是字面值"value"的副本 |
string s4(n, 'c') | 把s4 初始化为由连续n 个字符c 组成的串 |
- 拷贝初始化(copy initialization):使用等号
=
将一个已有的对象拷贝到正在创建的对象。 - 直接初始化(direct initialization):通过括号给对象赋值。
string对象上的操作
string
的操作:
操作 | 解释 |
---|---|
os << s | 将s 写到输出流os 当中,返回os |
is >> s | 从is 中读取字符串赋给s ,字符串以空白分割,返回is |
getline(is, s) | 从is 中读取一行赋给s ,返回is |
s.empty() | s 为空返回true ,否则返回false |
s.size() | 返回s 中字符的个数 |
s[n] | 返回s 中第n 个字符的引用,位置n 从0计起 |
s1+s2 | 返回s1 和s2 连接后的结果 |
s1=s2 | 用s2 的副本代替s1 中原来的字符 |
s1==s2 | 如果s1 和s2 中所含的字符完全一样,则它们相等;string 对象的相等性判断对字母的大小写敏感 |
s1!=s2 | 同上 |
< , <= , > , >= | 利用字符在字典中的顺序进行比较,且对字母的大小写敏感 |
- string io:
- 执行读操作
>>
:忽略掉开头的空白(包括空格、换行符和制表符),直到遇到下一处空白为止。 getline
:读取一整行,包括空白符。
- 执行读操作
- 字符串字面值和string是不同的类型。
处理string对象中的字符
- ctype.h vs. cctype:C++修改了c的标准库,名称为去掉
.h
,前面加c
。
cctype
头文件中定义了一组标准函数:
函数 | 解释 |
---|---|
isalnum(c) | 当c 是字母或数字时为真 |
isalpha(c) | 当c 是字母时为真 |
iscntrl(c) | 当c 是控制字符时为真 |
isdigit(c) | 当c 是数字时为真 |
isgraph(c) | 当c 不是空格但可以打印时为真 |
islower(c) | 当c 是小写字母时为真 |
isprint(c) | 当c 是可打印字符时为真 |
ispunct(c) | 当c 是标点符号时为真 |
isspace(c) | 当c 是空白时为真(空格、横向制表符、纵向制表符、回车符、换行符、进纸符) |
isupper(c) | 当c 是大写字母时为真 |
isxdigit(c) | 当c 是十六进制数字时为真 |
tolower(c) | 当c 是大写字母,输出对应的小写字母;否则原样输出c |
toupper(c) | 当c 是小写字母,输出对应的大写字母;否则原样输出c |
- 遍历字符串:使用范围for(range for)语句:
for (auto c: str)
,或者for (auto &c: str)
使用引用直接改变字符串中的字符。 (C++11)
vector
- vector是一个容器,也是一个类模板;
#include <vector>
然后using std::vector;
- 容器:包含其他对象。
- 类模板:本身不是类,但可以实例化instantiation出一个类。
vector
是一个模板,vector<int>
是一个类型。 - 通过将类型放在类模板名称后面的尖括号中来指定类型,如
vector<int> ivec
。
定义和初始化vector对象
初始化vector
对象的方法
方法 | 解释 |
---|---|
vector<T> v1 | v1 是一个空vector ,它潜在的元素是T 类型的,执行默认初始化 |
vector<T> v2(v1) | v2 中包含有v1 所有元素的副本 |
vector<T> v2 = v1 | 等价于v2(v1) ,v2 中包含v1 所有元素的副本 |
vector<T> v3(n, val) | v3 包含了n个重复的元素,每个元素的值都是val |
vector<T> v4(n) | v4 包含了n个重复地执行了值初始化的对象 |
vector<T> v5{a, b, c…} | v5 包含了初始值个数的元素,每个元素被赋予相应的初始值 |
vector<T> v5={a, b, c…} | 等价于v5{a, b, c…} |
- 列表初始化:
vector<string> v{"a", "an", "the"};
(C++11)
向vector对象中添加元素
v.push_back(e)
在尾部增加元素。
其他vector操作
vector
支持的操作:
操作 | 解释 |
---|---|
v.emtpy() | 如果v 不含有任何元素,返回真;否则返回假 |
v.size() | 返回v 中元素的个数 |
v.push_back(t) | 向v 的尾端添加一个值为t 的元素 |
v[n] | 返回v 中第n 个位置上元素的引用 |
v1 = v2 | 用v2 中的元素拷贝替换v1 中的元素 |
v1 = {a,b,c…} | 用列表中元素的拷贝替换v1 中的元素 |
v1 == v2 | v1 和v2 相等当且仅当它们的元素数量相同且对应位置的元素值都相同 |
v1 != v2 | 同上 |
< ,<= ,> , >= | 以字典顺序进行比较 |
- 范围
for
语句内不应该改变其遍历序列的大小。 vector
对象(以及string
对象)的下标运算符,只能对确知已存在的元素执行下标操作,不能用于添加元素。
迭代器iterator
- 所有标准库容器都可以使用迭代器。
- 类似于指针类型,迭代器也提供了对对象的间接访问。
使用迭代器
vector<int>::iterator iter
。auto b = v.begin();
返回指向第一个元素的迭代器。auto e = v.end();
返回指向最后一个元素的下一个(哨兵,尾后,one past the end)的迭代器(off the end)。- 如果容器为空,
begin()
和end()
返回的是同一个迭代器,都是尾后迭代器。 - 使用解引用符
*
访问迭代器指向的元素。 - 养成使用迭代器和
!=
的习惯(泛型编程)。 - 容器:可以包含其他对象;但所有的对象必须类型相同。
- 迭代器(iterator):每种标准容器都有自己的迭代器。
C++
倾向于用迭代器而不是下标遍历元素。 - const_iterator:只能读取容器内元素不能改变。
- 箭头运算符: 解引用 + 成员访问,
it->mem
等价于(*it).mem
- 谨记:但凡是使用了迭代器的循环体,都不要向迭代器所属的容器添加元素。
标准容器迭代器的运算符:
运算符 | 解释 |
---|---|
*iter | 返回迭代器iter 所指向的元素的引用 |
iter->mem | 等价于(*iter).mem |
++iter | 令iter 指示容器中的下一个元素 |
--iter | 令iter 指示容器中的上一个元素 |
iter1 == iter2 | 判断两个迭代器是否相等 |
迭代器运算
vector
和string
迭代器支持的运算:
运算符 | 解释 |
---|---|
iter + n | 迭代器加上一个整数值仍得到一个迭代器,迭代器指示的新位置和原来相比向前移动了若干个元素。结果迭代器或者指示容器内的一个元素,或者指示容器尾元素的下一位置。 |
iter - n | 迭代器减去一个证书仍得到一个迭代器,迭代器指示的新位置比原来向后移动了若干个元素。结果迭代器或者指向容器内的一个元素,或者指示容器尾元素的下一位置。 |
iter1 += n | 迭代器加法的复合赋值语句,将iter1 加n的结果赋给iter1 |
iter1 -= n | 迭代器减法的复合赋值语句,将iter2 减n的加过赋给iter1 |
iter1 - iter2 | 两个迭代器相减的结果是它们之间的距离,也就是说,将运算符右侧的迭代器向前移动差值个元素后得到左侧的迭代器。参与运算的两个迭代器必须指向的是同一个容器中的元素或者尾元素的下一位置。 |
> 、>= 、< 、<= | 迭代器的关系运算符,如果某迭代器 |
- difference_type:保证足够大以存储任何两个迭代器对象间的距离,可正可负。
数组
- 相当于vector的低级版,长度固定。
定义和初始化内置数组
- 初始化:
char input_buffer[buffer_size];
,长度必须是const表达式,或者不写,让编译器自己推断。 - 数组不允许直接赋值给另一个数组。
访问数组元素
- 数组下标的类型:
size_t
。 - 字符数组的特殊性:结尾处有一个空字符,如
char a[] = "hello";
。 - 用数组初始化
vector
:int a[] = {1,2,3,4,5}; vector<int> v(begin(a), end(a));
。
数组和指针
- 使用数组时,编译器一般会把它转换成指针。
- 标准库类型限定使用的下标必须是无符号类型,而内置的下标可以处理负值。
- 指针访问数组:在表达式中使用数组名时,名字会自动转换成指向数组的第一个元素的指针。
C风格字符串
- 从C继承来的字符串。
- 用空字符结束(
\0
)。 - 对大多数应用来说,使用标准库
string
比使用C风格字符串更安全、更高效。 - 获取
string
中的cstring
:const char *str = s.c_str();
。
C标准库String函数,定义在<cstring>
中:
函数 | 介绍 |
---|---|
strlen(p) | 返回p 的长度,空字符不计算在内 |
strcmp(p1, p2) | 比较p1 和p2 的相等性。如果p1==p2 ,返回0;如果p1>p2 ,返回一个正值;如果p1<p2 ,返回一个负值。 |
strcat(p1, p2) | 将p2 附加到p1 之后,返回p1 |
strcpy(p1, p2) | 将p2 拷贝给p1 ,返回p1 |
多维数组
- 多维数组的初始化:
`int ia[3][4] = {{0,1,2,3}, ...}`
- 使用范围for语句时,除了最内层的循环外,其他所有循环的控制变量都应该是引用类型。
指针vs引用
- 引用总是指向某个对象,定义引用时没有初始化是错的。
- 给引用赋值,修改的是该引用所关联的对象的值,而不是让引用和另一个对象相关联。
指向指针的指针
- 定义:
int **ppi = π
- 解引用:
**ppi
动态数组
- 使用
new
和delete
表达和c中malloc
和free
类似的功能,即在堆(自由存储区)中分配存储空间。 - 定义:
int *pia = new int[10];
10可以被一个变量替代。 - 释放:
delete [] pia;
,注意不要忘记[]
。
P74-P118
string表示可变长的字符序列,vector存放的是某种给定类型对象的可变长序列。
命名空间的 using 声明
using namespace:name;
头文件不应包含using声明。
标准库类型 string
#include <string>
using namespace std;
(1)定义和初始化
string s1;
sting s2(s1);
string s3("value");
string s3 = "value";
string s4(n, 'c');
(2)string对象的操作
s.empty(); // 判空
s.size(); // 字符个数
s[n]; // s中第n个字符的引用
s1+s2; // s1和s2连接
<,<=,>,>= // 比较
::: warning
标准局允许把字面值和字符串字面值转换成string对象。字面值和string是不同的类型。
:::
(3)处理string对象中的字符
::: tip C++程序的头文件应该使用cname,而不应该使用name.h的形式 :::
遍历给定序列中的每个值执行某种操作
for (declaration : expression)
statement
标准库类型 vector 标准库vector表示对象的集合,其中所有对象的类型都相同。
vector是一个类模板,而不是类型。
(1)定义和初始化vector对象
vector<T> v1;
vector<T> v2(v1);
vector<T> v2 = v1;
vector<T> v3(n, val);
vector<T> v4(n);
vector<T> v5{a,b,c...}
vecrot<T> v5={a,b,c...}
如果用圆括号,那么提供的值是用来构造vector对象的。
如果用花括号,则是使用列表初始化该vector对象。
(2)向vector对象添加元素
先定义一个空的vector对象,在运行的时候使用push_back向其中添加具体指。
(3)其他vector操作
v.empty();
v.size();
v.push_back(t);
v[n];
注意
只能对确认已存在的元素执行下标操作。
迭代器介绍 迭代器运算符
*iter // 解引用,返回引用
iter->mem // 等价于 (*iter).mem
++iter
--iter
iter1 == iter2
iter1 != iter2
iter + n
iter - n
iter += n
iter -= n
iter1 - iter2 // 两个迭代器相减的结果是它们之间的距离
>, >=, <, <= // 位置比较
注意
凡是使用了迭代器的循环体,都不能向迭代器所属的容器添加元素。
数组 (1)数组、指针
使用数组下标的时候,通常将其定义为size_t类型。
注意
定义数组必须指定数组的类型,不允许用auto推断。
不存在引用的数组。
如果两个指针分别指向不相关的对象,则不能进行对这2个指针进行比较。
多维数组 多维数组实际上是数组的数组。
size_t cnt = 0;
for(auto &row : a)
for (auto &col : row){
col = cnt;
++cnt;
}
int *ip[4]; // 整型指针的数组
int (*ip)[4]; // 指向含有4个整数的数组
术语
begin string和v
ector的成员,返回指向第一个元素的迭代器。也是一个标准库函数,输入一个数组,返回指向该数组首元素的指针。
end string和vector的成员,返回一个尾后迭代器。也是一个标准库函数,输入一个数组,返回指向该数组尾元素的下一个位置的指针。