数据结构学习
一、什么是数据结构
1、数据结构的起源
1968年,美国高德纳教授,《计算机程序技术艺术》第一卷《基本算法》提出,开创了数据结构和算法的先河。
数据结构是一门研究数据之间关系、操作的学科,而非计算数据方法
数据结构+算法=程序 揭露了程序的本质,沃思凭借这个观点获得图灵奖
2、数据结构中的基本概念
数据:任何能够输入到计算机中,能被程序处理的描述客观事物的符号。
数据项:有独立含义的最小单位,也叫做 数据域、域
数据元素:组成数据的、有一定意义的基本单位也叫做节点、结点、顶点
一个数据元素是由若干个数据项组成
数据结构:相互之间存在一种或多种特定关系的数据元素的集合
算法:数据结构中所具备的功能,能够解决某种问题的方法。
3、研究数据结构的三个方面
数据的逻辑结构
一对一 一对多 多对多
数据的存储结构(物理结构)
顺序存储、链式存储
数据结构的运算
4、数据的逻辑结构
集合结构:数据元素同一个集合中,但是元素之间没有任何关系
线型结构(表):数据元素之间存在一对一的关系
树型结构(树):数据元素之间存在一对多的关系
图型结构(图):数据元素之间存在多对多的关系
5、数据的存储结构/物理结构
顺序结构:
数据元素是存储在连续的内存中,使用操作数据时要确保数据的连续性不被破坏,用数据元素的相对位置来表示数据元素之间的关系。
内存空间是连续的,并且数据元素之间也要连续。
优点:支持随机访问,访问效率极高,适合查找数据,不容易产生内存碎片。
缺点:对数据元素的插入、删除操作效率低,实现不方便。对内存的要求较高。(这里主要体现在插入删除一个数据时,
为保持数据的连续性,需要进行大量数据的复制操作。并且需要固定大小,因为需要事先分配足够大的内存,所有,会造成内存的浪费)
链式结构:
数据元素存储在彼此独立的内存空间中(存储在不确定的内存位置),每个独立的元素称为节点,每个节点中额外增加一块指针域。
通过该指针可以指向下一个与该节点有关系的节点,以此表示数据节点之间的关系
优点:对节点的删除、插入效率高,实现简单,适合增删改查,而且内存要求低
缺点: 不支持随机访问,访问效率低,只能从前往后逐一访问,容易产生内存碎片,不适合频繁查找数据
常见面试题:数组和链表的优缺点(就是顺序结构和链式结构的优缺点)
6、逻辑结构和存储结构(物理结构)
表:顺序或者链式
树:链式或者顺序(前后是优先级)
图:链式+顺序
每种逻辑结构采用哪种存储结构,并没有明确的规定,通常根据实现的难度、空间的要求、时间的要求综合选取合适的存储结构
7、数据结构的运算
1、建立数据结构 create\creat
2、销毁数据结构 destroy
3、清空数据结构 clear
4、插入元素 insert\add
5、删除元素 delete
6、修改元素 modify
7、访问元素 access
8、查询元素 query
9、遍历数据结构 show\list\ergodic
10、排序数据结构 sort
二、顺序表的实现
数据项:
存储元素的内存首地址
表的容量
元素的数量
运算:
创建、销毁、清空、插入、删除、修改、访问、查询、遍历、排序
注意:
1、需要确保数据元素的连续性
2、不能越界
三、链式表(链表)(list)重要程度第一
数据元素(节点)的数据项:
数据域:可以是各种类型的若干项数据项
指针域:指向下一个节点的指针
由若干个节点通过指针域连接起来的叫做链表
指针域:指向下一个节点的指针
一、链式表(链表) No.1 list
数据元素(节点)的数据项:
数据域:可以是各种类型的若干项数据项
指针域:指向下一个节点的指针
由若干个节点通过指针域连接起来就形成了链表
不带头节点的链表:
定义:第一个节点的数据域存储的是有效数据
缺点:当插入、删除时可能会改变第一个有效节点,传递的参数需要传递二级指针,实现时需要区分是否是操作第一个有效节点,较为麻烦
带头节点的链表:
定义:第一个节点作为头节点,数据域不使用不存储有效数据,它的指针域永远指向链表的第一个有效数据节点,就算链表长度为0,头节点依然存在
优点:当插入、删除时是不会改变头节点的指向,只需要改变它的next,因此无需传递头节点的二级指针,并且实现时无需区分两种情况
注意:有效节点的处理必须从头节点的next开始
注意:笔试题时,如果题目没有说明链表是否带头节点,应该两种情况都进行分析
二、功能受限的表结构
对表结构的功能加以限制,形成特殊的表结构
栈:
只有一个出入口的表结构,先进后出,FILO表
顺序栈:
数据项:
存储元素的内存首地址
栈的容量
栈顶位置
运算:
创建、销毁、入栈、出栈、栈顶、栈空、栈满、数量
常见的栈的笔试题:
1、某序列为入栈序列(并不表示必须全部入完栈,再出栈),判断哪个序列为正确\不正确的出栈序列
i
入栈: 1 2 3 4 5 a
3 2 1 4 5 b
j
出栈: 1 2 3 4 5 yes
3 2 1 5 4 yes
5 4 2 1 3 no
2、实现一个函数,判断序列b是否是序列a的出栈序列
int a[5] = {1,2,3,4,5},b[5]={1,2,3,4,5};
is_pop(a,b,5)
bool is_pop(int* a,int* b,int len)
{
// 创建一个栈
ArrayStack* stack = create_arrry_stack(len)
// 按照a的顺序一个个入栈
for(int i= 0,j=0;i<len;i++)
{
push_array_stack(stack,a[i]);
// 入栈一个就按b的顺序出栈
int val_top = 0;
while(top_array_stack(stack,&val_top))
{
if(val_top==b[j])
{
pop_array_stack(stack);
j++
}
break;
}
}
// 结束后判断是否栈空
bool flage = empty_array_stack(stack);
destory_array_stack;
return flage;
}
3、两个顺序栈,如何安排入栈方向可以让内存使用率最大化?
让两个顺序栈相邻,且入栈方向相对入栈(也就是,在申请的内存里的,s1和s2的两个栈的栈顶的位置,一个从高到低,一个从低到高),能够让内存空间利用率最大化
4、栈相关的概念:
假设栈容量为cal
空增栈(top栈顶地址从低到高):
top: 0开始 先入栈,再top++
满增栈(指top栈顶指向最新入栈的数据 ):
top: -1开始 先top++,再入栈
空减栈(top栈顶地址从高到低):
top: cal-1开始 先入栈,再top--
满减栈:
top: cal开始 先top--,再入栈
链式栈:
数据项:
栈顶指针
节点数量
运算:
创建、销毁、入栈、出栈、栈顶、栈空、数量
栈的应用:
1、栈内存的数据存储方式
2、函数的调用
3、生产者与消费者模型(仓库:可用栈实现)
4、表达式解析
a+b*c/2 中缀表达式
计算机中以后缀表达式存储 中缀转后缀表达式使用栈