数据结构就是数据在内存中存储的一种方式,如果数据在内存中的存储是地址连续的,比如内存中从0到9的位置就用来存储1,2,3, ... 8,9,10这10个数字,那么这种存储方式就是数组。如果数据在内存中存储地址是不连续的,而是有空位就放的,但是每个位置都保存下一个存储位置的地址,那么这种存储方式就是链表。
数组 | 链表 | |
---|---|---|
读取 | O(1) | O(n) |
插入 | O(n) | O(1) |
删除 | O(n) | O(1) |
如上表所示,在查找某个数据时,数组可以根据下标直接找出来,即O(1), 而链表需要遍历,挨个查过去,算法运行时间为O(n)。插入数据的时候,如果插入的不是首尾的位置,数组就需要相应的把插入位置后面的数据向后移,为O(n),而列表插入的时候只需要把上一个数据的指向位置改成插入的位置,再把插入位置指向下一个数据的位置即可。删除的时候,数组如果删除的不是最后一个,也是需要把相应的数据前移,而列表只需要把删除位置上一个位置指向删除位置的下一个位置的地址即可,为O(1)。
在存储数据时,还有一种映射的结构,叫做散列表。散列表就是一个键对应一个值,比如一斤苹果5块钱,把水果的名称苹果作为键,而水果的价格作为值,这两个形成一个映射关系,只要给出苹果这个键,就立马能够知道这个水果的价格是5块钱一斤。如果把所有水果都使用这种映射结构存储,每次只需要把水果名称输入进去,就可以立刻得到水果的价格,即算法运行时间是O(1)。
当然,散列表在使用的时候也会有其他问题,比如用来记录不同的人的投票情况,如果一个人已经投过票了,再次进行投票的话,就会和之前重复,这时应该不允许这个人再次投票。
还有如果两个键在散列表做映射的时候,映射的是同一个位置,就会产生冲突。比较简单的解决方法就是在这个位置,做一个链表,如果两个键映射到同一个位置的话,就把个两个键用链表保存起来。但这样又出现一个新问题,如果某个位置有特别多的映射,就是这个用来保存相同键位置的链表很长,而其他位置几乎没有保存键或者很少,这样这个散列表的性能反而不如链表和数组单独使用了。这里有一个解决方法就是尽量使散列函数可以把键均匀的分布在不同的位置上,还有就是计算当前散列表的散列因子(散列表包含的元素数/位置总数),如果散列因子超过 0.7,就开始调整散列表的长度。