脱线道士维克多 - 图解算法 1

图解算法 1

基础知识

大O表示法

我们谈论算法速度时候，说的是随着输入的增加，其运行时间以什么样的速度增加。

大O表示法被用来描述一个算法的性能或复杂度。指出了在最糟糕情况下算法的运行时间。

从快到慢依次排列：

常量时间
对数时间
线性时间
二次方时间
指数时间，这里 c 是算法所需的固定时间，被称为常量
阶乘时间

大O小抄提供了常用的算法时间复杂度，并以图表的形式呈现。可以看一下维基百科。

数据结构相关

内存中的存储形式可以分为连续存储和离散存储两种。数据的物理存储结构就有连续存储和离散存储两种，它们对应了我们通常所说的数组和链表。

数组

数据是连续的；随机访问速度块。
数组是将元素在内存中连续存放，由于每个元素占用内存相同，可以通过下标迅速访问数组中任何元素。
但是如果要在数组中增加/删除一个元素，需要移动大量元素，在内存中空出一个元素的空间，然后将要增加的元素放在其中。

链表

优势在元素的插入和删除；读取所有元素速度块
每个元素都存储了下一个元素的地址，从而使一系列随机元素的内存地址串在一起。

数组和链表的区别：

数组静态分配内存，链表动态分配内存
数组在内存中连续，链表不连续
数组元素在栈区，链表元素在堆区
数组利用下标定位，时间复杂度为O(1)，链表定位元素时间复杂度O(n)
数组插入或删除元素的时间复杂度O(n)，链表的时间复杂度O(1)

栈

有两种操作：压入和弹出
遵循后进先出（LIFO，Last In First Out）
大部分功能函数顺序执行，且是可嵌套的，函数调用的顺序符合 “后入先出”（LIFO）顺序，所以用栈来记录

调用栈 call stack

所有函数调用都进入调用栈
调用栈可能很长，这将占用大量的内存
调用另一个函数时，当前函数暂停并处于未完成状态。该函数的所有变量的值都还在内存中

队列 queue

有两种操作：入队和出队
遵循先进先出（FIFO，First In First Out）

散列表 hash table

数组和链表都直接映射到内存，但散列表使用散列函数来确定元素的存储位置。
散列表由键和值组成。

散列函数是这样的函数，就是无论你给它什么东西，都返回给你一个数字。散列函数满足以下的需求：

它必须是一致的，总是将同样的输入映射到相同的索引。
不同的输入映射到不同的数字。
散列函数知道数组有多大，只返回有效的索引。

你可以使用散列函数和数组创建散列表的数据结构。但是几乎所有语言都有自己内置的散列表，比如 Ruby 的 Hash。

常见的应用场景有：

仿真映射关系，用于查找。比如域名当作 key，IP 地址当作 value，可以做一个简单的 DNS 解析器。
防止重复。比如以名字当作 key，通过判断散列表中该名字的 key 对应的 value 是否为空来判断，这个用户是否已经有过动作。
缓存数据。比如下面代码的例子。

cache = {}
def get_page(url)
  if cache.get(url)
    cache[url]
  else
    data = get_data_form_server(url)
    cache[url] = data
    data
  end
end

图

图由节点 node 和边 edge 组成，相邻的节点被成为邻居。
可以用散列表来表示图的结构。

# 图
graph = {}
# you 是节点，"alice", "bob", "claire" 是邻居
graph["you"] = ["alice", "bob", "claire"]

有向图 directed graph
无向图 undirected graph
加权图 weighted graph
非加权图 unweighted graph

# 有向加权图
graph = {}
# 需要储存起点到邻居的开销
graph["start"] = {}
graph["start"]["a"] = 6
graph["start"]["b"] = 2

拓扑排序

A 依赖于 B，在列表中任务 A 就必须在任务 B 后面。

树

树是一种特殊的图，没有往后指的边。