《后端架构师技术图谱》

最后更新于20180427

数据结构
- 队列
- 集合
- 链表、数组
- 字典、关联数组
- 栈
- 树
- BitSet
常用算法
- 排序、查找算法
- 布隆过滤器
- 字符串比较
  - KPM 算法
- 深度优先、广度优先
- 贪心算法
- 回溯算法
- � 10000 ��枝算法
- 动态规划
- 朴素贝叶斯
- 推荐算法
- 最小生成树算法
- 最短路径算法
并发
- 多线程
- 线程安全
- 一致性、事务
  - 事务 ACID 特性
  - 事务的隔离级别
- 锁
操作系统
- 计算机原理
- 进程
- 线程
- 协程
- Linux
设计模式
- 设计模式的六大原则
- 23种常见设计模式
- 应用场景
- 单例模式
- 责任链模式
- MVC
- IOC
- AOP
- UML
- 微服务思想
  - 康威定律
运维 & 统计 & 技术支持
- 常规监控
- APM
- 统计分析
- 持续集成(CI/CD)
  - Jenkins
  - 环境分离
- 自动化运维
  - Ansible
  - puppet
  - chef
- 测试
- 虚拟化
  - KVM
  - Xen
  - OpenVZ
- 容器技术
  - Docker
- 云技术
  - OpenStack
- DevOps
- 文档管理
中间件
- Web Server
  - Nginx
  - OpenResty
  - Apache Httpd
  - Tomcat
    - 架构原理
    - 调优方案
  - Jetty
- 缓存
  - 本地缓存
- 客户端缓存
  - Memcached
  - Redis
    - 架构
    - 回收策略
  - Tair
- 消息队列
- 定时调度
  - 单机定时调度
  - 分布式定时调度
- RPC
  - Dubbo
  - Thrift
  - gRPC
- 数据库中间件
  - Sharding Jdbc
- 日志系统
  - 日志搜集
- 配置中心
- API 网关
网络
- 协议
  - OSI 七层协议
  - TCP/IP
  - HTTP
  - HTTP2.0
  - HTTPS
- 网络模型
  - Epoll
  - NIO
  - kqueue
- 连接和短连接
- 框架
- 零拷贝（Zero-copy）
- 序列化(二进制协议)
  - Hessian
  - Protobuf
数据库
- 基础理论
  - 数据库设计的三大范式
- MySQL
- NoSQL
  - MongoDB
  - Hbase
搜索引擎
- 搜索引擎原理
- Lucene
- Elasticsearch
- Solr
- sphinx
性能
- 性能优化方法论
- 容量评估
- CDN 网络
- 连接池
- 性能调优
- 流式计算
  - Storm
  - Flink
  - Kafka Stream
  - 应用场景
- Hadoop
  - HDFS
  - MapReduce
  - Yarn
- Spark
安全
- web 安全
  - XSS
  - CSRF
  - SQL 注入
  - Hash Dos
  - 脚本注入
  - 漏洞扫描工具
  - 验证码
- DDoS 防范
- 用户隐私信息保护
- 加密解密
- 服务器安全
- 数据安全
  - 数据备份
- 网络隔离
  - 内外网分离
  - 登录跳板机
- 授权
  - RBAC
  - OAuth2.0
常用开源框架
- 开源协议
- 日志框架
  - Log4j、Log4j2
  - Logback
- ORM
- 网络框架
- Web 框架
  - Spring 家族
- 工具框架
分布式设计
- 扩展性设计
- 稳定性 & 高可用
- 数据库扩展
  - 读写分离模式
  - 分片模式
- 服务治理
  - 服务注册与发现
  - 服务路由控制
- 分布式一致
- 分布式文件系统
- 唯一ID 生成
  - 全局唯一ID
- 一致性Hash算法
设计思想 & 开发模式
- DDD(Domain-driven Design - 领域驱动设计)
  - 命令查询职责分离(CQRS)
  - 贫血，充血模型
- Actor 模式
- 响应式编程
- DODAF2.0
- Serverless
项目管理
- 架构评审
- 重构
- 代码规范
- RUP
- 看板管理
- SCRUM
- 极限编程
- 敏捷开发
- 结对编程
通用业务术语
技术趋势
架构师素质
团队管理
- 招聘
资讯
- 行业资讯
- 公众号列表
- 博客
  - 团队博客
  - 个人博客
- 综合门户、社区
- 问答、讨论类社区
- 行业数据分析
- 专项网站
- 其他类
- 推荐参考书
  - 在线电子书
  - 纸质书
技术资源
- 开源资源
- 手册、文档、教程
- 在线课堂
- 会议、活动
- 常用APP
- 找工作
- 工具
- 代码托管
- 文件服务
- 综合云服务商

（Toc generated by simple-php-github-toc ）

数据结构

队列

《java队列——queue详细分析》
- 非阻塞队列：ConcurrentLinkedQueue(无界线程安全)，采用CAS机制（compareAndSwapObject原子操作）。
- 阻塞队列：ArrayBlockingQueue(有界)、LinkedBlockingQueue（无界）、DelayQueue、PriorityBlockingQueue，采用锁机制；使用 ReentrantLock 锁。
《LinkedList、ConcurrentLinkedQueue、LinkedBlockingQueue对比分析》

集合

《Java Set集合的详解》

链表、数组

《Java集合详解--什么是List》

字典、关联数组

《Java map 详解 - 用法、遍历、排序、常用API等》

栈

《java数据结构与算法之栈（Stack）设计与实现》
《Java Stack 类》
《java stack的详细实现分析》
- Stack 是线程安全的。
- 内部使用数组保存数据，不够时翻倍。

树

二叉树

每个节点最多有两个叶子节点。

《二叉树》

完全二叉树

《完全二叉树》
- 叶节点只能出现在最下层和次下层，并且最下面一层的结点都集中在该层最左边的若干位置的二叉树。

平衡二叉树

左右两个子树的高度差的绝对值不超过1，并且左右两个子树都是一棵平衡二叉树。

二叉查找树（BST）

二叉查找树（Binary Search Tree），也称有序二叉树（ordered binary tree）,排序二叉树（sorted binary tree）。

《浅谈算法和数据结构: 七二叉查找树》

红黑树

《最容易懂得红黑树》
- 添加阶段后，左旋或者右旋从而再次达到平衡。
《浅谈算法和数据结构: 九平衡查找树之红黑树》

B-，B+，B*树

MySQL是基于B+树聚集索引组织表

《B-树，B+树，B*树详解》
《B-树，B+树与B*树的优缺点比较》
- B+ 数的叶子节点链表结构相比于 B- 数便于扫库，和范围检索。

LSM 树

LSM（Log-Structured Merge-Trees）和 B+ 树相比，是牺牲了部分读的性能来换取写的性能(通过批量写入)，实现读写之间的。 Hbase、LevelDB、Tair（Long DB）、nessDB 采用 LSM 树的结构。LSM可以快速建立索引。

《LSM树 VS B+树》
- B+ 树读性能好，但由于需要有序结构，当key比较分散时，磁盘寻道频繁，造成写性能。
- LSM 是将一个大树拆分成N棵小树，先写到内存（无寻道问题，性能高），在内存中构建一颗有序小树（有序树），随着小树越来越大，内存的小树会flush到磁盘上。当读时，由于不知道数据在哪棵小树上，因此必须遍历（二分查找）所有的小树，但在每颗小树内部数据是有序的。
《LSM树（Log-Structured Merge Tree）存储引擎》
- 极端的说，基于LSM树实现的HBase的写性能比MySQL高了一个数量级，读性能低了一个数量级。
- 优化方式：Bloom filter 替代二分查找；compact 小数位大树，提高查询性能。
- Hbase 中，内存中达到一定阈值后，整体flush到磁盘上、形成一个文件（B+数），HDFS不支持update操作，所以Hbase做整体flush而不是merge update。flush到磁盘上的小树，定期会合并成一个大树。

BitSet

经常用于大规模数据的排重检查。

常用算法

《常见排序算法及对应的时间复杂度和空间复杂度》

排序、查找算法

《常见排序算法及对应的时间复杂度和空间复杂度》

选择排序

《Java中的经典算法之选择排序（SelectionSort）》
- 每一趟从待排序的记录中选出最小的元素，顺序放在已排好序的序列最后，直到全部记录排序完毕。

冒泡排序

《冒泡排序的2种写法》
- 相邻元素前后交换、把最大的排到最后。
- 时间复杂度 O(n²)

插入排序

《排 10000 序算法总结之插入排序》

快速排序

《坐在马桶上看算法：快速排序》
- 一侧比另外一次都大或小。

归并排序

《图解排序算法(四)之归并排序》
- 分而治之，分成小份排序，在合并(重建一个新空间进行复制)。

希尔排序

TODO

堆排序

《图解排序算法(三)之堆排序》
- 排序过程就是构建最大堆的过程，最大堆：每个结点的值都大于或等于其左右孩子结点的值，堆顶元素是最大值。

计数排序

《计数排序和桶排序》
- 和桶排序过程比较像，差别在于桶的数量。

桶排序

《【啊哈！算法】最快最简单的排序——桶排序》
《排序算法（三）：计数排序与桶排序》
- 桶排序将[0,1)区间划分为n个相同的大小的子区间，这些子区间被称为桶。
- 每个通单独进行排序，然后再遍历每个桶。

基数排序

按照个位、十位、百位、...依次来排。

二分查找

《二分查找(java实现)》
- 要求待查找的序列有序。
- 时间复杂度 O(logN)。
《java实现二分查找-两种方式》
- while + 递归。

Java 中的排序工具

《Arrays.sort和Collections.sort实现原理解析》
- Collections.sort算法调用的是合并排序。
- Arrays.sort() 采用了2种排序算法 -- 基本类型数据使用快速排序法，对象数组使用归并排序。

布隆过滤器

常用于大数据的排重，比如email，url 等。核心原理：将每条数据通过计算产生一个指纹（一个字节或多个字节，但一定比原始数据要少很多），其中每一位都是通过随机计算获得，在将指纹映射到一个大的按位存储的空间中。注意：会有一定的错误率。优点：空间和时间效率都很高。缺点：随着存入的元素数量增加，误算率随之增加。

《布隆过滤器 -- 空间效率很高的数据结构》
《大量数据去重：Bitmap和布隆过滤器(Bloom Filter)》
《基于Redis的布隆过滤器的实现》
- 基于 Redis 的 Bitmap 数据结构。
《网络爬虫：URL去重策略之布隆过滤器(BloomFilter)的使用》
- 使用Java中的 BitSet 类和加权和hash算法。

字符串比较

KPM 算法

KPM：Knuth-Morris-Pratt算法（简称KMP）核心原理是利用一个“部分匹配表”，跳过已经匹配过的元素。

《字符串匹配的KMP算法》

深度优先、广度优先

《广度优先搜索BFS和深度优先搜索DFS》

贪心算法

回溯算法

《五大常用算法之四：回溯法》

剪枝算法

《α-β剪枝算法》

动态规划

朴素贝叶斯

《带你搞懂朴素贝叶斯分类算法》
- P(B|A)=P(A|B)P(B)/P(A)
《贝叶斯推断及其互联网应用1》
《贝叶斯推断及其互联网应用2》

最小生成树算法

《算法导论--最小生成树（Kruskal和Prim算法）》

最短路径算法

《Dijkstra算法详解》

并发

多线程

《40个Java多线程问题总结》

线程安全

《Java并发编程——线程安全及解决机制简介》

一致性、事务

事务 ACID 特性

《数据库事务ACID特性》

事务的隔离级别

未提交读：一个事务可以读取另一个未提交的数据，容易出现脏读的情况。
读提交：一个事务等另外一个事务提交之后才可以读取数据，但会出现不可重复读的情况（多次读取的数据不一致），读取过程中出现UPDATE操作，会多。（大多数数据库默认级别是RC，比如SQL Server，Oracle），读取的时候不可以修改。
可重复读：同一个事务里确保每次读取的时候，获得的是同样的数据，但不保障原始数据被其他事务更新（幻读），Mysql InnoDB 就是这个级别。
序列化：所有事物串行处理（牺牲了效率）
《理解事务的4种隔离级别》
数据库事务的四大特性及事务隔离级别
《MySQL的InnoDB的幻读问题》
- 幻读的例子非常清楚。
- 通过 SELECT ... FOR UPDATE 解决。
《一篇文章带你读懂MySQL和InnoDB》
- 图解脏读、不可重复读、幻读问题。

MVCC

《【mysql】关于innodb中MVCC的一些理解》
- innodb 中 MVCC 用在 Repeatable-Read 隔离级别。
- MVCC 会产生幻读问题（更新时异常。）
《轻松理解MYSQL MVCC 实现机制》
- 通过隐藏版本列来实现 MVCC 控制，一列记录创建时间、一列记录删除时间，这里的时间
- 每次只操作比当前版本小（或等于）的行。

锁

Java中的锁和同步类

《Java中的锁分类》
- 主要包括 synchronized、ReentrantLock、和 ReadWriteLock。
《Java并发之AQS详解》
《Java中信号量 Semaphore》
- 有数量控制
- 申请用 acquire，申请不要则阻塞；释放用 release。
《java开发中的Mutex vs Semaphore》
- 简单的说就是Mutex是排它的，只有一个可以获取到资源， Semaphore也具有排它性，但可以定义多个可以获取的资源的对象。

公平锁 & 非公平锁

公平锁的作用就是严格按照线程启动的顺序来执行的，不允许其他线程插队执行的；而非公平锁是允许插队的。

《公平锁与非公平锁》
- 默认情况下 ReentrantLock 和 synchronized 都是非公平锁。ReentrantLock 可以设置成公平锁。

悲观锁

悲观锁如果使用不当（锁的条数过多），会引起服务大面积等待。推荐优先使用乐观锁+重试。

《【MySQL】悲观锁&乐观锁》
- 乐观锁的方式：版本号+重试方式
- 悲观锁：通过 select ... for update 进行行锁(不可读、不可写，share 锁可读不可写)。
《Mysql查询语句使用select.. for update导致的数据库死锁分析》
- mysql的innodb存储引擎实务锁虽然是锁行，但它内部是锁索引的。
- 锁相同数据的不同索引条件可能会引起死锁。
《Mysql并发时经典常见的死锁原因及解决方法》

乐观锁 & CAS

《乐观锁的一种实现方式——CAS》
- 和MySQL乐观锁方式相似，只不过是通过和原值进行比较。

ABA 问题

由于高并发，在CAS下，更新后可能此A非彼A。通过版本号可以解决，类似于上文Mysql 中提到的的乐观锁。

《Java CAS 和ABA问题》
《Java 中 ABA问题及避免》
- AtomicStampedReference 和 AtomicStampedReference。

CopyOnWrite容器

可以对CopyOnWrite容器进行并发的读，而不需要加锁。CopyOnWrite并发容器用于读多写少的并发场景。比如白名单，黑名单，商品类目的访问和更新场景，不适合需要数据强一致性的场景。

《JAVA中写时复制(Copy-On-Write)Map实现》
- 实现读写分离，读取发生在原始数据上，写入发生在副本上。
- 不用加锁，通过最终一致实现一致性。
《聊聊并发-Java中的Copy-On-Write容器》

RingBuffer

《线程安全的无锁RingBuffer的实现【一个读线程，一个写线程】》

可重入锁 & 不可重入锁

《可重入锁和不可重入锁》
- 通过简单代码举例说明可重入锁和不可重入锁。
- 可重入锁指同一个线程可以再次获得之前已经获得的锁。
- 可重入锁可以用户避免死锁。
- Java中的可重入锁：synchronized 和 java.util.concurrent.locks.ReentrantLock
《ReenTrantLock可重入锁（和synchronized的区别）总结》
- synchronized 使用方便，编译器来加锁，是非公平锁。
- ReenTrantLock 使用灵活，锁的公平性可以定制。
- 相同加锁场景下，推荐使用 synchronized。

互斥锁 & 共享锁

互斥锁：同时只能有一个线程获得锁。比如，ReentrantLock 是互斥锁，ReadWriteLock 中的写锁是互斥锁。共享锁：可以有多个线程同时或的锁。比如，Semaphore、CountDownLatch 是共享锁，ReadWriteLock 中的读锁是共享锁。

《ReadWriteLock场景应用》

死锁

《“死锁”四个必要条件的合理解释》
- 互斥、持有、不可剥夺、不可剥夺。
Java如何查看死锁？
- JConsole 可以识别死锁。
java多线程系列：死锁及检测
- jstack 可以显示死锁。

操作系统

计算机原理

《操作系统基础知识——操作系统的原理，类型和结构》

CPU

多级缓存

典型的 CPU 有三级缓存，举例核心越近，速度越快，空间越小。L1 一般 32k，L2 一般 256k，L3 一般12M。内存速度需要200个 CPU 周期，CPU 缓存需要1个CPU周期。

《从Java视角理解CPU缓存和伪共享》

进程