- 数据分布
如何将数据分布到多台服务器才能够保证数据分布均匀?数据分布到多台服务器后如何实现跨服务器读写操作? - 一致性
如何将数据的多个副本复制到多台服务器,即使在异常情况下,也能够保证不同副本之间的数据一致性? - 容错
如何检测到服务器故障?如何自动将出现故障的服务器上的数据和服务迁移到集群中其他服务器? - 负载均衡
新增服务器和集群正常运行过程中如何实现自动负载均衡?数据迁移的过程中如何保证不影响已有服务? - 事务与并发控制
如何实现分布式事务?如何实现多版本并发控制? - 易用性
如何设计对外接口使得系统容易使用?如何设计监控系统并将系统的内部状态以方便的形式暴露给运维人员? - 压缩/解压缩
如何根据数据的特点设计合理的压缩/解压缩算法?如何平衡压缩算法节省的存储空间和消耗的CPU计算资源?
摘自:《大规模分布式存储系统:原理解析与架构实战》 — 杨传辉