Spark的split和partition之间有什么区别?
Kafka的breaker / partition / replication 之间的关系?如果有2个breaker ,4个partition,1个replication,数据将如何分布?如果有2个breaker ,4个partition,2个replication,数据将如何分布?
kafka为什么会有较高的吞吐率?
Zookeeper的设计原理及主要作用。利用ZK如何实现分布式锁?
Java的单例模式?(在多线程情况下只初始化一次)Java的单例模式能破解吗?如何防止反射破解?
大数据技术主要是要解决什么问题?分布式技术主要解决什么问题?面临哪些技术难题与瓶颈?