采用一致性Hash去搭建Redis多机系统

最近项目使用Redis缓存很多实时的数据,很多还是HashMap形式的,比较吃资源,查询还比较频繁,单机版的Redis性能上有点跟不上。节点上数据量一大就容易影响使用redis的模块的平稳运行,所以我们决定再加两台服务器,搭建三节点的Redis服务器。

网上看了下,Redis集群安装有点麻烦,实在不是太想尝试。于是我们思考了一种比较简单的办法,直接采用分布式系统中负载均衡用作负载均衡地一致性hash来控制读写的服务器。这样三台服务器之间是完全独立的(不过这个搞法肯定不如集群版稳定)。

什么是一致性Hash

一致性哈希算法常用于负载均衡中要求资源被均匀的分布到所有节点上,并且对资源的请求能快速路由到对应的节点上。它相对hash%N来说,可扩展性较好。hash%N方式当增加服务器时,会造成大量数据检索无效。

一致性hash特性

  • 单调性(Monotonicity),单调性是指如果已经有一些请求通过哈希分派到了相应的服务器进行处理,又有新的服务器加入到系统中时候,应保证原有的请求可以被映射到原有的或者新的服务器中去,而不会被映射到原来的其它服务器上去。 这个通过上面新增服务器ip5可以证明,新增ip5后,原来被ip1处理的user6现在还是被ip1处理,原来被ip1处理的user5现在被新增的ip5处理。

  • 分散性(Spread):分布式环境中,客户端请求时候可能不知道所有服务器的存在,可能只知道其中一部分服务器,在客户端看来他看到的部分服务器会形成一个完整的hash环。如果多个客户端都把部分服务器作为一个完整hash环,那么可能会导致,同一个用户的请求被路由到不同的服务器进行处理。这种情况显然是应该避免的,因为它不能保证同一个用户的请求落到同一个服务器。所谓分散性是指上述情况发生的严重程度。好的哈希算法应尽量避免尽量降低分散性。 一致性hash具有很低的分散性

  • 平衡性(Balance):平衡性也就是说负载均衡,是指客户端hash后的请求应该能够分散到不同的服务器上去。一致性hash可以做到每个服务器都进行处理请求,但是不能保证每个服务器处理的请求的数量大致相同

两种实现

不使用虚拟节点

import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Set;
import java.util.SortedMap;
import java.util.TreeMap;

public class ConsistentHashingWithoutVirtualNode {
    /**
           * 待添加入Hash环的服务器列表
          */
         private static String[] servers = {"192.168.0.0:111", "192.168.0.1:111", "192.168.0.2:111",
                "192.168.0.3:111", "192.168.0.4:111"};
     
       /**
      * key表示服务器的hash值,value表示服务器的名称
         */
         private static SortedMap<Integer, String> sortedMap = 
             new TreeMap<Integer, String>();
        
     /**
      * 程序初始化,将所有的服务器放入sortedMap中
     */
     static
  {
      for (int i = 0; i < servers.length; i++)
       {
          int hash = getHash(servers[i]);
          System.out.println("[" + servers[i] + "]加入集合中, 其Hash值为" + hash);
           sortedMap.put(hash, servers[i]);
       }
        System.out.println();
    }
     
     /**
      * 使用FNV1_32_HASH算法计算服务器的Hash值,这里不使用重写hashCode的方法,最终效果没区别 
     */
     private static int getHash(String str)
     {
         final int p = 16777619;
         int hash = (int)2166136261L;
         for (int i = 0; i < str.length(); i++)
        hash = (hash ^ str.charAt(i)) * p;
        hash += hash << 13;
       hash ^= hash >> 7;
       hash += hash << 3;
      hash ^= hash >> 17;
        hash += hash << 5;
         
        // 如果算出来的值为负数则取其绝对值
        if (hash < 0)
            hash = Math.abs(hash);
         return hash;
     }
   
     /**
      * 得到应当路由到的结点
      */
     private static String getServer(String node)
     {
         // 得到带路由的结点的Hash值
         int hash = getHash(node);
        // 得到大于该Hash值的所有Map
         SortedMap<Integer, String> subMap = 
                 sortedMap.tailMap(hash);
         // 第一个Key就是顺时针过去离node最近的那个结点
         Integer i=null;
         String virtualNode = null;
         if(subMap==null||subMap.size()==0){
             i=sortedMap.firstKey();
             virtualNode=sortedMap.get(i);
         }else{
              i = subMap.firstKey();
              virtualNode= subMap.get(i);
         }
         return virtualNode;
     }
    
     public static void main(String[] args)
    {
     HashMap<String,Integer> map=new HashMap<String, Integer>(); 
         List<String> id = new ArrayList<String>();
         for(int i=0;i<1000000;i++){
             String str ;
             if(i%4==0) str = "VD";
             else if(i%4==1) str = "EM";
             else if(i%4==2) str = "LP";
             else str = "VB";
             id.add(str+"_"+i);
             //id.add("adasfdsafdsgfdsagdsafdsafdsaf"+i);
         }         
         for (int i = 0; i < id.size(); i++) {
             String aString =getServer(id.get(i));
             Integer aInteger = map.get(aString);
             if(aInteger==null){
                 map.put(aString,1);
             }else{
                 map.put(aString, aInteger+1);
             }
             System.out.println("id:"+id.get(i)+"被分配到节点: "+aString+"上");
         }
         Set<String> set= map.keySet();
        for(String a:set){
            System.out.println("节点【"+a+"】分配到元素个数为==>"+map.get(a));
        }
         
         
    }
}

测试结果:1000000个请求


不使用虚拟节点.png

可以看出来,不使用虚拟节点的一致性hash虽然保证了每台服务器都可以接收到一定量的请求,但是不保证大致的平衡,出现了一定的数据倾斜问题。

使用虚拟节点

采用虚拟节点可以把每台服务器映射成多个虚拟节点,这样服务器hash环俩俩之间的距离就变小了,当我们映射到某一个最近的虚拟节点时,我们就将这个请求交给虚拟节点对应的真实节点去处理。这样的话,对于我们这种真实节点比较少的情况,就可以提供更加细粒度的hash映射,有效地减少数据清洗问题。

下面是测试代码:


import java.util.ArrayList;
import java.util.HashMap;
import java.util.LinkedList;
import java.util.List;
import java.util.Set;
import java.util.SortedMap;
import java.util.TreeMap;
public class ConsistentHashingWithVirtualNode {
    /**
     * 待添加入Hash环的服务器列表
      */
    private static String[] servers = {"192.168.0.0:111", "192.168.0.1:111", "192.168.0.2:111",
            "192.168.0.3:111", "192.168.0.4:111"};
   
   /**
      * 真实结点列表,考虑到服务器上线、下线的场景,即添加、删除的场景会比较频繁,这里使用LinkedList会更好
     */
   private static List<String> realNodes = new LinkedList<String>();
   /**
    * 虚拟节点,key表示虚拟节点的hash值,value表示虚拟节点的名称
    */
   private static SortedMap<Integer, String> virtualNodes = 
           new TreeMap<Integer, String>();
    
    /**
      * 虚拟节点的数目,这里写死,为了演示需要,一个真实结点对应5个虚拟节点
    */
     private static final int VIRTUAL_NODES = 1000;
     /**
      * 
     * @Title: buildVirtualNodes   
     * @Description: 建立虚拟节点
     * @param    
     * @return void   
     * @throws
      */
     public void buildVirtualNodes(){
         synchronized(virtualNodes) {
             for (int i = 0; i < servers.length; i++)
                 realNodes.add(servers[i]);
             
            // 再添加虚拟节点,遍历LinkedList使用foreach循环效率会比较高
             for (String str : realNodes)
             {
                 for (int i = 0; i < VIRTUAL_NODES; i++)
                 {
                   String virtualNodeName = str + "&&VN" + String.valueOf(i);
                     int hash = getHash(virtualNodeName);
                     System.out.println("虚拟节点[" + virtualNodeName + "]被添加, hash值为" + hash);
                    virtualNodes.put(hash, virtualNodeName);
                }
             }
         }
     }
   
  static
  {
        // 先把原始的服务器添加到真实结点列表中
         for (int i = 0; i < servers.length; i++)
             realNodes.add(servers[i]);
         
        // 再添加虚拟节点,遍历LinkedList使用foreach循环效率会比较高
         for (String str : realNodes)
         {
             for (int i = 0; i < VIRTUAL_NODES; i++)
             {
               String virtualNodeName = str + "&&VN" + String.valueOf(i);
                 int hash = getHash(virtualNodeName);
                 System.out.println("虚拟节点[" + virtualNodeName + "]被添加, hash值为" + hash);
                virtualNodes.put(hash, virtualNodeName);
            }
         }
         System.out.println();
   }
   
     /**
      * 使用FNV1_32_HASH算法计算服务器的Hash值,这里不使用重写hashCode的方法,最终效果没区别 
      */
     private static int getHash(String str)
     {
         final int p = 16777619;
        int hash = (int)2166136261L;
        for (int i = 0; i < str.length(); i++)
            hash = (hash ^ str.charAt(i)) * p;
          hash += hash << 13;
        hash ^= hash >> 7;
        hash += hash << 3;
        hash ^= hash >> 17;
        hash += hash << 5;
       
        // 如果算出来的值为负数则取其绝对值
         if (hash < 0)
             hash = Math.abs(hash);
         return hash;
     }
    
     /**
      * 得到应当路由到的结点
      */
     private static String getServer(String node)
     {
         // 得到带路由的结点的Hash值
         int hash = getHash(node);
         // 得到大于该Hash值的所有Map
         SortedMap<Integer, String> subMap = 
                 virtualNodes.tailMap(hash);
         Integer i=null;
         String virtualNode = null;
         if(subMap==null||subMap.size()==0){
             i=virtualNodes.firstKey();
             virtualNode=virtualNodes.get(i);
         }else{
              i = subMap.firstKey();
              virtualNode= subMap.get(i);
         }
         // 第一个Key就是顺时针过去离node最近的那个结点
       
         // 返回对应的虚拟节点名称,这里字符串稍微截取一下
         return virtualNode.substring(0, virtualNode.indexOf("&&"));
     }
     
     public static void main(String[] args)
     {
        
        HashMap<String,Integer> map=new HashMap<String, Integer>(); 
         List<String> id = new ArrayList<String>();
         for(int i=0;i<1000000;i++){
             String str ;
             if(i%4==0) str = "VD";
             else if(i%4==1) str = "EM";
             else if(i%4==2) str = "LP";
             else str = "VB";
             id.add(str+"_"+i);
             //id.add("adasfdsafdsgfdsagdsafdsafdsaf"+i);
         }         
         for (int i = 0; i < id.size(); i++) {
             String aString =getServer(id.get(i));
             Integer aInteger = map.get(aString);
             if(aInteger==null){
                 map.put(aString,1);
             }else{
                 map.put(aString, aInteger+1);
             }
             System.out.println("id:"+id.get(i)+"被分配到节点: "+aString+"上");
         }
         Set<String> set= map.keySet();
        for(String a:set){
            System.out.println("节点【"+a+"】分配到元素个数为==>"+map.get(a));
        }
    }
 }

测试结果:1000000
每个真实节点构造1000个虚拟节点


使用虚拟节点.png

可以看出,这样加入虚拟节点后,各个节点的数据变得均衡了。但是虚拟节点添加过多会占用大量内存,如果不是过分强调负载均衡,不宜设置过大。

接下来就是修改原来的redis的代码。让jedis能够找到对应的服务器去读写数据。这一步我们需要写一个类继承Jedis类,重写这些读写操作

public class MyJedis extends Jedis{
    private static HashMap<String,Jedis> jedisMap = new HashMap<String,Jedis>();
    public MyJedis(){
        SortedMap  realNodes = ConsistentHashingWithVirtualNode.virtualNodes;
        for (Entry<String, String> entry : realNodes.entrySet()) {
            String ip = entry.getKey();
            jedisMap.put(ip, JedisPoolUtils.getJedisByIP(ip));
            }
    }
      /*根据key去获取相应的ip,并根据ip来获取相应的jedis*/
    public Jedis getJedis(String key){
        String jedisIP = ConsistentHashingWithVirtualNode.getServer(key);
        return jedisMap.get("jedisIP");
    }
       /*重写hashMap的set方法*/
    @Override
    public String hmset(String key, Map<String, String> hash) {
        // TODO Auto-generated method stub
        Jedis jedis = this.getJedis(key);//根据key去获取jedis连接
        return jedis.hmset(key, hash);用该key去操作
    }
    
    /*此处不累赘......*/
}

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,968评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,601评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,220评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,416评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,425评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,144评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,432评论 3 401
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,088评论 0 261
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,586评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,028评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,137评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,783评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,343评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,333评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,559评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,595评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,901评论 2 345