[Linux] Nutch 2.3.1+ Hbase + Hadoop + Solr 单机指南(三)


这是本指南的第三篇,本熊做这个的初衷就是刷刷小Y的好感度,但直到完成还是迷迷糊糊的。对于本熊而言读女人心简直堪比读算法导论,虽然两个都不太读得懂。本熊这段时间看到过关于交友平台的机器人的纪录片,让机器算法来搭讪自己潜在的伴侣,这是个很浪漫有趣的想法,会有人喜欢上这个像dull dull dull 的人类的机器人吗? I'm curious


纯初学者说明模式
本章节主讲实现本地模式

  • Hbase的安装配置
  • Hbase的简单语句
  • 相对应的Hadoop配置
  • SSH免密码登录

0.路径说明

本熊假设Hadoop的主目录为HadoopPath,Hbase的主目录为HbasePath

以下是本熊的解压位置:
HadoopPath的值就是 /usr/Dzy/hadoop-2.5.2
HbasePath的值就是 /usr/Dzy/hbase-0.98.8-hadoop2
NutchPath的值就是 /usr/Dzy/apache-nutch-2.3.1

各位可以按照自己的路径进行设置,本熊再次只为说明方便


1.Hbase安装与配置

1.1 Hbase配置修改

本熊只配置所需的最低设定了,各位可以参照官方文档尝试更多的有趣的设置

  • 在HbasePath下,在/conf下修改hbase-env.sh,添加以下设置
    export JAVA_HOME=/usr/jdk/
  • 在相同目录下修改hbase-site.xml,在<configuration></configuration>标签中添加以下设置
    <property>
    <name>hbase.rootdir</name>
    <value>hdfs://localhost:9000/hbase</value>
    </property>
    <property>
    <name>hbase.cluster.distributed</name>
    <value>true</value>
    </property>

因为采用的是hdfs,hbase.rootdir代表hbase的主目录在hdfs的位置,hbase.cluster.distributed代表hbase的启动模式是本机还是集群

1.2 Hbase启动与简单查询

  • 在HbasePath目录下,启动终端输入
    bash ./bin/start-hbase.sh
    开启Hbase的服务,此时在浏览器输入以下网址 http://localhost:60010/master-status 可以看见Hbase的homepage
    http://localhost:60010/master-status

这里可以看见Hbase数据库中所有的表和信息,除此之外还有一种 方式在终端内实现查看(适用于非图形界面的系统)

  • 在HbasePath目录下,在终端输入
    ./bin/hbase shell
    启动Hbase的Shell模式,如下图


    Hbase Shell
  • 可以实用简单的指令实现查询
  1.  list
    

查看Hbase数据库内所有的表

  1.  scan 'Table'
    

查看Hbase数据库内名为Table表的内容

以上是使用Nutch的Hbase的简单的基础语法和配置


2.Hadoop安装与配置

  • 在HadoopPath下 /etc/hadoop目录中的修改core-site.xml内在<configuration></configuration>标签中添加以下设置

      <property>
          <name>fs.default.name</name>
          <value>hdfs://localhost:9000</value>
      </property>
      <property>
           <name>dfs.replication</name>
           <value>1</value>
      </property>
      <property>
            <name>hadoop.tmp.dir</name>
            <value>/usr/tmp</value>
       </property>
    

这三个属性分别是hdfs的主机位置,再连接的次数与hadoop缓存存放位置

  • 在相同目录下,将 mapred-site.xml.template 在当前目录复制黏贴,并重命名为mapred-site.xml<configuration></configuration>标签中添加以下设置
    <property>
    <name>mapred.job.tracker</name>
    <value>localhost:9001</value>
    </property>
    此处代表执行map phase的tracker的主机,因为是本地伪集群,故写成这样

3.SSH免密码登录

采用ssh策略的原因为了hadoop中zookeeper的管理便利,我们所知远程访问主机采取的多为 用户名+密码 的模式,往往因为权限问题导致错误,本熊发现ssh策略就可以很好的回避这点

  • 开启终端,输入以下指令,安装ssh
    sudo apt-get install openssh-server
  • 在终端,输入以下指令,开启ssh服务
    service sshd restart
  • 输入以下命令,制作ssh密钥上传到本机
    ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
    cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
  • 可以用以下命令检测是否成功,成功的话会显示系统版本及登录时间
    ssh localhost


    登录成功

4.Hadoop的启动

启动Hadoop

  • 在HadoopPath下,在终端输入以下命令,执行namenode初始化

      bin/hadoop  namenode -format
    
  • 在终端输入下面的命令,成功后可以下图

      bash ./sbin/start-all.sh
    
hadoop启动成功

我们可以清楚的看出hadoop的执行过程,dfs与yarn,hadoop成功启动

  • 有兴趣的看官们,本熊强烈推荐可以去试试hadoop自带的WordCount程序来体验一把hadoop,具体的部分可以参照hadoop官网的说明,十分有助于理解hadoop的工作机制哦

第三期完

写到现在突然发现本熊和小Y,一个缺智商,一个缺情商。形象的说宅若久时天然呆,呆到深处自然萌 又宅又呆的小Y看来只有走仓鼠的蠢萌路线了,本熊表示很心痛。玩笑话就说到这里,本熊又宅又呆已有二十余载,突悟还是要学学年轻人该有的生活方式,不知道各位的年轻时是如何打发自己的,本熊也想学学

      (。・д・。)      ( ・ˍ・) (・ˍ・*)     (・-・。)

相关内容
[Linux] Nutch 2.3.1+ Hbase + Hadoop + Solr 单机指南(一)
[Linux] Nutch 2.3.1+ Hbase + Hadoop + Solr 单机指南(二)
[Linux] Nutch 2.3.1+ Hbase + Hadoop + Solr 单机指南(三)
[Linux] Nutch 2.3.1+ Hbase + Hadoop + Solr 单机指南(四)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容