前言
这是看到nutch可以跑起来的最后一步,加油!
solr的下载
本来我还是想上传CSDN的,但是看了看100多M,还是算了吧。
运行solr
解压solr后,进入${SOLR_HOME}/example,运行start.jar
java -jar start.jar
验证solr是否启动成功
进入java http://localhost:8983/solr
,看到如下页面说明启动成功
nutch整合solr
将${NUTCH_DIR}/conf/schema-solr4.xml拷贝到${SOLR_DIR}/example/solr/collection1/conf/并重命名为schema.xml,在fields域里最后添加一行
<field name="_version_" type="long" indexed="true" stored="true" multiValued="false"/>
重启solr
关闭solr的终端,重新打开一个终端,运行java java -jar start.jar
验证nutch
创建urls/seed.txt,seed.txt里应该写点啥自便吧,运行java ./nutch inject urls/seed.txt
预告
下一篇<a>nutch2.2.1与hbase1.1.1的坑爹版本问题</a>