搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
关于solr+nutch+hadoop,是否还需要使用solrCloud
0
3
0
分享
关于solr+nutch+hadoop,是否还需要使用solrCloud
Rgnrtn
发表于 2013-10-16 13:39:06
[显示全部楼层]
阅读模式
关闭右栏
3
7088
About云VIP帮助找工作和提升
nutch用的1.6源码编译,hadoop用的1.0.4,solr是3.6.2
看hadoop的mapreduce管理页面,发现有solrindex这一项job。
索引建立是比较耗时的操作,节点扩展以后,按理来说会把索引建立的这些mapreduce任务分给节点,是不是这种情况下我就不需要再使用多节点的solrCloud?
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(3)人评论
电梯直达
正序浏览
tntzbzc
发表于 2013-10-16 13:39:49
问下LZ,索引建立后,你打算怎么处理?
回复
使用道具
举报
显身卡
koubi1986
发表于 2013-10-16 13:40:33
你好!请教一些问题:
请问一下
1。你是如何把nutch抓取到的二进制内容,在项目中读取的。
2。nutch抓取时候,发现有很多url没有被成功抓取过来,请问你做的时候,有什么 办法是提高成功率。
3。对抓取过来内容你们是如何进行关键词搜索
希望群主可以帮忙解答一下。万分感激!
email:83132614@qq.com
回复
使用道具
举报
显身卡
Liushuai030805
发表于 2013-10-16 13:41:31
引用 2 楼 koubi1986 的回复:
你好!请教一些问题:
请问一下
1。你是如何把nutch抓取到的二进制内容,在项目中读取的。
2。nutch抓取时候,发现有很多url没有被成功抓取过来,请问你做的时候,有什么 办法是提高成功率。
3。对抓取过来内容你们是如何进行关键词搜索
希望群主可以帮忙解答一下。万分感激!
email:83132614@qq.com
抓取过来的东西不能直接使用,要进行二次开发。
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
Rgnrtn
新手上路
关注
主题
帖子
粉丝
TA的主题
关于solr+nutch+hadoop,是否还需要使用solrCloud
2013-10-16
24小时热文
ChatGPT全栈开发实战:从需求分析到数据可
解析深度学习+语音识别实践
工业互联网与数据智能
数字图像处理第4版【英文】
《商业分析实践指南》
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈