Solr空间搜索原理分析与实践

查看数: 27731 | 评论数: 6 | 收藏 1
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2015-6-7 13:02

正文摘要:

问题导读 1.空间搜索的原理是什么? 2.空间如何基于solr进行搜索? 3.使用solr搜索有哪些好处? 前言在美团CRM系统中,搜索商家的效率与公司的销售额息息相关,为了让BD们更便捷又直观地 ...

回复

dead_lyn 发表于 2015-9-23 08:57:13
是的~~抓的一个个网页 包含html标签。

我需要,将 视屏或者文档之类的抓取下来,存到HBASE中,或者本地,

现在就是不清楚这个怎么弄,需要看什么,不知道nutch能完成吗。


丫丫 发表于 2015-9-14 13:33:13
dead_lyn 发表于 2015-9-12 11:08
SOS~~~求问LZ,,,
在使用nutch后,爬取的都是一个一个的网页内容。。。
想问:后续的处理一般是怎么样的。 ...

爬取得整个网页的内容,包括html标签吗?若是包括html标签就好处理了,可以转换成xml进行解析。若是只是一些表面文字,爬取下来也没啥意义。
dead_lyn 发表于 2015-9-12 11:08:21
SOS~~~求问LZ,,,
在使用nutch后,爬取的都是一个一个的网页内容。。。
想问:后续的处理一般是怎么样的。
比如,想爬取一个网站的视频资源,如何下载下来呢。。。
谢谢啦!!

刚果 发表于 2015-9-1 17:52:14
好高级啊,完全晕菜啊
佳宁仔 发表于 2015-6-8 09:00:58
很高大上呀,保存了慢慢学习
hhli 发表于 2015-6-7 21:07:33
好帖子,保存一下。。。
关闭

推荐上一条 /2 下一条