Solr|Nutch|Lucene|ES-About云-梭伦科技-第2页

About云-梭伦科技»专题 › 交流区› 技术交流› Solr|Nutch|Lucene|ES

Solr|Nutch|Lucene|ES

收录了 78 篇文章 · 0 人关注

版块操作

关注本版 RSS订阅

发布新帖

新窗

solr field compressed 选项被removed了，是否有替代的或者其他的压缩方案，求教

solr field compressed 选项被removed了，是否有替代的或者其他的压缩方案，求教

IT_雪夜归人 2016-4-27 3 7832
solrcloud使用solrj的CloudSolrServer和HttpSolrServer方式有什么区别

求教，solrcloud查询使用solrj的CloudSolrServer和HttpSolrServer方式有什么区别？CloudSolrServer这种方式好像有版本的要求。 ...

IT_雪夜归人 2016-4-22 2 17648
初学solr启动有问题

初学solr，看教程遇到了几个问题。教程中在example文件夹下java -jar start.jar就能启动起来。我在example文件夹下没有找 ...

395455030 2016-4-18 3 9275
solrcloud中向一台发起大量请求，内部会不会自动HA

solrcloud 请求问题：我通过webservice方式向solrcloud的其中一台机器发起请求，不知道这个集群里面会有负载均衡？

IT_雪夜归人 2016-4-14 3 8770
CDH安装的solr如何修改 JVM参数，应该改那个配置文件？

CDH 5.5.1 的solr如何修改 JVM参数，应该改那个配置文件，找了半天没有找到、、、

IT_雪夜归人 2015-12-26 3 13298
solrcloud 压力测试OOM该如何解决

测试solrcloud的压力，十个线程并发随机查询，跑了十几分钟之后提示GC时间过长，然后再过几分钟就有节点退出了，提示OutOfMemory ...

IT_雪夜归人 2016-4-7 3 12932
CDH solr jvm内存限制该如何解决

CDH solr jvm调太大了提示超过了32G的建议值，这个有影响么？如果把值调超过32G后，设置的是否有效？超过32G的部分是否能充 ...

IT_雪夜归人 2016-3-23 2 10817
solr-4.10.3-cdh5.5.1版本想在tomcat下面运行，报错

想验证solr在jetty和tomcat下性能区别现在有一个CDH的集群，有一定数量的solr数据 solr-4.10.3-cdh5.5.1版本想在tomcat下面运 ...

IT_雪夜归人 2016-3-23 3 7254
solr分组

请问下solr使用fact分组时能否返回该分组的总条数？就像这里返回10条，怎么得到10这个结果

chaoyuehu 2016-3-23 1 7938
solr一个查询语句同时查询两个core的时候，如果两个core有相同ID的数据，结果少一条

solr一个查询语句同时查询两个core的时候，如果两个core有相同ID的数据，结果查出来的数据少一条，这个是不是有解决方法，求教 ...

IT_雪夜归人 2016-3-21 4 11220
solr core应经建好，并且有数据了，想调整字段，该如何处理

solr core应经建好，并且有数据了，想调整字段，该如何处理 1、有个一个字段我给了默认值，暂且说这一列，如何把这一列置空？ ...

IT_雪夜归人 2016-3-13 1 7288
CDH solrcloud挂掉一个节点后不能正常插入

CDH solrcloud挂掉一个节点后不能正常插入 HttpSolrServer$RemoteSolrException:No registered leader was found after waiting ...

IT_雪夜归人 2016-3-8 2 13223
Spark + ansj 对大数据量中文进行分词

目前的分词器大部分都是单机服务器进行分词，或者使用hadoop mapreduce对存储在hdfs中大量的数据文本进行分词。由于mapreduce的 ...

goldtimes 2016-1-12 0 10884
谈谈Lucene和Solr索引存目录

本帖最后由 goldtimes 于 2015-12-28 16:44 编辑　在Lucene中，有几种索引存放模式呢？用过的人可能记得SimpleFSDirectory、M ...

goldtimes 2015-12-28 0 8865
CDH solr 数据存储路径问题

之前我以为 solr数据默认存储在 hdfs上，并且看到solr的配置页面有如下两个配置： 1、HDFS 数据目录 Solr（服务范围）该 So ...

IT_雪夜归人 2015-12-28 4 22524
CDH5 Solr性能调优

Solr性能调优 Solr性能调优是个复杂的过程，本文旨在描述Solr在使用过程中对性能优化的注意事项。在安装完成之后 ...

xuanxufeng 2015-12-26 1 15778
Solr的扩充(Scaling)以及性能调优【分享】

Solr的扩展(Scaling)以及性能调优当你的索引数量越来越大，你会发现你的搜索响应时间变得更慢，索引新内容的时间也会越来 ...

xuanxufeng 2015-12-24 1 18599
在CDH上搭建的solr集群，core的索引数量超过2千万以后，性能下降的很快

环境是CDH5.2，机器就用1、2、3、4、5来表示，环境是HA高可用模式，1和2是namenode的主备机，3、4、5是datanode，目前只用了HDFS ...

henrylin 2015-12-24 2 22337
CDH的solr数据存储如何从HDFS修改到本地磁盘

CDH的solr数据存储如何从HDFS修改到本地磁盘，CDH安装的solr是存储在hdfs上的，但是从solr的配置页面是无法修改成存储到本地的， ...

IT_雪夜归人 2015-12-22 2 10105
nutch抓取网页如何提取正文信息

用nutch抓取互联网上的网页信息，抓取的content字段，包含了当前网页的所有内容；但是我想只取出正文部分的信息，这个应该如何处 ...

lihy114 2015-10-16 5 14839
nutch 学习心得

之前对nutch进行些分析，打算在基础上进行一些应用，不过最近忙着，也没弄出个所以然，先把阅读心得贴出来，里边可能有不少理解 ...

langke93 2015-10-16 2 9125
谁有Lucene的源码分析视频

http://product.china-pub.com/3502099#ml 比如上面的这个

kanwei163 2015-10-16 2 10609
nutch抓取数据问题

是用nutch抓取10个网站的数据，设置了url信息和过滤策略以后，执行抓取查看抓取的文件，现在主要分析的是crawldb和linkdb文 ...

lihy114 2015-10-13 3 10685
关于nutch scheduler问题，定时调度

nutch是如何进行定时调度的，需要用cron么，有没有相关的调度脚本，求解决方案，谢谢

ximenchuixuesun 2015-9-8 4 8103
关于nutch的抓取策略问题

nutch的抓取调度策略是怎样的？是根据nutch-default.xml中的fecthInternal进行自动调度，还是需要用cron进行调度呢？请大牛们指 ...

ximenchuixuesun 2015-9-8 5 11939
nutch2.3注入solor5.2.1 失败

说找不到host，但是有配置了 Indexing TestCrawl on SOLR index -> http://192.168.100.141:8983/solr/collection1 /home/hado ...

aqi915 2015-9-2 3 17705
亿级规模的Elasticsearch优化实战

问题导读 1.生产环境JVM采用什么样的参数设置？FULL GC频率和时间如何？ 2.分组统计(Facet 查询或 aggregations )大多数 ...

fc013 2015-8-29 0 46486
nutch 2.3 网站注入失败

现在在linux 安装eclipse 并导入 ant eclipse 编译的nutch ，运行injectorjob想把已有的几个网站地址注入到hbase出错了，而 ...

aqi915 2015-8-27 7 14911
nutch2.3 实行抓取时报错，忧伤

各位大虾好：环境是：hadoop2.6.0 hbase 0.98.8 nutch 2.3 但报错了： hadoop@ktbigdata1:~/apache-nutch-2.3$ /home ...

aqi915 2015-8-13 8 14966
nutch启动时异常解决办法

2011-03-14 18:47:05,593 INFO crawl.Crawl - crawl started in: crawled 2011-03-14 18:47:05,593 INFO crawl.Crawl - ro ...

Alkaloid0515 2015-8-13 0 11016