用户组:游客
solr field compressed 选项被removed了,是否有替代的或者其他的压缩方案,求教
求教,solrcloud查询使用solrj的CloudSolrServer和HttpSolrServer方式有什么区别?CloudSolrServer这种方式好像有版本的要求。 ...
初学solr,看教程遇到了几个问题。教程中在example文件夹下java -jar start.jar就能启动起来。我在example文件夹下没有找 ...
solrcloud 请求问题: 我通过webservice方式向solrcloud的其中一台机器发起请求,不知道这个集群里面会有负载均衡?
CDH 5.5.1 的solr如何修改 JVM参数,应该改那个配置文件,找了半天没有找到、、、
测试solrcloud的压力,十个线程并发随机查询,跑了十几分钟之后提示GC时间过长,然后再过几分钟就有节点退出了,提示OutOfMemory ...
CDH solr jvm调太大了提示 超过了32G的建议值,这个有影响么? 如果把值调超过32G后,设置的是否有效?超过32G的部分是否能充 ...
想验证solr在jetty和tomcat下性能区别 现在有一个CDH的集群,有一定数量的solr数据 solr-4.10.3-cdh5.5.1版本想在tomcat下面运 ...
请问下solr使用fact分组时能否返回该分组的总条数?就像这里返回10条,怎么得到10这个结果
solr一个查询语句同时查询两个core的时候,如果两个core有相同ID的数据,结果查出来的数据少一条, 这个是不是有解决方法,求教 ...
solr core应经建好,并且有数据了,想调整字段,该如何处理 1、有个一个字段我给了默认值,暂且说这一列,如何把这一列置空? ...
CDH solrcloud挂掉一个节点后不能正常插入 HttpSolrServer$RemoteSolrException:No registered leader was found after waiting ...
目前的分词器大部分都是单机服务器进行分词,或者使用hadoop mapreduce对存储在hdfs中大量的数据文本进行分词。由于mapreduce的 ...
本帖最后由 goldtimes 于 2015-12-28 16:44 编辑 在Lucene中,有几种索引存放模式呢?用过的人可能记得SimpleFSDirectory、M ...
之前我以为 solr数据默认存储在 hdfs上,并且看到solr的配置页面有如下两个配置: 1、HDFS 数据目录 Solr(服务范围) 该 So ...
Solr性能调优 Solr性能调优是个复杂的过程,本文旨在描述Solr在使用过程中对性能优化的注意事项。 在安装完成之后 ...
Solr的扩展(Scaling)以及性能调优 当你的索引数量越来越大,你会发现你的搜索响应时间变得更慢,索引新内容的时间也会越来 ...
环境是CDH5.2,机器就用1、2、3、4、5来表示,环境是HA高可用模式,1和2是namenode的主备机,3、4、5是datanode,目前只用了HDFS ...
CDH的solr数据存储如何从HDFS修改到本地磁盘,CDH安装的solr是存储在hdfs上的,但是从solr的配置页面是无法修改成存储到本地的, ...
用nutch抓取互联网上的网页信息,抓取的content字段,包含了当前网页的所有内容;但是我想只取出正文部分的信息,这个应该如何处 ...
之前对nutch进行些分析,打算在基础上进行一些应用,不过最近忙着,也没弄出个所以然,先把阅读心得贴出来,里边可能有不少理解 ...
http://product.china-pub.com/3502099#ml 比如上面的这个
是用nutch抓取10个网站的数据,设置了url信息和过滤策略以后,执行抓取 查看抓取的文件,现在主要分析的是crawldb和linkdb文 ...
nutch是如何进行定时调度的,需要用cron么,有没有相关的调度脚本,求解决方案,谢谢
nutch的抓取调度策略是怎样的?是根据nutch-default.xml中的fecthInternal进行自动调度,还是需要用cron进行调度呢?请大牛们指 ...
说找不到host,但是有配置了 Indexing TestCrawl on SOLR index -> http://192.168.100.141:8983/solr/collection1 /home/hado ...
问题导读 1.生产环境JVM采用什么样的参数设置?FULL GC频率和时间如何? 2.分组统计(Facet 查询或 aggregations )大多数 ...
现在在linux 安装eclipse 并导入 ant eclipse 编译的nutch ,运行injectorjob想把已有的几个网站地址注入到hbase出错了, 而 ...
各位大虾好: 环境是:hadoop2.6.0 hbase 0.98.8 nutch 2.3 但报错了: hadoop@ktbigdata1:~/apache-nutch-2.3$ /home ...
2011-03-14 18:47:05,593 INFO crawl.Crawl - crawl started in: crawled 2011-03-14 18:47:05,593 INFO crawl.Crawl - ro ...
本版积分规则 发表帖子
查看 »