用户组:游客
问题导读 1.什么是json? 2.给定java对象如何实现生成对应json? 3.如何实现将java对象转化为xml格式的字符串? ...
本帖最后由 nettman 于 2015-4-16 22:41 编辑 问题导读 1.Query子类有哪些? 2.QueryParser与MultiFieldQueryParser有什么 ...
问题导读: 1、评判算法优劣的指标有哪些? 2、什么是压缩率? 3、倒排文件压缩算法有哪些? 倒排列表压缩算法 目前 ...
问题导读 1.搜索引擎建立索引,如何实现用户查询? 2.什么是一次一文档? 3.什么是一次一单词? 索引的查询处 ...
问题导读 1.两遍文档遍历法速度快的原因是什么? 2.如何创建索引? 3.归并法和排序法的区别是什么? 4.常用的索引更新策略有 ...
问题导读: 1.什么是倒排索引? 2.什么是单词词典? 3.什么是倒排列表? 前几天我阅读了搜索引擎索引这一章,发现倒排索 ...
问题导读 1.什么是暗网抓取? 2.什么是暗网? 3.分布式爬虫常见的分布式架构有哪两种? 前言考虑到上次的网 ...
问题导读 1.什么是网络爬虫? 2.通用爬虫框架有哪些部分组成? 3.优秀爬虫有哪些特性? 前言通用搜索 ...
问题导读 1.商业搜索引擎公司是如何发展的?2.搜索引擎公司是如何发展的?3.搜索引擎技术框架有哪些? 相信搜索引擎对于 ...
本帖最后由 pig2 于 2015-4-20 00:35 编辑 问题导读: 1、lucene搜索分页有哪两种方式? 2、不做缓存如何查询数据? 3、luc ...
问题导读: 1、构建索引的过程是怎样的? 2、lucene与关系型数据库它们俩从索引和模糊查询方面,两者的区别是什么? 3、什么 ...
本帖最后由 gefieder 于 2015-4-19 22:40 编辑 问题导读: 1、如何使用lucene对硬盘上的文件建立索引? 2、如何在索引文件中 ...
本帖最后由 nettman 于 2015-4-16 22:43 编辑 问题导读: 1、阅读页的信息如何采集? 2、如果鼠标右键无法查看网页源代码, ...
本帖最后由 nettman 于 2015-4-16 22:35 编辑 问题导读: 1、如果查看网页源代码时,发现页面已经把鼠标右键操作屏蔽了,还有 ...
问题导读 1.什么是结构化数据? 2.什么是非结构化数据? 3.如何对非结构化数据实现索引? 4.如何进行索引检索? ...
问题导读: 1、如何采集简介页内容? 2、采集时,如何获取标签和字数字段? 3、如何对获取的html代码做进一步处理? ...
本帖最后由 nettman 于 2015-4-16 22:37 编辑 问题导读: 1、CrawlListPageBase类功能是什么? 2、用HttpClient 模拟浏览器 ...
本帖最后由 nettman 于 2015-4-16 22:36 编辑 问题导读: 1、如何进行通配符检索? 2、如何定义范围搜索? 3、PackQuery类 ...
本帖最后由 nettman 于 2015-4-16 22:39 编辑 问题导读: 1、实时索引基本原理是什么? 2、ConfigBean类都定义了索引的哪些 ...
本帖最后由 nettman 于 2015-4-16 22:38 编辑 问题导读: 1、实时索引中的IndexWriter的操作都是委托给TrackingIndexWriter来 ...
本帖最后由 nettman 于 2015-4-16 22:38 编辑 问题导读: 1、检索结果的数据结构是怎样的? 2、如何利用实时索引去检索数据 ...
本帖最后由 nettman 于 2015-4-16 22:39 编辑 问题导读: 1、如何利用lucene来实现索引的管理? 2、如何实现索引的单例模式 ...
本帖最后由 pig2 于 2015-4-14 00:38 编辑 问题导读 1.lucene索引结构是层次结构,主要有哪几个层次? 2.索引的最小单位是 ...
问题导读 1.ClassUtil类中的方法的作用是什么? 2.CharsetUtil类工具类用途是什么? 3.如何使用第三方jar包检测文件的编码 ...
本帖最后由 nettman 于 2015-4-16 22:41 编辑 问题导读 1.在lucene中哪一个类用来对搜索结果做收集、自定义排序、过滤等? ...
本帖最后由 xioaxu790 于 2014-12-7 20:16 编辑 问题导读 1、什么是Solr Client,有哪些支持语言? 2、Solr的工作过程分为 ...
问题导读 1.StandardAnalyzer有什么优点和缺点? 2.基于Lucene的第三方中文分词是什么技术? 3.IKAnalyzer分词技术有什么缺 ...
本帖最后由 nettman 于 2015-4-16 22:42 编辑 问题导读 1.如何实现搜索索引? 2.如何实现检索索引,获取符合条件的前10条 ...
本帖最后由 nettman 于 2015-4-16 22:42 编辑 问题导读 1.如何指定索引分词技术? 2.如何把文档写到索引中? 3.创建索引 ...
问题导读 1.什么是文档、词元、域? 2.影响一个词元在一篇文档中的重要性主要有哪两个因素? 3.空间向量模型(VSM)可以表 ...
本版积分规则 发表帖子
查看 »