分享

关于知识图谱、文本挖掘等

最近看网上招聘信息,一大半都提到文本挖掘,还有的提到知识图谱,请问这些是什么领域?和平时我们说的挖掘有什么区别和联系?需要什么特殊的知识和技能吗?
谢谢大神们

已有(2)人评论

跳转到指定楼层
NEOGX 发表于 2017-3-29 10:06:21


文本挖掘领域.png

楼主可以看上图,文本挖掘和数据挖掘有一定的交叉点,也就是二者有共同的地方。其实个人认为也是挖掘的一种。

更多内容:
文本挖掘从概念来讲:
文本挖掘可以广义地定义知识密集的处理过程,其中用户使用一套分析工具与文档集合动态(随着时间的推移)交互。在类似于数据挖掘的方式,文本挖掘旨在通过识别令人感兴趣的模式来提取和搜索数据源中有用信息。在文本挖掘中,数据来源是文档集合,发现令人感兴趣的模式不是来自形式化的数据库记录,而是非结构化的文本数据集合。
文本挖掘众多技术的统一主题就是要“把文本转换成数字”,这样强大的算法可以应用到大型文档数据库。将文本转换成结构化,数字格式,并应用分析算法需要知道如何使用和整合这些技术来处理文本,范围包括文本个体到整个文件的数据库。



文本挖掘的应用:
搜索和信息检索(IR):存储和文本文档的检索,包括搜索引擎和关键字搜索。
文档聚类:对词汇,片段,段落或文件进行分组和归类,使用数据挖掘的聚类方法。
文件分类:对片段,段落或文件进行分组和归类,使用数据挖掘分类方法的基础上,经过训练的标记示例模型。
Web挖掘:在互联网上进行数据和文本挖掘,并特别关注在网络的规模和相互联系。
信息抽取(IE):从非结构化文本中识别与提取有关的事实和关系 ; 从非结构化和半结构化文本制作的结构化数据的过程。
自然语言处理(NLP):低层次的语言处理和理解的任务(例如,词性标注); 经常用于同义词库与计算语言学。
概念提取:把单词和短语按语义分组成意义相似的组。


更多了解相关文章:
玩玩文本挖掘
http://www.aboutyun.com/forum.php?mod=viewthread&tid=13235

网络文本挖掘及其在事件相关性情报分析中的应用

http://www.aboutyun.com/forum.php?mod=viewthread&tid=15377

文本挖掘手册【英文版】

http://www.aboutyun.com/forum.php?mod=viewthread&tid=17190

文本挖掘【英文版】

http://www.aboutyun.com/forum.php?mod=viewthread&tid=15724



文本挖掘实战——如何找出新词思路及代码实现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20034

大数据量化投资:研报文本挖掘选股策略

http://www.aboutyun.com/forum.php?mod=viewthread&tid=14590

刘思喆:R语言环境下的文本挖掘

http://www.aboutyun.com/forum.php?mod=viewthread&tid=15602




##############################
知识图谱属于可视化的一种

信息可视化、知识可视化和知识图谱是目前可视化领域的三个主要概念和分支内容。
081113zzcurvrcy7yd7hrm.jpg

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。
120.jpg


推荐文章
知识图谱:大数据语义链接的基石-李涓子
http://www.aboutyun.com/forum.php?mod=viewthread&tid=11621



回复

使用道具 举报

arsenduan 发表于 2017-3-29 19:49:48
可视化推荐
鲜活的数据:数据可视化指南[书籍]
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18729


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条