ETHINK大数据提供本文 转载请注明作者 谢谢
数据挖掘主要是数据开采,是从新角度将数据库技术、KDD技术与统计学合理结合,依据企业既定目标,在各项数据中更深入地挖掘其内部潜在性信息,且有效处理各项知识的过程。在数据挖掘过程中,高效率获取大量数据,或者基于一定应用领域找出数据之间所存在的关系, 可有效提升算法效率。
数据挖掘大都是为达到一定目的而进行数据收集,这就使得数据挖掘难度较大。在数据挖掘中,重要的数据极易丢失,未知性和不完全性等均存在于其中。Web数据挖掘大都是从众多web站点和文档集合中深层挖掘潜在有效信息,这也是数据挖掘技术在Web环境下的应用。Web数据挖掘技术是一项综合技术,其涉及多个学科,比如计算机语言学、统计学和信息学等。
Web数据挖掘一般可分为Web结构挖掘、web内容挖掘和web访问信息挖掘等。其中,Web结构挖掘即挖掘web潜在的链接结构模式;web内容挖掘是对Web页面内容进行挖掘,从大量的web数据中发现信息、抽取知识的过程;web访问信息挖掘即用户从web站点的访问数据中发现有价值的信息。近年来,现代商业发展迅速,用户量逐年增长,web数据库包含的数据资源日趋多样,自动收集数据,并将挖掘数据转换为商业行为,从而满足数据挖掘条件,这也使现代商业成为了web数据挖掘的一大领域。 |