3网络数据挖掘的分析方法
针对网络经济形态下的数据挖掘,我们主要采用以下三种方式进行数据挖掘:
3.1关联分析
利用关联规则进行数据挖掘。
在数据挖掘研究领域,对于关联分析的研究开展得比较深入,人们提出了多种关联规则的挖掘算法,如APRIORI、STEM、AIS、DHP等算法。
关联分析的目的是挖掘隐藏在数据间的相互关系,它能发现数据库中形如“90%的顾客在一次购买活动中购买商品A的同时购买商品B”之类的知识。
关联分析就是生成所有具有用户指定的最小置信度和最小支持度的关联规则。
3.2分类分析
设有一个数据库和一组具有不同特征的类别(标记),该数据库中的每一个记录都赋予一个类别的标记,这样的数据库称为示例数据库或训练集。
分类分析就是通过分析示例数据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其它数据库中的记录进行分类。
3.3序列模式分析
序列模式分析和关联分析法相似,其目的也是为了采掘出数据之间的联系,但序列模式分析的侧重点在于分析数据间的前后(因果)关系。
运用序列模式分析销售记录,零售商则可以发现客户潜在的购物模式,例如客户在购买微波炉前常购买何种商品。
3.4数据挖掘与信息过滤技术的结合
网络的迅速发展导致了“信息过载”、“信息超载”现象,利用网络数据挖掘中得到的数据进行信息过滤机制就是为了克服上述现象,减少用户在获得信息过程中的负担,同时向用户提供数量适宜、质量优良的信息应运而生的。
比如在网络内容挖掘之前对网络文档中包含的`信息进行过滤、筛选、分类和归档等操作,使网络内容挖掘所要处理的数据量得以减少,使输入数据的质量、网络内容挖掘的信息挖掘速度及精确度和用户所得信息的时效性得以提高。
4网络数据挖掘步骤
1)确定应用领域:包括此领域的基本知识和目标。
2)建立目标数据集:选择一个数据集或在多数据集的子集上聚焦。
3)数据预处理:在大数据集中,根据需求,利用数据净化和整合技术,选择与任务相关数据,在不降低其准确度的状况下减少处理数据量。
4)数据转换:找到数据的特征进行编码,减少有效变量的数目。
5)数据挖掘:根据数据和所要发现知识的种类来确定相应的挖掘算法。
6)数据评价:将挖掘出的知识和数据以各种可视化方式显示,并将其以图形、文本等方式存储在库中,以便对它们进一步挖掘,直至满意为止。
7)实施和应用:利用数据挖掘技术所建立模型在实际项目中的应用,包括数据库的构建,个性化用户服务、基于知识的企业信息管理(MIS)、企业目标管理、决策支持等等。
5网络数据挖掘的未来展望
以上数据时网络经济形态下,在工商管理部分的应用,实际的工商管理目标是为工商管理与决策提供服务,未来的数据挖掘将会形成标准的数据挖掘语言或其他方面的标准化工作的数据挖掘系统。
数据挖掘能发现网络中隐含的有价值的信息和知识,从而提高标引、自动摘要、自动分类和自动聚类等的准确率;能促进用户兴趣模型的构建,从而为用户提供更好的个性化信息,难以满足网络信息用户的动态需求。
在网络信息检索的实际应用中,往往不是单一地运用数据挖掘技术,数据挖掘需和其他相关技术结合,才能发挥出更大的效用。
参考文献:
[1]刘彩虹,杨玉红.论图书馆文献信息服务的创新[J].图书馆工作与研究,20xx (1):59-61.
[2]王振强.用知识管理思想建设企业竞争情报——通过信息综合利用实现企业竞争智能[EB/OL].(20xx-12-15).
[3]周黎明,邱均平.基于网络的内容分析法[J].情报学报,20xx (5):594-599.
[4]罗春荣,曹树金.因特网的信息资源评价[J].中国图书馆学报,20xx (3):45-52.
[5]苗杰,倪波.面向集成竞争情报系统的数据挖掘应用研究[J].情报学报,20xx (8):443—450.
[6]翁烨.知识管理系统与市场数据挖掘的融合[J].中国信息导报,20xx (7):52-53.
[7]郑宏珍,韩静萍.异构平台数据仓库与数据挖掘技术[J].中国信息导报,20xx (2):53-55.