一、数据挖掘技术的常用方法
数据挖掘是从数据当中发现趋势或模式的过程,这个过程的目标是通过对大量数据的分类从而发现新的信息。数据挖掘(DataMining)指的是从大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的信息和知识的过程。
企业中应用数据挖掘技术的一般过程为:问题定义、发现信息、制订实施计划、采取行动及监测效果等步骤。数据挖掘过程中常采用以下几种方法:
1.分类(有指导的学习)数据挖掘中的分类(或有指导的学习)方法在商务领域普遍存在。人们可以对数据库中的数据进行分组,一旦数据被分类,就可以概括这些不同组的特点。数据分类的基本技术有神经网络、遗传算法、决策树、贝叶斯信任网络、统计分析等方法。
2.聚类研究(无指导的学习)聚类是一种对具有共同趋势和模式的数据元组进行分组的方法。聚类又称分段,是将数据集划分成若干个不同组的过程。聚类技术试图找出数据集中共性和差异,并将具有共性的元组聚合在相应的类或段中。
3.可视化。可视化即以图形方式表示数据,以图形方式表示的数据易于理解。可视化技术可以很容易地表示例外情况,例外是其值不在期望范围的数据。
4.关联(货篮子)分析。关联(或货篮子,简称MB)分析可以发现给定数据集中的频繁模式,常被用作从产品目录或零售商店的销售数据(无论是有形销售还是在线销售)中导出产品和关联的商用信息。
5.Web页挖掘。随着互联网技术的迅速发展,web上的信息无比丰富,web页挖掘可以对web页上的海量数据进行分析,提炼出有价值的信息。
6.异常性分析。从繁多的数据中挖掘出与其他数据显著不同的数据。
二、企业中数据、知识、信息、知识管理和信息管理的关系
企业中数据指的是各种未经处理的业务数据、销售数据、生产数据等,通过对这些数据进行加工处理就可以得到一些对企业经营有利的信息。企业中的知识和信息共同构成企业知识的来源,知识不是数据和信息的简单积累,知识是一种包括了人员的经验、价值观、关联关系,以及专家见解等要素的动态集合。数据是形成信息的基础或组成部分,处理过的数据可以形成信息。信息是知识的重要组成部分,信息经过加工处理可以变成知识。
知识管理是指对知识的创新、获取、加工、存储、传播和应用的管理,知识管理的研究存在两大研究主题:企业知识管理和图书馆知识管理。企业知识管理的内容包括:企业智力资源管理、知识产权资源管理、市场资源管理、组织设计管理、文化管理、信息化管理。信息管理是为实现组织目标,满足组织需求,解决组织环境问题而对信息资源进行开发、规划、控制、集成、利用的一种战略管理。信息管理是知识管理的基础,知识管理是信息管理的延伸与发展。
三、基于数据挖掘技术的知识管理
数据挖掘技术可以从企业数据中挖掘出有价值的知识,增强企业商务智能。信息化的推进让企业积累了大量的数据,建立充分利用这些数据的意识,从凌乱的数据中挖掘有用知识,这意味着企业开始向知识管理迈进。数据挖掘通过数据总结、数据分类、数据聚类和关联规则来发现企业中的显式知识和隐式知识。下图是基于数据挖掘技术的知识管理框架:
知识管理框架图
从图中可以看到,知识管理框架的核心是知识管理系统,知识管理系统可以看作是获取数据、提取知识、管理知识和向知识使用者提供知识的系统。知识管理系统从数据源中获取数据,通过数据挖掘可以发现数据中的隐式知识并且通过知识服务器供知识使用者使用。整个知识框架的目的是打败企业的竞争对手。企业中的一个组织可能扮演多个角色,其中的一个角色可能就是竞争对手,例如:一个组织拥有它自己的数据库并且利用数据挖掘技术从数据库中提取知识,它还可能会使用从其他组织的数据库中提取的知识。在这个例子中,这个组织具有数据源和知识消费者两个角色,并且利用数据挖掘技术从多个组织中挖掘知识,因此,它还扮演数据提取者的角色。
四、结论
企业处在日益激烈的市场竞争环境中,企业越来越难依靠资本、技术、自然资源和劳动力等经济资源来获得独特的竞争优势。随着知识经济的到来,知识作为一种经济资源将发挥越来越重要的作用,知识管理作为一种全新的经营管理模式可以提高企业的竞争力。人、信息技术和组织是知识管理的三个要素,信息技术搭建组织知识流转的信息基础结构,形成遵循组织统一入口、本体分类、知识流程和有序的知识结构体系。数据挖掘是数据库和信息决策领域的一个理论前沿,是知识发现的核心部分。数据挖掘技术可以快速有效地分析和处理来自企业内外部的大量的数据和信息,从而为企业的预测和决策提供科学依据。