您好、欢迎来到现金彩票网!
当前位置:秒速快3 > 数据挖掘 >

大学的哪个专业是研究数据挖掘的?

发布时间:2019-08-12 01:36 来源:未知 编辑:admin

  可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。

  知道合伙人数码行家采纳数:1051获赞数:4401毕业于渤海大学,硕士向TA提问展开全部数据挖掘属于计算机科学与技术方向中的数据分析方向,也有在数学专业中开设。

  数据挖掘技术是一种数据处理的技术,是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中、人们事先不知道又潜在有用信息和知识的过程。数据挖掘需要根据数据仓库中的数据信息,选择合适的分析工具,应用统计方法、事例推理、决策树、规则推理、模糊集、甚至神经网络、遗传算法的方法处理信息,得出有用的分析信息。数据挖掘过程是一个反复循环的过程,每一个步骤如果没有达到预期目标,都需要回到前面的步骤,重新调整并执行。

  从数据本身来考虑,通常数据挖掘需要有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示等8个步骤。

  (1) 信息收集:根据确定的数据分析对象抽象出在数据分析中所需要的特征信息,然后选择合适的信息收集方法,将收集到的信息存入数据库。对于海量数据,选择一个合适的数据存储和管理的数据仓库是至关重要的。

  (2) 数据集成:把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。

  (3) 数据规约:执行多数的数据挖掘算法即使在少量数据上也需要很长的时间,而做商业运营数据挖掘时往往数据量非常大。数据规约技术可以用来得到数据集的规约表示,它小得多,但仍然接近于保持原数据的完整性,并且规约后执行数据挖掘结果与规约前执行结果相同或几乎相同。

  (4) 数据清理:在数据库中的数据有一些是不完整的(有些感兴趣的属性缺少属性值),含噪声的(包含错误的属性值),并且是不一致的(同样的信息不同的表示方式),因此需要进行数据清理,将完整、正确、一致的数据信息存入数据仓库中。不然,挖掘的结果会差强人意。

  (5) 数据变换:通过平滑聚集,数据概化,规范化等方式将数据转换成适用于数据挖掘的形式。对于有些实数型数据,通过概念分层和数据的离散化来转换数据也是重要的一步。

  (6) 数据挖掘过程:根据数据仓库中的数据信息,选择合适的分析工具,应用统计方法、事例推理、决策树、规则推理、模糊集、甚至神经网络、遗传算法的方法处理信息,得出有用的分析信息。

  (8) 知识表示:将数据挖掘所得到的分析信息以可视化的方式呈现给用户,或作为新的知识存放在知识库中,供其他应用程序使用。

  数据挖掘过程是一个反复循环的过程,每一个步骤如果没有达到预期目标,都需要回到前面的步骤,重新调整并执行。不是每件数据挖掘的工作都需要这里列出的每一步,例如在某个工作中不存在多个数据源的时候,步骤(2)数据集成的步骤便可以省略。

  2008-12-16展开全部1.数据挖掘是从大量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程。

  目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以

  目标中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种关系

  首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分

  估值与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的

  一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的

  连续变量的值,然后,根据预先设定的阈值,进行分类。例如:银行对家庭贷款业务,运

  用估值,给各个客户记分(Score 0~1)。然后,根据阈值,将贷款级别分类。

  通常,预言是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用

  预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时

  a. 超市中客户在购买A的同时,经常会购买B,即A = B(关联规则)

  聚集是对记录分组,把相似的记录在一个聚集里。聚集和分类的区别是聚集不依赖于预先

  聚集通常作为数据挖掘的第一步。例如,哪一种类的促销对客户响应最好?,对于这一

  类问题,首先对整个客户做聚集,将客户分组在各自的聚集里,然后对每个不同的聚集,

  数据挖掘首先是需要商业环境中收集了大量的数据,然后要求挖掘的知识是有价值的。有

  · 机器学习分为两种学习方式:自组织学习(如神经网络);从例子中归纳出规则(如决

  数据挖掘是八十年代,投资AI研究项目失败后,AI转入实际应用时提出的。它是一个新兴

  的,面向商业应用的AI研究。选择数据挖掘这一术语,表明了与统计、精算、长期从事预

  统计也开始支持数据挖掘。统计本包括预言算法(回归)、抽样、基于经验的设计等

  · OLAP(联机分析处理)、Data Mart(数据集市)、多维数据库

  数据挖掘与个人预言:数据挖掘号称能通过历史数据的分析,预测客户的行为,而事实上

  ,客户自己可能都不明确自己下一步要作什么。所以,数据挖掘的结果,没有人们想象中

  客户的行为是与社会环境相关连的,所以数据挖掘本身也受社会背景的影响。比如说,在

  美国对银行信用卡客户信用评级的模型运行得非常成功,但是,它可能不适合中国。

  2.数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合

  ◆面向主题:操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。

  ◆集成的:数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。

  ◆相对稳定的:数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。

  ◆反映历史变化:数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。

  数据仓库系统是一个信息提供平台,他从业务处理系统获得数据,主要以星型模型和雪花模型进行数据组织,并为用户提供各种手段从数据中获取信息和知识。

  从功能结构化分,数据仓库系统至少应该包含数据获取(Data Acquisition)、数据存储(Data Storage)、数据访问(Data Access)三个关键部分

  数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。

  并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,则是信息检索(information retrieval)领域的任务。虽然这些任务是重要的,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此,数据挖掘技术也已用来增强信息检索系统的能力。

  展开全部数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。

http://talkingwithjon.com/shujuwajue/971.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有