您好、欢迎来到现金彩票网!
当前位置:秒速快3 > 数据挖掘 >

什么叫数据挖掘、神经网络

发布时间:2019-07-21 16:26 来源:未知 编辑:admin

  可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。

  推荐于2018-03-26展开全部数据挖掘是从大量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程。

  目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以

  目标中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种关系

  首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分

  估值与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的

  一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的

  连续变量的值,然后,根据预先设定的阈值,进行分类。例如:银行对家庭贷款业务,运

  用估值,给各个客户记分(Score 0~1)。然后,根据阈值,将贷款级别分类。

  通常,预言是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用

  预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时

  a. 超市中客户在购买A的同时,经常会购买B,即A = B(关联规则)

  聚集是对记录分组,把相似的记录在一个聚集里。聚集和分类的区别是聚集不依赖于预先

  聚集通常作为数据挖掘的第一步。例如,哪一种类的促销对客户响应最好?,对于这一类问题,首先对整个客户做聚集,将客户分组在各自的聚集里,然后对每个不同的聚集,回答问题,可能效果更好。

  数据挖掘首先是需要商业环境中收集了大量的数据,然后要求挖掘的知识是有价值的。有

  机器学习分为两种学习方式:自组织学习(如神经网络);从例子中归纳出规则(如决策树)

  数据挖掘是八十年代,投资AI研究项目失败后,AI转入实际应用时提出的。它是一个新兴

  的,面向商业应用的AI研究。选择数据挖掘这一术语,表明了与统计、精算、长期从事预

  统计也开始支持数据挖掘。统计本包括预言算法(回归)、抽样、基于经验的设计等

  数据挖掘与个人预言:数据挖掘号称能通过历史数据的分析,预测客户的行为,而事实上,客户自己可能都不明确自己下一步要作什么。所以,数据挖掘的结果,没有人们想象中神秘,它不可能是完全正确的。

  在技术上可以根据它的工作过程分为:数据的抽取、数据的存储和管理、数据的展现等关键技术。

  数据的抽取是数据进入仓库的入口。由于数据仓库是一个独立的数据环境,它需要通过抽取过程将数据从联机事务处理系统、外部数据源、脱机的数据存储介质中导入数据仓库。数据抽取在技术上主要涉及互连、复制、增量、转换、调度和监控等几个方面的处理。在数据抽取方面,未来的技术发展将集中在系统功能集成化方面,以适应数据仓库本身或数据源的变化,使系统更便于管理和维护。

  数据仓库的组织管理方式决定了它有别于传统数据库的特性,也决定了其对外部数据的表现形式。数据仓库管理所涉及的数据量比传统事务处理大得多,且随时间的推移而快速累积。在数据仓库的数据存储和管理中需要解决的是如何管理大量的数据、如何并行处理大量的数据、如何优化查询等。目前,许多数据库厂家提供的技术解决方案是扩展关系型数据库的功能,将普通关系数据库改造成适合担当数据仓库的服务器。

  查询:实现预定义查询、动态查询、OLAP查询与决策支持智能查询;报表:产生关系数据表格、复杂表格、OLAP表格、报告以及各种综合报表;可视化:用易于理解的点线图、直方图、饼图、网状图、交互式可视化、动态模拟、计算机动画技术表现复杂数据及其相互关系;统计:进行平均值、最大值、最小值、期望、方差、汇总、排序等各种统计分析;挖掘:利用数据挖掘等方法,从数据中得到关于数据关系和模式的知识。

  数据挖掘和数据仓库的协同工作,一方面,可以迎合和简化数据挖掘过程中的重要步骤,提高数据挖掘的效率和能力,确保数据挖掘中数据来源的广泛性和完整性。另一方面,数据挖掘技术已经成为数据仓库应用中极为重要和相对独立的方面和工具。

http://talkingwithjon.com/shujuwajue/737.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有