您好、欢迎来到现金彩票网!
当前位置:秒速快3 > 数据挖掘 >

到底是什么数据挖掘呢需要什么技术呢

发布时间:2019-08-12 01:34 来源:未知 编辑:admin

  可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。

  展开全部数据挖掘是近年来数据库应用技术中相当热门的议题,看似神奇、听来时髦,实际上却也不是什么新东西,因其所用之诸如预测模型、数据分割,连结分析(Link Analysis)、偏差侦测(Deviation Detection)等,美国早在二次世界大战前就已应用运用在人口普查及军事等方面。随着信息科技超乎想象的进展,许多新的计算机分析工具问世,例如关系型数据库、模糊计算理论、基因算法则以及类神经网络等,使得从数据中发掘宝藏成为一种系统性且可实行的程序。R一般而言,数据挖掘的理论技术可分为传统技术与改良技术两支。传统技术以统计分析为代表,统计学内所含序列统计、概率论、回归分析、类别数据分析等都属于传统数据挖掘技术,尤其 数据挖掘 对象多为变量繁多且样本数庞大的数据,是以高等统计学里所含括之多变量分析中用来精简变量的因素分析(Factor Analysis)、用来分类的判别分析(DiscriminantAnalysis),以及用来区隔群体的分群分析(Cluster Analysis)等,在数据挖掘过程中特别常用。在改良技术方面,应用较普遍的有决策树理论(Decision Trees)、类神经网络(Neural Network)以及规则归纳法(Rules Induction)等。决策树是一种用树枝状展现数据受各变量的影响情形之预测模型,根据对目标变量产生之效应的不同而建构分类的规则,一般多运用在对客户数据的分析上,例如针对有回函与未回含的邮寄对象找出影响其分类结果的变量组合,常用分类方法为CART(Classification and Regression Trees)及CHAID(Chi-Square Automatic InteractionDetector)两种。R类神经网络是一种仿真人脑思考结构的数据分析模式,由输入之变量与数值中自我学习并根据学习经验所得之知识不断调整参数以期建构数据的型样 (patterns)。类神经网络为非线性的设计,与传统回归分析相比,好处是在进行分析时无须限定模式,特别当数据变量间存有交互效应时可自动侦测出;缺点则在于其分析过程为一黑盒子,故常无法以可读之模型格式展现,每阶段的加权与转换亦不明确,是故类神经网络多利用于数据属于高度非线性且带有相当程度的变量交感效应时。

  规则归纳法是知识发掘的领域中最常用的格式,这是一种由一连串的「如果…/则…(If / Then)」之逻辑规则对数据进行细分的技术,在实际运用时如何界定规则为有效是最大的问题,通常需先将数据中发生数太少的项目先剔除,以避免产生无意义的逻辑规则。

  我们知道,现在的年代,每天都在有上亿的数据量在增长。楼盘数据啦。。。。股票数据啦。。。,交通数据啦。。。。等等等等。这些数据究竟有什么用呢?这就需要一些专业的数据挖掘工程师去挖掘有用的数据。什么是有用的数据呢?打个比方:之前最火的足球世界杯赌球,就是用了数据的挖掘,那体现在什么地方呢,有专业的人员将球员的传球率,射门率,。。。。进行数据的统计,分析。这样就可以预测出哪个球队的胜算率要大些。总而言之,挖掘海量数据中的有用信息不但可以预测商机,未来的发展趋势。。。。等等。至于使用到什么技术的话,当然是云计算了。这么巨大的数据量如果不用云计算的话,估计人要疯掉了

http://talkingwithjon.com/shujuwajue/968.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有