5月份,我又有一个新的挖掘任务,就是根据历史销售记录来分析将来的销售情况。所以需要预先研究一下这个方面的挖掘,以下是我的学习笔记。
预测型知识挖掘:
顾名思义就是由历史数据和当前数据来推测出未来数据的一种挖掘方式。
从上面一句话中的历史,当前,未来三个关键字,我们可以看出时间概念在这次挖掘中将会起到非常重要的作用。 从预测的主要功能上来看,主要是对未来数据的分类和趋势的输出。
统计学中的回归方法等可以通过历史数据直接产生对未来数据的预测的连续值(这个应该就是我要的功能)
预测型知识的挖掘可以借助于经典的统计方法,神经网络和机器学习技术。
一般来说常见的预测应用模型由如下4种:
...
/**
*作者:张荣华
*日期:2008-3-9
**/
先说一说问题,不知道大家有没有这样的经验,反正我是经常碰到。
举例1,某些网站每隔几天就发邮件给我,每次发的邮件内容都是一些我根本不感兴趣的东西,我不甚其扰,对其深恶痛绝。
举例2,添加具有某功能的一个msn机器人,每天都有几次突然蹦出一个窗口,推荐一堆我根本不想知道的内容,烦不烦啊, 我只好将你阻止掉。
每一个观众只想看他感兴趣的东西,而不是一下与之无关的事物,那么如何才能知道观众的兴趣所在呢,还是数据挖掘,经过一番思考,终于有点思路,即根据用户以往的浏览历史来预测用户将来的 ...
/**
*作者:张荣华
*日期:2008-2-23
**/
数据挖掘之分类系列文章
之前说到分类的基本概念以及一个文本分类的实例,原文地址见:http://www.javaeye.com/topic/163285 现在我们就来改造之前的分类算法,本文主要介绍KNN算法在文本分类器中的使用。
kNN算法简介:
kNN(k Nearest Neighbors)算法又叫k最临近方法, 总体来说kNN算法是相对比较容易理解的算法之一,假设每一个类包含多个样本数据,而且每个数据都有一个唯一的类标记表示这些样本是属于哪一个分类, kNN就是计算每个样本数据到待分类数据的距离,取和待分 ...
/**
*作者:张荣华
*日期:2008-2-19
**/
随着当代计算机硬件的发展,硬件功能越来越强大,价格越来越低,企业可以记录的数据也越来越多,这些因素就为数据挖掘的普及做了比较好的前提准备,树挖掘是未来信息处理的重要技术,而且就目前而言已经取得了决定性成功而且得到了比较广泛的应用。
数据挖掘中有很多领域,分类就是其中之一,什么是分类,
分类就是把一些新得数据项映射到给定类别的中的某一个类别,比如说当我们发表一篇文章的时候,就可以自动的把这篇文章划分到某一个文章类别,一般的过程是根据样本数据利用一定的分类算法得到分类规则,新的数据过来就依据该规则进行类别的划分。
分类在数据挖 ...
- 浏览: 106273 次
- 性别:

- 来自: 上海

- 详细资料
搜索本博客
我的相册
100_2076
共 4 张
共 4 张
最新评论
-
如何解决mysql的master-s ...
在实际环境中,使用jdbc:mysql:replication://有一些问题, ...
-- by ahuaxuan -
请问责任链真的是一种设计 ...
用第一种方式实现的职责链可以在runtime选择下一个handler是谁,但是用 ...
-- by taowen -
请问责任链真的是一种设计 ...
如果是gof定义的设计模式,它算是设计模式如果是lz定义的设计模式,或者他不算是 ...
-- by hunter001201 -
xml和annotation的是是非 ...
Readonly 写道ahuaxuan 写道 Model一个field上挂了O/ ...
-- by imKenny -
如何解决mysql的master-s ...
Readonly 写道偶只用过单纯的ReplicationDriver,不过从源 ...
-- by ahuaxuan






评论排行榜