2008-04-21

预测型挖掘

关键字: 预测
5月份,我又有一个新的挖掘任务,就是根据历史销售记录来分析将来的销售情况。所以需要预先研究一下这个方面的挖掘,以下是我的学习笔记。 预测型知识挖掘: 顾名思义就是由历史数据和当前数据来推测出未来数据的一种挖掘方式。 从上面一句话中的历史,当前,未来三个关键字,我们可以看出时间概念在这次挖掘中将会起到非常重要的作用。 从预测的主要功能上来看,主要是对未来数据的分类和趋势的输出。 统计学中的回归方法等可以通过历史数据直接产生对未来数据的预测的连续值(这个应该就是我要的功能) 预测型知识的挖掘可以借助于经典的统计方法,神经网络和机器学习技术。 一般来说常见的预测应用模型由如下4种: ...
/** *作者:张荣华(ahuaxuan) *日期:2008-4-9 **/ 1背景 Spring2.5支持使用annotation来配置我们的service,比如如下代码: @Service("userService") public class UserServiceImpl extends BaseServiceSupport implements UserService { public void xxx() { } } 这样就表示这个service需要被spring管理,不过只是这样做是不够的,我们还需要在applicationcontext***.x ...
/** *作者:张荣华 *日期:2008-4-2 **/ 前言Xml和annotation都是我们在项目中常用到的技术,尤其是在配置文件这一块。很久很久以前,当jdk5.0还没有出来的时候,或者我们还没有大规模换到jdk5.0的时代,xml作为配置文件是大行其道,但是当annotation诞生之后,形式有所转变,曾经发挥巨大功能的xml开始被人们所批斗了,现下人们对annotation开始了疯狂的崇拜。那么就先说说xml的功与过,他的功我们都看在心里,就拿以前最常见的技术来说吧,struts+spring+hibernate,哪一个不用配置文件,使用配置文件谁不用xml,虽然h ...
2008-03-23

lighty的lb问题

关键字: lighty
看了galaxystar的帖子之后对lighty有了初步的了解,而且从google的trends上也可以看出lighty确实是一个web server中迅速崛起的新星,势头非常之强劲,所以趁这个周末我也来学习一把 1,下载安装,我使用的是ubuntu7.10,所以下载lighttpd非常简单,只要执行 sudo apt-get install lighttpd 命令就可以下载并安装lighttpd了,我下载的好像是1.4的版本。 安装结束之后,它就自动启动了,这时候在流览器里输入http://localhost就可以看到lighttpd的页面了。 2,下载tomcat6.10,拷贝一份出来 ...
/** *作者:张荣华 *日期:2008-3-9 **/ 先说一说问题,不知道大家有没有这样的经验,反正我是经常碰到。 举例1,某些网站每隔几天就发邮件给我,每次发的邮件内容都是一些我根本不感兴趣的东西,我不甚其扰,对其深恶痛绝。 举例2,添加具有某功能的一个msn机器人,每天都有几次突然蹦出一个窗口,推荐一堆我根本不想知道的内容,烦不烦啊, 我只好将你阻止掉。 每一个观众只想看他感兴趣的东西,而不是一下与之无关的事物,那么如何才能知道观众的兴趣所在呢,还是数据挖掘,经过一番思考,终于有点思路,即根据用户以往的浏览历史来预测用户将来的 ...
/** *作者:张荣华 *日期:2008-2-25 **/ 之前有一篇文章讲到如何使用jamon来监控请求以及方法得调用(原文地址见:http://www.javaeye.com/post/354575 ),本文属于其姊妹篇,使用jamon监控系统的sql调用及其调用效率。 需求: 1我们知道在使用hibernate得时候,我们可以打开show sql选项,可以直接查看sql语句调用的情况,那么当我们使用其他持久技术的时候我们也需要这个功能怎么办呢,没有关系,jamon能够帮我们做到。 2 很多时候,不同的程序员会写出不同的性能的sql,有时候可能会不小心或者因为不知道而写出性 ...
/** *作者:张荣华 *日期:2008-2-23 **/ 数据挖掘之分类系列文章 之前说到分类的基本概念以及一个文本分类的实例,原文地址见:http://www.javaeye.com/topic/163285 现在我们就来改造之前的分类算法,本文主要介绍KNN算法在文本分类器中的使用。 kNN算法简介: kNN(k Nearest Neighbors)算法又叫k最临近方法, 总体来说kNN算法是相对比较容易理解的算法之一,假设每一个类包含多个样本数据,而且每个数据都有一个唯一的类标记表示这些样本是属于哪一个分类, kNN就是计算每个样本数据到待分类数据的距离,取和待分 ...
2008-02-19

数据挖掘之分类

关键字: 分类及文本分类
/** *作者:张荣华 *日期:2008-2-19 **/ 随着当代计算机硬件的发展,硬件功能越来越强大,价格越来越低,企业可以记录的数据也越来越多,这些因素就为数据挖掘的普及做了比较好的前提准备,树挖掘是未来信息处理的重要技术,而且就目前而言已经取得了决定性成功而且得到了比较广泛的应用。 数据挖掘中有很多领域,分类就是其中之一,什么是分类, 分类就是把一些新得数据项映射到给定类别的中的某一个类别,比如说当我们发表一篇文章的时候,就可以自动的把这篇文章划分到某一个文章类别,一般的过程是根据样本数据利用一定的分类算法得到分类规则,新的数据过来就依据该规则进行类别的划分。 分类在数据挖 ...
正胶 也叫短颗粒胶皮,特点是弹性好、速度快、击球稳、不吃转,适合近台快攻,尤其是左推右攻型打法,是直板快攻型选手最常用的胶皮类型之一,过去庄则栋、李富荣、江嘉良、谢赛克等一大批世界冠军都采用正胶海绵直拍。当今世界冠军刘国梁也是采用这种类型胶皮。如果你觉得自己手腕动作灵活,而大臂和腰腹力量不够,那最好正面选择以速度制胜的正胶球拍。 目前国际市场上还有一种介于短颗粒与长颗粒之间的一种中颗粒胶皮,有不旋攻击的奇特效果,对手攻来的强烈抽球或下旋球,这种胶皮压根儿就不怕,回过去都是不旋球,而且飘忽,让对手使不上劲。它被人称作“魔性胶皮”。 ●反胶 ...
        程序员的生活真是单调,除了编程还是编程,工作日编程,周末还在编程。学如逆水行舟,不进则退。所以得找点事做做,保持好自己的编程状态。        上周末做了一个根据用户ip得到对应城市,再根据对应城市得到天气预报的小东西。这个周末再次找到一个主题,原来听说有人用ruby做了一个能同时和msn,qq等工具通信的小东西。于是我也想到可以用java实现这个功能,于是经过两天的努力,终于把java和msn通信的功能做好了(java和qq通信很早之前就有 ...
ahuaxuan
搜索本博客
我的相册
C21ef232-7784-3985-9b9b-f1aa3bf48f96-thumb
100_2076
共 16 张
存档
最新评论