期末课程项目说明

 

数据描述

 

数据集(请点击下载)包括分为两个文件:train. data为训练数据集,test.data为测试数据集。每个文件表示一个 N×(d+1) 的矩阵,其中 N是该集合的样本数目,d =10是特征向量的维数,而矩阵最后一列是样本的类别(1 -1,即这是一个两类问题)。训练数据集有8285个样本(即矩阵有8285行,11列),用于训练分类器;测试数据集有2072个样本。(*.data文件可直接在matlab中读入,或用文本编辑器打开查看。)

 

 

项目要求:

 

1.      请用训练数据集训练并建立至少两种不同的分类器,然后用测试数据集对分类器进行测试和比较。注意:须包含至少两大类模式识别方法(如:Bayes分类器、线性判别函数、支持向量机、k-近邻法、神经网络等)。

2.      提交一份完整的电子版报告长度不可短于五页A4纸(五号字)。

3.      报告要求:

a)      报告结构完整;

b)     需介绍试验中所使用的分类器训练方法:如使用已有的软件包,请简要介绍;若自己编程实现,请在交报告时附上可编译源代码以及可执行程序。(* 自己编程、或实现所阅读文献的算法,都将获得加分。

c)      需叙述实验的具体步骤,包括所调整的参数、调整参数的具体步骤,以及使用的评判标准。

d)     需整理、比较、评价不同分类器的试验结果(采用图表形式)。

4.      提交报告的截止时间:2011111(星期二)23:59

5.      提交报告的邮件地址:raygan@pku.edu.cn