KDD99数据集
(2010-01-30 16:53:33)
标签:
it |
分类: 计算机学习 |
KDD99数据集:
数据格式分析:
1) Basic features of individual connections. 网络连接总体信息相关的特征。eg: protocol,duration ,
2) Traffic features of individual connections. 网络连接流量相关的统计信息,如在同一时间间隔内相同服务请求数,同一时间间隔内来自同一时间主机连接数等。
3) Content features of individual connections. 网络连接数据内容信息相关的特征,如超级用户权限尝试数root access attempts 等。
KDD数据预处理方法:
(1) protocol type: 1-icmp; 2-tcp; 3-udp; 4-others.
(2) service: domain-u 1; ecr_i
2; eco-i
3; finger
4; ftp-data
5;
(2) service: domain-u 1;
ftp 6; http
7; hostnames 8;
imap4 9;
login 10; mtp
11;
netstat
12; other
13; private
14; smtp
15; systat
16; telnet 17;
time 18; uucp 19;
其他服务 20;
(3) flag: 1-REJ; 2-RSTO; 3-RSTR; 4-S0; 5-S3; 6-SF; 7-SH; 8-OTHERS;
(4)其他数据归一化处理:x∈[xmin,xmax], t=(x-xmin)/(xmax-xmin) ∈[0,1].
(3) flag: 1-REJ; 2-RSTO; 3-RSTR; 4-S0; 5-S3; 6-SF; 7-SH; 8-OTHERS;
(4)其他数据归一化处理:x∈[xmin,xmax], t=(x-xmin)/(xmax-xmin) ∈[0,1].
打开方法:
最好使用EDITPLUS打开,不会出现乱码也不会太卡
参考文献(其中包含每个参数的解释):
前一篇:IEEE读法