加载中…
个人资料
Yode
Yode
  • 博客等级:
  • 博客积分:0
  • 博客访问:621,045
  • 关注人气:250
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
博文
(2008-08-22 12:23)
标签:

奇异矩阵

svd

奇异值分解

it

分类: 数学之美

定理:(奇异值分解)设A

标签:

引用

it

分类: 数据结构&&c
明天继续总结,太乱了嘿嘿,。。。
C++
引用与指针的比较

引用是C++中的概念,初学者容易把引用和指针混淆一起。

一下程序中,nm的一个引用(reference),

(2007-11-09 20:46)
标签:

cora数据集

分类: 半监督图排序
    真是找的很辛苦,唉!记下来吧.感谢论文Object Identication with
Attribute-Mediated Dependences提供了cora dataset 的来源:
http://www.cs.umass.edu/~mccallum/data/(如果复制打不开,请自己手动敲到地址栏中)
   论文A Pitfall and Solution in Multi-Class Feature Selection for Text Classification提供了启发,cora是有6大类,36个小类的.这样一来终于解决了相关性的难题.
 (a)cora-refs.tar.gz数据集
Cora Citation Matching [reference matching, object correspondence]
Text of citations hand-clustered into groups referring to the same paper.
(b) cora-ie.tar.gz数据集
Cora Information Extraction [inform
标签:

IT/科技

svmlight

herosvm

libsvm

mysvm

spider

svmstruct

weka

jsvm

SVMlight 
 http://svmlight.joachims.org/ 
SVMlight, by Joachims, is one of the most widely used SVM classification and regression package. It has a fast optimization algorithm, can be applied to very large datasets, and has a very efficient implementation of the leave-one-out cross-validation. Distributed as C++ source and binaries for Linux, Windows, Cygwin, and Solaris. Kernels: polynomial, radial basis function, and neural (tanh).


 SVMstruct 
 http://svmlight.joachims.org/svm_struct.html 
SVMstruct, by Joachims, is an SVM implementation that can model complex (multivariate) output data y, such as trees, sequences, or sets. These complex output SVM models can be applied to natural language parsing, sequence alignment in protein homology detection, and Markov models for part-of-speech tagging. Several implementation

(2007-07-26 18:52)

Deadline810

实验要求

1)数据预处理:利用

(2007-05-14 15:02)
     按照对未标注数据的选择策略,可以把当前的主动学习算法大致分为两类
    (1)基于评委的方法 (committee-based methods)
首先用各种不同的学习器对样本进行标注,然后由标注人员对有争议的标注结
果作出最终判断。不同的学习器之间的分歧是由它们对样本标注结果预测的差异所
造成的。
   (2)基于置信度的方法 (certainty-based methods)
先由模型给出具有较低置信度的样本,再交给标注人员选择性地进行标注。置
信度的计算通常是由学习器度量 n-最优(n-best)标注结果之间的差异得到的。
下面详细描绘一下基于评委的方法和基于置信度的方法的普遍流程。
    基于评委的方法:
    (1) 对于由 n 个未标注样本构成的样本组 B 中的每个样本 e,使用从先前标注样本中训练出来的 k 个模型对其进行标注,得到 k 个结果{L1,L2...Lk},通过{L1,L2...Lk},对每个 e 测量出具有争议的标注结果De ;
   (2) 从样本组 B 中选择出 m 个具有最高 De 值的样本交给标注人员进行标注。把人工标注好的样本加进训练样本库里;
&nbs
(2007-05-09 21:12)
    讨厌死matlab了,呵呵其实是不经常用导致简单的语法结构都忘了每次都要查来查去的。我今天差点就想改下我以前c++的那个算了,后来想这样可不好,不能因为惧怕而放弃。有什么嘛,就是多费点时间而已啊。还好今天写了不到3个小时搞定了。晚上的时候还有个朋友让过去帮看个神经网络的程序,头大呵呵,早就忘光光了,不过还是硬着头皮过去了,凭着仅有的一丁点的记忆,加上比较嘿嘿瞎猫碰到死老鼠竟然蒙过去了,不过为了负责起见自己回来又找了点内容看看。咦,模式识别还有作业看都没看呢,我干什么去了呢?管它呢,最后一天再看嘻嘻!真是欠扁。嗯,不废话了贴code吧。(前提是有hw3.mat数据集哦)

%调入数据文件

load hw3;

%查看数据

whos

   一般写算法都是自己瞎弄一些数据测试,虽然讨论班上师兄师姐们经常说一些常用的数据集,就是没当回事。今天看了看唉,真是太好了,可惜俺知道的太晚了hoho
常用的基本上UCI和w3c的。关于源代码,网上有很多公开源码的算法包,例如最为著名的Weka,MLC++等。Weka还在不断的更新其算法,下载地址:
http://www.cs.waikato.ac.nz/ml/weka/

UCI收集的机器学习数据集
ftp://pami.sjtu.edu.cn

http://www.ics.uci.edu/~mlearn/\MLRepository.htm


statlib
http://liama.ia.ac.cn/SCILAB/scilabindexgb.htm

  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有