加载中…
个人资料
Yode
Yode
  • 博客等级:
  • 博客积分:0
  • 博客访问:595,391
  • 关注人气:250
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
谁看过这篇博文
加载中…
正文 字体大小:

query选取

(2007-11-20 12:22:46)
标签:

query选取

分类: 半监督图排序
    确定qery的选取是5%的比例,其实这个比例比较小了,因为数据集本身虽然不大,由于矩阵是方阵的形式比较大,所以query不宜选取太多,处理起来相对比较容易些.暂时决定还是在剔除重复的和无引用关系,无摘要的文档后的所有文档作为整个训练集.这样的话好像比较公平一些.另外选取query是按照每个子类的5%去选取.这个比例的来源是看paper里面,pairwise的对应关系,一个query大约对应多少篇文档来取的.我们这里每个query都对应3000篇左右的文档,所以说取的时候10%比较合适.不过我们还是取5%了.先取着看看了,query的数目这样下来也不算少了.

0

阅读 评论 收藏 转载 喜欢 打印举报/Report
后一篇:旅程
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

    后一篇 >旅程
      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有