发博文
资料共享

SkyDrive

windows提供的网盘,无需审核,总共25G,单个文件不超过50M,主要放word文档

ishare

单个文件最大50M,需要审核,主要放一些愿意公开的资料

欢迎来访

这个博客只是记录我在平时碰到的一些问题及适合自己的解决方法,参考了网上的内容我都尽量注明出处。

如果不嫌弃我的水平太低而转载的话,请注明出处。

新浪微博
个人资料
bluemonster
bluemonster
  • 博客等级:
  • 博客积分:967
  • 博客访问:32,827
  • 关注人气:9
搜博主文章
好友
加载中…
访客
加载中…
评论
加载中…
留言
加载中…
博文
翻《unix环境高级编程》时看到的一个trick
如果在一个进程A中启动了一个子进程B,但是B的执行时间可能很长,也可能很短。因此,既不希望A调用wait或者waitpid来等待B的完成(如果B执行时间太长,A的时间就耗费在等待B的完成了,虽然waitpid有WNOHANG选项,但免不了多次调用waitpid来看B是否完成);也不希望如果B执行时间太短了,然后A又不用wait或waitpid去获取B的退出状态,那么B就一直处于僵死状态直到A终止(这样造成了资源的浪费)。
此时,可以使用一个小trick。就是调用两次fork,让B的父进程变成init进程(pid=1的那个进程,所有孤儿进程的父进程)。这样,A进程可以想干嘛干嘛去,B进程也可以想执行多久就执行多久了。
#include <unistd.h>
#include <sys/wait.h>
int main()
{
pid_t pid;
if((pid=fork())<0)
{
printf('fork 1 error\n');
exit(-1);
}
else if(pid==0)//第一个子进程
{
if((pid=fork())<0)
{
printf('fork 2 error\n');
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

文本分类

vsm

语料

分类: 实验室
这几天看了一些文本分类的前辈博客和开源代码,对文本分类有了一点点粗浅的认识,记录下来给自己做备忘。
1.要分类,首先要有一个分好类的训练语料库来得到我们分类的参照。
训练语料库可以自己从网上爬取,这个不是很难。网上也有很多前辈老师们公开了他们的爬取成果。
liuyu前辈提供了一份mssqlserver存储的训练语料库。特点是数据量大,但是分类较少,只有6类。
谭松波老师的语料库,有文本格式的,也有矩阵格式的。分12大类60小类,双层分类这一点很有特色,不过数据量比liuyu的少挺多。
还有搜狗实验室提供的语料,分类也不够多
我自己也用sc
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
(2012-03-04 14:49)
标签:

网络安装

centos

pxe

分类: 实验室
    一台服务器老是宕机,准备将其重装。把各种安装光盘插进去都读不出来,只有一张ubuntu10.04的可以读出来,遂安装之。原因?该服务器配的是CD光驱,读不出DVD光盘。而且接口和普通PC的不一样(SATA还是啥的,搞不清楚),想拆个PC的光驱来用都不行。
    装好ubuntu后,结果发现有些项目要用的软件装不上去,那些软件都是在centos5.5下安装、修改和部署的。只好想办法重装成centos5.5了。光驱不行,那就网络安装吧。再一次在无所不知的乔哥指导下学了一招。
    网络安装的原理就是使用PXE代替启动光盘来启动系统,并从远程主机上下载安装镜像进行系统安装。
    首先选定211.69.***.222服务器作为远程主机。在其上安装DHCP tftp和ftp
    1、yum install dhcp
       cp /usr/share/doc/dhcp-3.0.5/dhcpd.conf.sample /etc/dhcpd.conf
      vi /etc/dhcpd.conf 
     根据自己情况修改,主要就是subnet设置网段   next_server设置镜像文件所在的主机
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

it

分类: 实验室
来自 http://hi.baidu.com/_kouu/blog/item/e225f67b337841f42f73b341.html 
==================================================================================================

知道异步IO已经很久了,但是直到最近,才真正用它来解决一下实际问题(在一个CPU密集

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

转载

分类: 生活

      林书豪爆红,在美国引发造词热。球迷和网民们拿Lin

阅读  ┆ 评论  ┆ 转载原文 ┆ 收藏 
(2012-02-13 22:15)
标签:

tf-idf

分词

语料

分类: 实验室
参考 http://zh.wikipedia.org/wiki/TF-IDF
开源分词软件http://www.ftphp.com/scws/  试用了,感觉准确度比ucenterhome那个强多了。
scws依赖的字典使用的就是TF-IDF技术来衡量中文词的重要性

tf就是词频,词i在文件j的词频就是词i出现的次数占文件j总词数的百分比   参考公式为
 \mathrm{tf_{i,j}} = \frac{n_{i,j}}{\sum_k n_{k,j}}
idf就是逆向文件频率,语料库中出现词i的文件数越多,说明词i
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
很多博客系统都有标签自动匹配功能, 感觉挺神奇的。 开源的UCenterHome里面的发日志也有一个标签自动获取功能,看了下代码。


与日志有关的操作是source/cp_blog.php ,如果是编辑或者是发布日志,则会调用source/function_blog.php。删除日志、“踩一脚”等操作则就在cp_blog.php里完成。

cp_blog.php里用了模板include_once template('cp_blog');对应的是/template/default/cp_blog.htm
在这里可以看到(ucenterhome的模板可以看看我的博文http://blog.sina.com.cn/s/blog_65db99840100s4yb.html 
<input type='button' name='clickbutton[]' value='自动
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
(2012-02-10 14:40)
标签:

五月天

评论

娱乐

分类: 生活
看到了2篇五月天的乐评。一篇比较中肯,一篇很扯淡。
很扯淡的一篇
“作为台湾最受欢迎的流行乐队,五月天能够打入内地乃至有资格称作“华语天团”的,其实就是两首歌曲。一首是《恋爱ing》,一首是《私奔到月球》。”
这个乐评人显然没有认真地听过五月天的歌。没听过温柔、天使、知足,没听过志明与春娇、憨人、出头天。不负责任地批评,不是一个认真的乐评人该做的。
比较中肯的一篇
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

it

分类: 实验室

来自http://www.ibm.com/developerworks/cn/linux/l-linux-networking-stack/

=================================================================================================

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

lbs

定位方法

分类: 实验室
来自 http://blog.csdn.net/pursuer_zhao/article/details/3889771
还可以看同一作者的 http://blog.csdn.net/pursuer_zhao/article/details/3933494 ,介绍了symbian中LBS的架构。
================================================================================================

在学习Symbian/S60的位置服务模块之前,先来了解学习一下定位知识。关于定位有多种技术实现方法,不同定位方法采用不同的定位方式,当然定位的精度也不尽相同。

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 不良信息反馈 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有