翻《unix环境高级编程》时看到的一个trick
如果在一个进程A中启动了一个子进程B,但是B的执行时间可能很长,也可能很短。因此,既不希望A调用wait或者waitpid来等待B的完成(如果B执行时间太长,A的时间就耗费在等待B的完成了,虽然waitpid有WNOHANG选项,但免不了多次调用waitpid来看B是否完成);也不希望如果B执行时间太短了,然后A又不用wait或waitpid去获取B的退出状态,那么B就一直处于僵死状态直到A终止(这样造成了资源的浪费)。
此时,可以使用一个小trick。就是调用两次fork,让B的父进程变成init进程(pid=1的那个进程,所有孤儿进程的父进程)。这样,A进程可以想干嘛干嘛去,B进程也可以想执行多久就执行多久了。
#include <unistd.h>
#include <sys/wait.h>
int main()
{
pid_t pid;
if((pid=fork())<0)
{
printf('fork 1 error\n');
exit(-1);
}
else if(pid==0)//第一个子进程
{
if((pid=fork())<0)
{
printf('fork 2 error\n');
这几天看了一些文本分类的前辈博客和开源代码,对文本分类有了一点点粗浅的认识,记录下来给自己做备忘。
1.要分类,首先要有一个分好类的训练语料库来得到我们分类的参照。
训练语料库可以自己从网上爬取,这个不是很难。网上也有很多前辈老师们公开了他们的爬取成果。
liuyu前辈提供了一份mssqlserver存储的训练语料库。特点是数据量大,但是分类较少,只有6类。
谭松波老师的语料库,有文本格式的,也有矩阵格式的。分12大类60小类,双层分类这一点很有特色,不过数据量比liuyu的少挺多。
还有搜狗实验室提供的语料,分类也不够多
我自己也用sc
参考
http://zh.wikipedia.org/wiki/TF-IDF
scws依赖的字典使用的就是TF-IDF技术来衡量中文词的重要性
tf就是词频,词i在文件j的词频就是词i出现的次数占文件j总词数的百分比 参考公式为
idf就是逆向文件频率,语料库中出现词i的文件数越多,说明词i
很多博客系统都有标签自动匹配功能,
感觉挺神奇的。 开源的UCenterHome里面的发日志也有一个标签自动获取功能,看了下代码。
与日志有关的操作是source/cp_blog.php
,如果是编辑或者是发布日志,则会调用source/function_blog.php。删除日志、“踩一脚”等操作则就在cp_blog.php里完成。
cp_blog.php里用了模板include_once
template('cp_blog');对应的是/template/default/cp_blog.htm
<input type='button' name='clickbutton[]' value='自动
看到了2篇五月天的乐评。一篇比较中肯,一篇很扯淡。
很扯淡的一篇
“作为台湾最受欢迎的流行乐队,五月天能够打入内地乃至有资格称作“华语天团”的,其实就是两首歌曲。一首是《恋爱ing》,一首是《私奔到月球》。”
这个乐评人显然没有认真地听过五月天的歌。没听过温柔、天使、知足,没听过志明与春娇、憨人、出头天。不负责任地批评,不是一个认真的乐评人该做的。
比较中肯的一篇
来自http://www.ibm.com/developerworks/cn/linux/l-linux-networking-stack/
=================================================================================================
来自
http://blog.csdn.net/pursuer_zhao/article/details/3889771
================================================================================================
在学习Symbian/S60的位置服务模块之前,先来了解学习一下定位知识。关于定位有多种技术实现方法,不同定位方法采用不同的定位方式,当然定位的精度也不尽相同。