看得见的元数据(2009-11-08 20:38)
看得见的元数据
一般人认识新东东,都是从现象开始再到抽象的概念的。讨论元数据的人不多,窃以为跟它不符合这个认识规律有关。可以去这里看看一般是怎样介绍元数据的。
这个贴里的字都认得,描述也很全面很专业,但偶要承认,象偶这样的菜鸟,看完这些还是不明白元数据是什么。因为,按照语言学“用法即意义”的原理,在没有对元数据的应用思路,从哪里来,到哪里去,表现成什么样子,表现成这个样子有什么用知道个大概之前,对元数据是说不上理解的。还有一种直截了当的解释:元数据就是关于数据的数据!这个似乎是国家标准术语,但听着就更迷糊了:数据的数据有什么用啊?为什么要搞数据的数据啊?为了互操作?那互操作为什么一定要数据的数据呢?这些问题可以一直问下去,问到最后,估计能回答清楚不是很多。与其问得这么辛苦,不如看看元数据在实际应用中大概表现成什么样?如何运用来了解还来的实在些。
看一个DC的XML文档,引自
元数据应用瞎猜(2009-11-06 15:20)
元数据应用瞎猜
上篇的开头说到的应用,提到可以用ajax实现,还加了个前提,说是开发者可以上帝的身份解读上下文,作为生成URI动态请求的背景。后来想想这只是实现页面上下文解读的方式之一。是对还有一种更容易操作的,是用浏览器插件的方式来实现。
要实现自动化的URI动态生成,总的来说需要页面元素的触发。这个插件可以对XML页面进行分析,当遇到某些元标识时就触发远程元数据的存取行为。具体来说,假定插件就是通过判断XML页面的编码标准触发的,而这个XML页面按照DC的某个子集编码,并且在元标识区域声明了编码的标准。由于元数据标准的语义是相当完整的,针对这个元数据标准来判断XML页面中的编码语义,并不是什么困难的事情(这样的插件的算法应该也不是很困难)。如此,根据上下文的判断,在客户端生成URI动态请求的问题,也就解决了。在这种情况下,Linked
Data的内容很多就可以自动完成了。
如果真要成了这样,插件就成为整个应用的主体。因为它是向各个不同的服务端存取元数据,而不是特定的一个,也就是不象现在访问一个网站主要是存取这个网站的东西。
听K一席话,胜读X年书(2009-11-05 11:39)
听K一席话,胜读X年书
对元数据、语义网一直是半懂不懂,要说对各个单列的概念,也算有点一知半解,但整体来说,这些东东能干啥?相互之间在实际应用中怎么关联起来?那是一点概念都没有。今天跟K兄吃了这顿饭,总算开窍了。
不妨从一个应用来开始。这个应用是包含Ajax的客户端应用,开发者自然清楚客户端的页面有什么元素,因此也就能用Ajax构造出上下文敏感的动态URI资源请求,并能将这个请求生成的结果嵌入到客户页面中。
好了,接下来的就是服务端的事了。关键是服务端可以接受什么类型的动态请求,或者说是这个请求指向的数据,是如何由保存于服务端的数据运算出来的。在URI和获取的结果之间,可以有数据表示的概念模型,这个概念模型既决定了URI请求翻译出来的语义,也决定服务端最终能提供多复杂的结果。这个模型可以表达成元数据标准。某个应用的元数据,实际上可以看成所存储数据的概念模型。有了这个概念模型,自然就可以通过预定义的、基于这些概念的公理运算,获得一些更复杂的结果。元数据的特性表现为“属性—值”对。公理的运算是在属性层面上的。对照
两篇核心刊首文(2009-08-27 10:49)
收假了。假期一事无成。前半段在延续上学期的沉重压力,一文未就。后半段释放压力,不是玩游戏读书,就是论坛里和人翻书吵架。
学校的收发室不知搞什么,信件都到送馆里。一放假邮政通讯基本成了与世隔绝。开学第一天搞完卫生,收到两本核心期刊,想来上面有发的稿吧。打开一看被雷翻:刊首文都是偶的。
都说做人要低调低调再低调,高调偶处理不来,很不习惯,这么高调实非故意。毕竟今年的主题是项目,偶自以为做得也还可以。可惜,现在核心期刊对于严严肃肃的社会实证似乎不太感冒,还是喜欢宏大叙事、新鲜但不持久的可能性。这两文都是想到就写,虽然考虑又有很久了,资料也大多已经收集好,但还是有点急就,发成这样只能算是无心插柳。
在理论研究上,是有很多有意思的题目可以写,跑去搞实证。一是河边当年的劝导,二是扩展研究方法,三是开阔思路。这三条基本都做到了。这个项目也算没白忙。忙完这个,继续理论去。
七夕的七条启示(2009-08-27 10:49)
昨天七夕,跟MM说笑七夕对现代人的启示:
1、要想追到织女,说不得用点软暴力。
2、自由恋爱,也是被逼的。
3、自主恋爱,自主生孩。
4、先生孩子,再见岳母。
5、先生孩子再领证,管他同意不同意。
6、要生两个好,不然不好挑。
7、有儿女后,男人主内带小孩,女人飞天搞外交。
用数据形式否定研究思路(2009-07-19 23:00)
上次银兄提出,如果有困惑类型和调适方式权重数据的话,可以按年级分层做困惑的研究和调适能力的研究。这没问题,回头写了个php脚本,把从原始数据中提取就行了。末了把文章的前半部写出来,发了个他,没想到他说有问题要见面才能说清楚。于是有了这次长谈。
说来说去,发现原来我们的思路是不同的。他的意思是先做年级的模型,然后再对比系数,就可以得出趋势,而我从来都没有做年级模型的想法,直接就是用数据做回归方程了。对于年级-困惑类型的回归方程,我认为是不可能的,因为困惑类型是定类变量,分值只有标识意义,而无顺序意义。而回归方程要求变量必须至少是定序变量才行。再到年级-调适方式的回归方程,他提出按年级单独做多元回归的想法,我总觉得有问题。因为对于某一年级来说,年级值是一个常数。更大的问题是,如果单独做某年级的回归,即使把年级值分成单列,如何处理非该年级的行值?不管如何处理,这些值是必然会影响到运算结果。如果真要做分年级的回归,不受干扰的唯一办法是每个年级单独存成文件来做。但我认为这两种做法对数据的要求,都违反了调查本身形成的数据形式。调查形成
难道20年一轮回就能杀死所有正义?(2009-07-07 20:46)
网上流行玩填图游戏,偶也来玩玩。
不期而遇杀sysanti.exe(2009-06-12 08:32)
这么多年来了,真正被病毒搞事的只有两次。为了防范不期而遇的病毒,偶用的PC一般都是两重保护,还原软件+杀毒软件。那次CIH刚出,穿透了冰点的保护,一开机就关机,只好重新格式化。另一次是CIH的变种sysinit,就着网上的步骤,一步一步解决了。
上周五下班后,解开硬盘保护,一边装软件,顺便升级病毒库,一边做饭去了。小家伙一回家,直奔本本,打开游戏……等发现时已经中招了。sysanti.exe,是项目成员给我拷文件时带来的,最明显的迹象是在根目录下多了两个文件:sysanit.exe和autorun.inf。当时没在意,反正只要穿不透保护,就当是空气,没防范意识很久了。
上网想查查,发现一输入sysanti.exe就自动关闭IE,其他软件也一样。iecSword还有好几个常用工具都被屏蔽了。只好用台式机查。才知道这个东东是5月下旬才出现的,偶可真赶上时髦了。查来查去,都说除了重装没有办法杀干净。但获知了一般的装入过程和在windows\fonts目录有关键的随机命名.fon文件,删掉那些文件,就是死马了。但删掉后时,总是删了又生成,说明内存有病毒,用tas