标签:
信息集成数据 |
上午,DAMA的胡本立先生打电话给我,让我谈谈对数据的认识。我用中午休息时间,简单地罗列了几个观点。供大家批评。
1、对数据的认识
然而,描述数据产生背景可能比描述数据本身复杂得多。而且,如果背景描述不完整,常常会带来错误的、不确定的、具有二义性的认识。这大概是数据应用背后真正的困难。
或许有人认为:大数据时代不需要背景,谷歌用搜索“感冒”的频度预报流感就没有用背景。事实上,“谷歌搜索”和搜索人的地址就是背景。笔者也认为:数据量大到一定程度,可以弱化对背景的要求。但弱化背景会带来数据可靠性的降低、影响进一步的使用效果。我个人认为:基于缺乏背景的、非结构化数据的分析,或许可以带来偶然的惊喜;但不宜过分迷信这种小概率
标签:
工业4.0数字化基础CPS |
CPS(信息物理系统)是工业4.0中的核心概念。为了理解它,我先后看了些文章和书籍,并请教了多位专家,但似乎总有点似懂非懂。前几天开会期间,突然感到明白了。
CPS的说法一般是这样的。它包含两个部分:1、现实
标签:
大数据数据科学因果性相关性哲学 |
引言:前些天,网上热炒“剪刀、石头、布”的研究。研究者发现:赢家出招时,与上次相同的概率大于另外两种。于是,有人给出了游戏的‘制胜策略’.....本文不谈这件事的是是非非,而是就此事谈谈对与大数据的一点认识。
谈到‘概率’,会涉及到两类事物的集合:全集以及其若干子集。这类事物发生时,出现在特定子集的比例是大体稳定的。只有频度是稳定的,才能称其为概率。
标签:
校园 |