新闻 娱乐 文化教育 论坛 军事 科技 读书 社会新闻 人物 摄影 问卷调查 政策法规 机构职能 小说 诗歌 图片新闻
当前位置: 主页 > 摄影 >
让“数据”成为福尔摩斯手中的“放大镜”
时间:2017-09-28 字体:[ ] 来源:网络整理 视力保护色:

  数据一词伴随计算机技术诞生而出现,最早是用二进制信息单元0,1的形式表示数字、文字、图形等信息。后来发展成为信息的表现形式和载体,还可以是语音、图像、视频等。大数据时代,数据和信息是不可分离的,数据是信息的表达,信息是数据的内涵。数据本身没有意义,数据只有对实体行为产生影响时才成为信息。数据(Date)和信息(Information)几乎可以混用,我们一般习惯在技术层面叫“数据”,在业务层面叫“信息”,好像数据是“死的”,信息是“活的”一样。其实两者是一个整体的关系。

  时效性。同样的数据在不同时期、不同背景和不同条件下,其个体的意义和据此得出的结论会千差万别。有的数据因为年代久远甚至会失去其价值变成无用信息,因此及时获取和使用数据才能体现其价值。比如某个年度内若干个月的生产数据,在当年可以据其研究走势、判断结果、寻找各种数据关联推断出财务、物资、销售等一系列结果。但是若干年后就只能作为历史数据参考,其时效意义大不一样。

  分散性。我们工作生活中的绝大部分数据几乎是以单独、分散的形式存在的。如果没有人为的、机械的把它们集成在一起,以表格、图形、矩阵等形式展现,就不能说明太多的问题,就不能完全体现数据的价值,那么它们就是一个数字而已。因此,数据要相互关联才能完整。另外,数据关联不是简单的堆积和堆砌,工作者要有敏感的数字意识,要用科学的统计方法,经过长期的枯燥锻炼才能一窥窍门。

  概率性。这个特性容易让工作产生一些错误,日常说的“以偏概全”就是这个特性。由于研究某个问题所需的数据量不够,只能凭样本量研究样本的概率能否代替总体,从而推断出结论,得出的结论往往有较大偏离。实际工作中,我们如果必须通过少量的样本推算结论的话,就要对样本进行科学选择和模型设计,对推算结果要留有余量,以保证结果在合理可控范围。

  多面性。同样的数据在不同的分析场合需要从不同的角度去构建新的结构,在不同的分析目的下要相应转化尺度,否则就会“事倍功半”,甚至“南辕北辙”,这也就是所谓的“横看成岭侧成峰”吧。比如说产量数据,我们可以结合其他因素,将其转化为销量、收入、税利等不同的数据,开展不同的分析。数据的多面性可以这么艺术的表述“给我一片叶子,我将告诉你四季的故事”。

  逻辑性。数据从个体上看是分散单独存在的,但是一旦被组合运用,那么在组合中就具有多面的逻辑性,其不但有简单的算术运算功能,还有逻辑运算的意义。数据的逻辑性最终会以层次数学、网状数学、关系数学等模型方式展现。我们日常工作中的表格、图形等都是数据逻辑性的直观展示。具有丰富经验的工作者,能直接从这些展现中判断数据逻辑性是否正确,哪些数据的逻辑出现了问题,甚至可以从一个错误的数据发现整个表格、图形中其他的错误。

  再创性。把若干有关系、或者没关系的数据进行不同的组合分析,从而转化为有价值的信息,这才是数据使用的最终目的和真正意义。现代流行的大数据其实就是通过一个个数据,进行不同的处理、分层、组合,最终生成不同的信息以供参考,这就是数据再创性的体现。再创性可以让我们透过现象看本质,挖掘现象背后的机会。打个比喻:数据的再创性就像福尔摩斯根据一片树叶、一块泥土、一个脚印就可以推断出一个完整的案件一样具有实用意义。

  数字是枯燥的,但是组合运算以后可以画出美妙的图形。工作中,我们应该把数字看成我们的朋友,准确抓住其特性,一起参与进来“游戏”,才能发现和感受其中无穷的乐趣。也只有这样,才能促进工作高水平、高质量的开展。

{dede:arclist