点亮“暗数据”

2016-10-25 09:21:30来源:四川日报编辑:邓强梁现瑞

记者眼

□本报记者 梁现瑞

“震惊!”说起亲身经历的一件事,李鲲至今都感到无比惊讶。

几周前,李鲲感觉到自己的电脑存储空间越来越少,运行速度越来越慢。清理结果把他吓了一跳,很多文件都是重复的,最极端的一个是,一张照片居然有11个副本。

10月19日下午,一场名为“云上世界 大数为安”的音视频应用及大数据保护解决方案研讨会在成都市索菲特大酒店举行,华睿泰科技公司经理李鲲的演讲题目是“点亮暗数据”。

什么是暗数据?上面说的那11个照片副本就是。在李鲲看来,所谓的“暗数据”就是指企业或个人生产、收集以及存储在各种系统中,但并未发现、使用、分析甚至访问的数据。比较类似的是暗物质,“霸占”了宇宙95%的地盘,却看不见摸不到。

“从某种程度上说,暗数据是大数据时代的一个隐痛。”李鲲说,当今时代,伴随着互联网的兴起,人类制造的数据呈现爆炸式增长,但绝大部分数据从生产出来以后,并没有发挥自身应有的价值,反而白白浪费我们的存储空间,挤占宝贵的系统空间。

调查显示,一个信息系统产生的80%的文档都未被二次使用。很多数据只被使用过一次就被储存在逻辑混乱、数量庞大的其他社群之中。这种现象带来的直接后果是,尽管我们生产出来的数据越来越多,但影响力却在逐步下降。

如何改变这种状况?李鲲提出“三步法”的解决方案。第一步是发现,通过现有的技术手段,“勘测”确定暗数据的空间分布、规模大小、种类式样等等;第二步是归档,将暗数据按照不同的种类进行分门别类的系统整理;第三步是应用,在暗数据和现有的工作之间建立必要的联系,让闲置数据发挥出自身的价值,从而达到点亮暗数据的目标。

点亮“暗数据”,不只是某个企业的需要,也是每个人自身的需要。有一种说法,人类只要利用大脑的10%,就可以实现长生不老。即便无数神经学家将其斥为无稽之谈,多年以后,我们还是不会放弃这种念头,因为我们知道自身还有很多潜力没有发挥,只是有待发掘。

点亮“暗数据”,对传统媒体的转型尤其具有启示价值。数量巨大的自媒体,包括传统媒体本身,每天生产出天量的信息,但其中的绝大多数都被淹没在互联网的“长尾”中,成为“数据孤岛”,无法有效利用。如果通过有效的技术手段,对它们进行发现、发掘和整理,从纵向和横向两个方面进行整合,完全可以生产出高质量的媒体产品,实现创新发展。

“照亮暗数据的过程,也可以倒逼我们的生产转型。”李鲲说,大数据的生产过程,应尽可能避免大而无用的结局,相反,大并非我们追求的唯一目标,重要的是效率和质量。

    编辑推荐