《新数字秩序的革命》读书笔记
戴维·温伯格将世界的秩序分为三个层次。第一层次是事物本身,第二层次是关于信息的信息,也就是元信息,第三个层次是被彻底数字化的信息和元信息。位于美国纽约曼哈顿的贝特曼图片资料馆的变迁,非常清晰地印证了温伯格关于秩序的三个层次的说法。这家珍藏有大量美国历史图片的资料馆,在被比尔·盖茨买下后,用 19辆卡车从曼哈顿将上千万张历史图片搬迁到了宾夕法尼亚的一个山洞里,洞内的温度常年保持在零下4℃,以确保图片可以保存尽可能长的时间。这是第一层次的问题,历史照片的保存受制于物理世界种种条件的限制。虽然这里有不错的目录分类体系,但是你如果要寻找“南北战争期间士兵户外就餐”的照片,恐怕需要好几年的时间。这是第二层次的问题,元信息依然受制于媒介的限制,不能迅速地查找和获得。比尔·盖茨创办的Corbis网站是贝特曼图片资料馆的母公司,这里有400万张图片,却只有9个专职分类员来管理,因为你可以给数字化图片添加很多标签,也就可以在不同的通道中找到它。与贝特曼资料馆的元信息相比,Corbis的第三层的被彻底数字化的信息可以非常快捷地被人们搜索和得到。
随着信息技术的发展,信息更新传播的速度越来越快,用户看待、认识世界的方式因为三阶秩序的操作而发生改变。以往的二阶刊物中,图书信息的发布需要权威专家的谨慎筛选,权威专家在信息的展示上拥有比信息创造者更高的优先级。三阶秩序当中,每一个人--消费者、雇员等不同职业不同学历的人都能够直接接触到信息、对信息进行个性化的组织、然后上传。每一个人不仅式信息的使用者,也是信息的创造者。传统权威不再能够坚持要求大众寻求他们的意见,地位权重开始极大的下降。三阶秩序极大的改变了我们对“世界如何整理”的看法,也改变了我们对权威的看法。以往,用户都是信息的被动接受者,所借助的都是 权威专家为哦我们撰写、过滤的信息。现在我们需要直接面对混乱无序的“树叶”,需要越来越多 的元数据来帮助我们判断信息的真实性,以及如何建立信息的关联性。真正的权威中包含普通大众。
人类的意识是由用户集中注意力的同时隐式的了解情景的能力所建筑的。人们的注意力一转,隐式需求就会变成明式。隐式信息往往包含更多的用户信息,而且比明式信息可信度更高。但是电脑无法理解这些“隐式指令”,他们只能处理它们得到的指令。目前很多应用会在网站入口让用户选择标签,但是这个无法真正的获取用户的准确全面的数据。将复杂,意义丰富的现象明确化十分重要,但是不是简单的从“隐式”拉到“明式”而已。当信息组织将现象过于简化的化,将造成一些不完整的且误导人的说法。信息组织必须正确掌握与“隐式”事物之间的平衡,才能做到真正的明确化。人们在描述世界上“杂乱无序”的信息时,需要包含什么信息、不包含什么信息,都是基于目的出发的,他们的出发点都是对他们十分重要的因素。因此,信息组织必须要明确人们的组织信息的目的。
信息组织也称信息整序,是利用一定的规则、方法和技术对信息的特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转换为有序集合的过程。
现有信息组织的工具与方法体系难以适应大数据组织的任务。信息组织的自动化和智能化水平不足。大数据环境下的大部分数据都是以数字方式存贮的或已经被数字化的,这与2000年数字化存储的数据量占数据总量的25%相比,有了巨大的飞跃,IDC(International Data Corporation,国际数据公司)将这种场景称为数字宇宙。数字宇宙的规模正在迅速扩大,IDC发布的数字宇宙研究报告显示,其规模将每两年翻一番[15]。这种数据膨胀的速度对信息组织的效率提出了更高的要求,对信息组织的自动化和智能化水平提出了挑战。
借助存量语义资源,对大数据进行语义化组织。语义化是信息组织的重要发展方向,无论是语义网的提出,还是关联数据、知识图谱的蓬勃发展,都是在朝着语义化的方向迈进。对于大数据来说,可以通过信息组织的方法、工具对大数据进行一定程度的语义化,进而通过实体的关联对各类大数据进行连接、整合。