第286章 快跑(1 / 4)

离语 semaphore 1298 字 6天前

数据是指对客观事件进行记录并可以鉴别的符号Y

是对客观事物的性质状态以及相互关系等进行记

载的物理符号或这些物理符号的组合Y是可识别的

抽象的符号

??数据和信息是两个不同的概念Y信息是较为宏观

的概念Y它由数据的有序排列组合而成Y传达给读

者某个概念方法等Y而数据则是构成信息的基本单

位Y离散的数据没有任何实用价值。

数据也被称为“未来的石油”

涉及到国家安全等方面。

计算机系统中的数据组织形式主要有两种Y即文件和

数据库

??

1??文件X计算机系统中的很多数据都是以文件形式

存在的Y比如一个WORD文件一个文本文件一个

网页文件一个图片文件等等

??

2??数据库X计算机系统中另一种非常重要的数据组

织形式就是数据库Y数据库已经成为计算机软件开发

的基础和核心。

过去X一旦数据的基本用途实现了Y往往就会被

删除Y一方面是由于过去的存储技术落后Y人们

需要删除旧数据来存储新数据Y另一方面则是人

们没有认识到数据的潜在价值

现在X数据的价值不会因为不断被使用而削减Y

反而会因为不断重组而产生更大的价值

将来X各类收集来的数据都应当被尽可能长时间

地保存下来Y同时也应当在一定条件下与全社会

分享Y并产生价值。

人类进入信息社会以后Y数据以自然方式增长Y其产生不以人

的意志为转移

从1986年开始到2010年的20年时间里Y全球数据的数量增长

了100倍Y今后的数据量增长速度将更快Y我们正生活在一个

数据爆炸的时代。

数据分析过程包括X数据采集与预处理数据存储与管理数据处理与

分析数据可视化等

??

1??数据采集与预处理X采用各种技术手段把外部各种数据源产生的数

据实时或非实时地采集预处理并加以利用

??

2