25 个令人大开眼界的大数据现象及有趣事实

随著巨量资料时代来临,大数据一词已经十分普及,甚至有些被滥用的趋势。在这个时代,切身体会到「大数据」货真价实的存在、以及解读大数据的潜力成为我们的重要课题。

在此整理了 25 个所谓的「大数据现象」(Big Data phenomenon)及「大数据事实」(Big Data fun facts)并附上资料来源供大家参考,看完你将会对大数据有多「大」有更清楚的认知,而且也对大数据的潜力及它带来的改变有更深一层的解读。

  1. 我们现在每两天产生的资料量是相当于过去到 2003 年为止累积的资料量。[Source]
  2. 根据 IDC,现今世界上 90% 的资料量是在过去两年多裡所产生的。[Source]
  3. 根据 UCSD 的研究调查,2008 年光美国居民就生产了 3.6 ZB 的资料量。[Source]
  4. 2016 年的网路流量将会到达 1.3 ZB(Zettabyte = 10^21 bytes)。[Source]
  5. 根据 IDC 跟 EMC 的研究分析,估计了 2020 年时,数位资料量将会从 3.2 ZB 成长到 40 ZB。[Source]
  6. 企业所获取且储存的资料量每 1.2 年就双倍成长。[Source]
  7. 每分钟世界上有近 2 亿封 E-mail 被寄出,也就是每天 2470 亿封 E-mail,不过其中 80% 是垃圾信件。[Source]
  8. 每分钟 Youtube 影片被上传超过 100 个小时,而且每天上传的影片量要花你 15 年的时间来看完。[Source]
  9. 如果我们将一天内产生的资料全部烧录进 DVD 光碟内,那这些光碟叠起来可以搭成地表到月球的 DVD 高塔,而且还是「双塔」。[Source]
  10. 每天每分钟有约 570 个新网站出现。[Source]
  11. 大数据飞快成长,到 2015 年,为了处理大数据,全球多出了 4.4 百万个 IT 职位,也因此这方面的专业人士缺口,各行各业都在抢夺大数据专家 >> 还没决定未来方向的学子们不妨考虑这个领域。[Source]
  12. 根据 McKinsey Global Institute 的资料,到 2018 年时,美国地区将面临 14 万到 19 万的大数据专业人才短缺,以及 1 百 50 万个拥有洞察大数据的能力、因而做出好的企业决策管理阶层人才。[Source]
  13. 目前世界各地的数据中心(超过 50 万个)加起来相当于 6000 个足球场的大小。[Source]
  14. 从 2012 年到 2014 年,行动装置上传输的资料量成长了 81%,达到 1.5 Exabytes (Exabytes = 10^18 bytes),其中 53% 来自影音资料。[Source]
  15. NSA 每天得分析 1.6 % 的全球网路资料量 —— 约 30 PB (Petabytes = 10^15 bytes)。[Source]
  16. Hadoop 被公认为大数据主流技术(请参考文章:认识大数据的黄色小象帮手 –– Hadoop),根据市场研究机构 Allied Market Research,Hadoop 市场价值从 2013 年 20 亿,估计到了 2020 年时会飙涨到 500 亿。[Source]
  17. 根据 IDC 的分析,2008 年时数位资料量就超过了目前已知的宇宙内星星数量,而且以资料成长的速度,2023 年时全球资料量将会超过亚佛加厥常数(Avogadro’s number)—— 也就是 6.022 × 10^23。[Source]
  18. 由于物联网的蓬勃发展,智慧型装置的数量将会从现在到 2020 年将从 130 亿成长到 500 亿。[Source]
  19. 在加州及一些其他地区,大数据已经被用来建立模式、预测犯罪,而且比现今的其他预测技术来得准确。(有兴趣请参考相关文章:英美城市用大数据,揪出未知的细菌、罪犯与恶棍交易员)[Source]
  20. 根据 Tata Consultancy Services Limited(TCS)在 2013 年发表的研究,各企业的资料裡 51% 是结构化资料、27% 是非结构化资料、21% 是半结构化资料。[Source]
  21. 有将近 75% 的企业表示将逐渐增加对大数据的投资。[Source]
  22. 根据 CIO 的报告,38% 的机构根本不知道大数据是什麽,27% 的机构对大数据则是一知半解。[Source:]
  23. 根据 EMC2 的报告,25% 的企业已经有聘请资料科学家,24% 的企业正在使用大数据分析工具,57% 的企业则在慎重考虑采用大数据分析工具。 [Source]
  24. 如果大数据能善加利用在医疗领域,以美国地区为例,将会减少 8% 的医疗开销并省下 3000 亿美元。[Source]
  25. 最近几年来,已经有 5 亿美元的风险投资基金注入大数据科技公司裡。[Source]

本文文字及图片出自 www.inside.com.tw

余下全文(1/3)
分享这篇文章:

请关注我们:

共有 1 条讨论

  1. 6.022 × 10^23是阿伏加德罗常数,高中化学学过,就是一摩尔纯净物的原子或分子书

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注