数据扩散

编辑
本词条由“匿名用户” 建档。
数据扩散是指企业和政府以前所未有的速度继续生成大量结构化和非结构化数据,以及尝试存储和管理这些数据导致的可用性问题。虽然最初涉及与纸质文档相关的问题,但数据扩散已成为计算机上一级和二级数据存储的主要问题。 虽然数字存储变得更便宜,但从原始电力到维护以及从元数据到搜索引擎的相关成本并没有跟上数据的激增。尽管维护一个数据单元所需的功率已经下降,但容纳数字存储的设施成本却趋于上升。 在最...

什么是数据扩散

编辑

数据扩散是指企业和政府以前所未有的速度继续生成大结构化和非结构化数据,以及尝试存储和管理这些数据导致的可用性问题。虽然最初涉及与纸质文档相关的问题,但数据扩散已成为计算机上一级和二级数据存储的主要问题。

虽然数字存储变得更便宜,但从原始电力维护以及从元数据搜索引擎的相关成本并没有跟上数据的激增。尽管维护一个数据单元所需的功率已经下降,但容纳数字存储的设施成本却趋于上升。

在最简单的层面上,公司电子邮件系统会产生大量数据。商务电子邮件——有些对企业很重要,有些则不那么重要——估计每年以25-30%的速度增长。无论是否相关,系统的负载都被多重寻址和附加大文本、音频甚至视频文件等做法放大。

IBM全球技术服务

自1971年8月以来,数据扩散一直是美国军方面临的一个问题,特别是在采购主要武器系统期间提交的过多文件方面。减轻数据扩散和与之相关的问题的努力正在进行中。

数据扩散引起的问题

编辑

由于相对便宜的数据存储设备的可用性,数据扩散问题正在影响所有商业领域。这使得在其可用性窗口过去后立即将数据转储到辅助存储变得非常容易。这掩盖了可能严重影响企业盈利能力和卫生服务、警察和安全部队、地方和国家政府以及许多其他类型组织的有效运作的问题。数据扩散存在问题有几个原因:

  • 尝试查找和检索信息时遇到困难。在施乐,员工平均每周需要一个多小时才能找到硬拷贝文件,管理和存储这些文件每年要花费2,152美元。对于拥有10名以上员工的企业,这将增加到每周近两个小时,每年5,760美元。在主要和辅助数据存储的大型网络中,查找电子数据的问题类似于查找硬拷贝数据的问题。
  • 数据杂乱无章、未正确复制或无法及时找到时的数据丢失和法律责任。2005年4月,Ameritrade控股公司告诉200,000名当前和过去的客户,包含机密信息的磁带在运输过程中丢失或损坏。同年5月,时代华纳公司报告称,包含600,000名现任和前任员工个人数据的40盘磁带在运往存储设施的途中丢失。2005年3月,佛罗里达州的一名法官在审理针对摩根士丹利的27亿美元诉讼时,发布了“不利推论”命令”针对该公司“故意和严重滥用其发现义务。”法官援引摩根士丹利的说法,在该公司声称已将所有此类磁带移交给法院很久之后,摩根士丹利一再发现错误放置的电子邮件磁带。
  • 管理日益混乱的数据存储资源的人力需求增加。
  • 用户搜索并再次搜索他们需要的材料时,由于流量过多而导致网络和应用程序性能变慢。

数据扩散

  • 运行存储硬件所需的能源成本很高。一个100TB的系统每年的运行成本高达35,040美元——这还不包括冷却成本。

建议的解决方案

编辑
  • 更好地利用现代技术的应用程序
  • 减少重复数据(尤其是由数据移动引起的)
  • 元数据结构的改进
  • 文件和存储传输结构的改进
  • 用户教育和纪律
  • 实施信息生命周期管理解决方案,以尽早消除低价值信息,然后将其余信息放入主动管理的长期存储中,以便快速、廉价地访问这些信息。

内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/132207/

(3)
词条目录
  1. 什么是数据扩散
  2. IBM全球技术服务
  3. 数据扩散引起的问题
  4. 建议的解决方案

轻触这里

关闭目录

目录