纯数字2021 | / /加速詳細とご登録

大数据vs.传统数据

大数据vs.传统数据

大数据提供具有巨大机会的业务,包括对客户行为的更加重要的见解,更准确的市场活动预测,以及整体效率提高。

个人和企业每年产生的数据越来越多。据国际数据公司(IDC)的一份报告显示,2010年全球仅创造了1.2 zettabytes(1.2万亿gb)的新数据。到2025年,它可能增加到175zettabytes (175x十亿字节)或更多。

随着企业通过预测分析和数据挖掘挖掘这一蓬勃发展的资源,大数据市场也将增长。Statista研究据预测,从2018年到2027年,大数据市场的价值将翻番,从1690亿美元增至2740亿美元。

但大数据与传统数据的关键区别是什么?它们对当前的数据存储、处理和分析技术有什么影响?在这里,我们将解释每种类型的数据服务的不同目的,同时强调成功规划大数据和传统数据的战略的重要性。

闪光灯のテストドライブ

Pure1®のセルフサービス・インスタンスによるFlashBlade™の管理を通じて,ネイティブなスケールアウトが可能なファイル/オブジェクト・ストレージの先進的機能をお試しいただけます。

什么是传统数据?

传统的数据是结构化的,关系数据组织已经存储和处理了几十年。传统数据仍然占世界数据的绝大部分。

企业可以使用传统数据来跟踪销售、管理客户关系或工作流。传统数据通常更容易操作,可以用传统数据处理软件进行管理。然而,与大数据相比,它通常提供的见解不那么复杂,好处也比较有限。

什么是大数据?

大数据既可以指庞大而复杂的数据集,也可以指处理这类数据的方法。大数据有四个主要特征,通常被称为“4v”:

  • 体积大数据是……大数据。虽然大数据的区别不仅在于它的大小,它的体积通常也非常大。
  • 各种:大数据集通常包含结构化,半结构化和非结构化数据。
  • 速度:大数据生成迅速,通常是实时处理的。
  • 真实性大数据的质量并不比传统数据高,但它的准确性(准确性)非常重要。异常、偏差和噪声会显著影响大数据的质量。

大数据与传统数据之间的差异

大数据和传统数据之间有几个区别。这些包括:

  • 数据的大小
  • 数据是如何组织的
  • 管理数据所需的体系结构
  • 数据来自哪些来源
  • 用于分析数据的方法

大小

传统的数据集倾向于以千兆字节和兆兆字节来衡量。因此,它们的大小允许集中存储,即使是在一台服务器上。

大数据不仅可以通过其大小而区分,而且是其体积。通常在Petabytes,Zettabytes或Exabytes中测量大数据。越来越大的大数据集是对更现代,高容量,基于云的数据存储解决方案的需求背后的主要驱动因素之一。

组织

传统数据通常是组织在记录、文件和表中的结构化数据。传统数据集中的字段是关系的,因此可以计算出它们的关系并相应地操作数据。传统的数据库,如SQL、Oracle DB和MySQL,使用固定的模式,是静态的和预先配置的。

大数据使用动态模式。在存储方面,大数据是原始的、非结构化的。当访问大数据时,动态模式应用于原始数据。现代非关系或NoSQL数据库,如Cassandra和MongoDB是理想的非结构化数据,考虑到它们在文件中存储数据的方式。

建筑学

传统数据通常使用集中式架构进行管理,对于较小的结构化数据集,集中式架构更经济有效,也更安全。

一般来说,一个集中的系统由一个或多个连接到一个中心节点(例如,一台服务器)的客户机节点(例如,计算机或移动设备)组成。中央服务器控制网络并监控其安全性。

由于其规模和复杂性,因此无法集中管理大数据。它需要一个分布式架构。

分布式系统通过网络将多个服务器或计算机连接起来,它们作为相同的节点运行。该体系结构可以水平扩展(向外扩展),并且即使单个节点故障也可以继续运行。分布式系统可以利用商用硬件来降低成本。

来源

传统数据通常来源于企业资源规划(ERP)、客户关系管理(CRM)、在线事务和其他企业级数据。

大数据来源于更广泛的企业级和非企业级数据,包括从社交媒体、设备和传感器数据中提取的信息,以及视听数据。这些源类型是动态的、不断发展的,并且每天都在增长。

非结构化数据源还可以包括文本、视频、图像和音频文件。使用传统数据库的列和行是不可能利用这类数据的。由于越来越多的数据是非结构化且来源多样,需要大数据分析方法从中提取价值。

分析

传统的数据分析逐步发生:发生事件,生成数据,并在事件发生后进行此数据的分析。传统数据分析可以帮助企业了解给定策略或变化在特定时期的有限指标的影响。

大数据分析可以实时发生。由于大数据在第二次基础上生成,因此可以在收集数据时进行分析。大数据分析为业务提供了对其需求和策略的更具活力和全面的理解。

例如,假设一个企业对其员工的培训计划进行了投资,并希望衡量其影响。

在传统的数据分析模式下,企业可能会着手确定培训项目对其特定业务领域(如销售)的影响。业务记录了培训前后的销售额,排除了任何外部因素。理论上,它可以看到培训带来了多少销售增长。

在大数据分析模型下,企业可以搁置有关培训计划如何影响其运营的任何特定方面的问题。相反,通过分析整个业务中实时收集的大量数据,它可以确定受到影响的具体领域,如销售、客户服务、公共关系等。

大数据与传统数据:未来的重要考虑因素

大数据和传统数据提供不同但相关的目的。虽然它似乎大数据具有更大的潜在利益,但在所有情况下都不是合适的(或必要的)。大数据:

  • 可以提供更深入的市场趋势和消费者行为分析。传统的数据分析可能更加狭隘和局限,无法提供大数据所能提供的有意义的见解。
  • 快提供了见解。组织可以实时地从大数据中学习。在大数据分析的背景下,这可以提供竞争优势。
  • 是更有效的。我们的社会越来越数字化,这意味着人们和企业每天、甚至每分钟都在产生大量数据。大数据让我们能够利用这些数据,并以一种有意义的方式来解释它们。
  • 需要先进的准备。利用这些好处需要组织通过新的安全协议、配置步骤和增加可用的处理能力来准备大数据

大数据的兴起并不意味着传统数据正在消失。传统的数据:

  • 可以更容易保护,这可能使它更适合高度敏感、个人或机密数据集。由于传统数据较小,它不需要分布式架构,也不太可能需要第三方存储。
  • 可以使用常规的数据处理软件和正常的系统配置进行处理。处理大数据通常需要更高的配置设置,这可能会增加不必要的资源使用和成本,而传统数据方法就足够了。
  • 更容易操纵和解释。由于传统数据本质上是更简单和关系的,因此可以使用普通功能进行处理 - 甚至可以访问NOTExperts。

归根结底,这不是在大数据和传统数据之间进行选择的问题。随着越来越多的公司生成大型的非结构化数据集,他们将需要适当的工具。了解如何使用和支持这两种模型是更新策略的必要部分,为大数据的未来做好准备。

800-379-7873 +44 20 3870 2633 +43 720882474 +32 (0) 7 84 80 560 +33 9 75 18 86 78 +49 89 12089 253 +353 1 485 4307 +39 02 9475 9422 +31(0)20 201 49 65 +46-101 38 93 22 +45 2856 6610 +47 2195 4481. +351 210 006 108 + 966112118066 + 27 87551 7857 +34 51 889 8963 +41 31 52 80 624 +90 850 390 21 64 + 971 4 5513176 +7 916 716 7308 + 65 3158 0960 + 603 2298 7123 +66 (0) 26240641 +84 43267 3630. +62 21235 84628 + 852 3750 7835 + 82 2 6001 - 3330 +886 2 8729 2111 +61 1800 983 289 +64 21 536 736 55 + 11 2655 - 7370 +52 55 9171-1375 + 56 2 2368 - 4581 + 57 - 1 383 - 2387