大数据预测:2020年将带来什么
2020/2/10 15:56:33

每到岁末年初,行业专家就会对未来一年的技术发展进行预测,而如今,一切始于大数据问题关键的方面:数据本身。   
  不可否认,Hadoop在2019年的发展经历了艰难的一年。但是它完全消亡了吗? Alluxio公司创始人兼技术官Haoyuan Li为此表示,以Hadoop分布式文件系统(HDFS)形式存在的Hadoop存储已失效,但以Apache Spark形式存在的Hadoop计算仍然存在。
   
  Haoyuan Li说:“关于Hadoop消亡的说法很多。但是Hadoop生态系统还有后起之秀。诸如Spark和Presto之类的计算框架可从数据中获取更多价值,并已被更广泛的计算生态系统所采用。Hadoop存储(HDFS)由于其复杂性和成本以及由于与HDFS保持联系,而从根本上无法弹性扩展因此导致消亡。为了获得实时见解,用户需要云中可用的即时和灵活的计算能力。HDFS中的数据将迁移到优化和具成本效益的系统,无论是云存储还是本地对象存储。HDFS将会消亡,但是Hadoop计算将持续存在并且越来越强大。”
   
  Cloudian公司营销官(CMO)Jon Toor表示,随着HDFS数据湖部署的缓慢,Cloudian公司已经准备就绪,可以将数据捕获并将其捕获到其对象存储中。
   
  Toor说,“在2020年,我们将看到越来越多的组织利用对象存储从非结构化数据创建结构化/标记数据,从而允许使用元数据来理解人工智能和机器工作负载生成的数据海啸。”
   
  ThoughtSpot公司执行官Sudheesh Nair表示,像Hadoop这样的事情的终结将引发另一件事的开始。
   
  Nair说:“在过去的10年中,我们看到了Hadoop的兴起、平稳发展和终结的开始。这不是因为大数据已经死亡。恰恰相反,几乎每个组织都在致力于成为大数据公司。这是在当今商业环境下运作的要求。数据已经变得如此庞大,而且对这种数据的灵活性需求如此之大,然而,很多企业或者正在构建自己的数据池或数据仓库,或者直接进入云平台。随着2020年这一趋势的加速,我们将看到Hadoop的应用继续下降。”
   
  当数据变得足够大时,就会施加类似引力的力,使其难以移动,同时还可以吸引更多数据。Digital Realty公司技术官Chris Sharp说,了解数据的引力将帮助企业克服数字化转型的障碍。
   
  Sharp说:“数据的生成速度是许多企业无法跟上的。这不仅增加了这种复杂性,企业还从难以移动和有效利用的多个位置处理有用却不实用的数据。这给企业带来了一个‘数据引力’问题,这将阻止数字化转型计划向前推进。在2020年,我们将看到企业通过将应用程序更靠近数据源而不是将资源传输到中央位置来解决数据引力问题。通过本地化数据流量、分析和管理,企业将更有效地控制其数据并扩展数字业务。”
   
  在所有条件都相同的情况下,拥有更多数据总比拥有更少数据更好。TD Ameritrade公司的人工智能、数据科学和新兴技术总监Beaumont Vance认为,但企业可以利用现有技术来更好地利用已有数据,从而实现突破。
   
  Vance说,“随着企业创建新的数据池,开发更好的技术来理解研究结果,我们将看到人工智能前所未有的真正价值。目前,企业使用的内部数据不到所有数据的20%,但通过新的人工智能功能,剩下的80%未开发的数据将是可用的,并且更容易理解。先前无法解决的问题将有显著的改善,有助于推动行业和社会的巨大变革。”
   
  大数据很难管理,那么能用小数据采用人工智能技术吗?Zinier公司执行官Arka Dhar对此表示肯定。
   
  Dhar说:“展望未来,我们将不再需要大量的大数据集来训练人工智能算法。在以往,数据科学家一直需要大量数据才能对人工智能模型进行准确的推断。人工智能的进步使我们能够以更少的数据获得类似的结果。”
   
  数据的存储方式决定了应该如

下一页
返回列表
返回首页
©2024 物联网世界--物联网资料和交流中心 电脑版
Powered by iwms