目前,数据湖的应用情况如何?
在客户洞察和体验方面,所有类型的企业都有机会。企业可以将所有对客户的了解,以及他们告知的事情汇聚到一起,客户资料、购买历史、销售和呼叫中心互动、社交媒体数据等。通过客户的移动设备,以及常规的数据捕获方式,企业也可以为客户体验“谱曲”。如果一起分析这些数据,企业可以设计并交付更令人不可抗拒的体验,甚至实时塑造经验。
应用和信息系统安全是CIO们尤其关心的问题。组织将其系统日志和网络活动放到数据湖中,可以更快、更好地发现异常,进而形成更快且更有针对性的事故响应机制。通过使用从数据湖生成的情报,IT管理能形成闭环,构建起问题何时、何地最可能发生的预测模型。
通过数据湖,我们能自然地看到那些需要分析巨量新生成或组合数据的应用,例如,基因组分析或者了解何时、何地电网会发生故障的预测模型。
在数据湖实施方面,企业面临的困难有哪些?
数据湖将变得很大,至少比现在最大的企业数据库大一个数量级。这是因为有潜在用途数据的产生速率一直在加快。幸运的是,与传统数据库相比,数据湖提供一个更优的成本结构。传统数据库是成本高昂的,更别提技术的笨重,以及大数据分析应用。
面向业务交易和报告场景,数据仓库试图让所有的数据没有差错。数据湖则试图将有趣的数据收集到一起,用以分析和洞察。因此数据质量和效率的意义发生了变化,当需要提前确定的事情少很多时,数据治理也发生了变化。要让不同方法都能奏效,企业需要的数据管理人才必须足够聪明且非常灵活。
通过数据湖,企业内跨资源、组织、结构和其他人为障碍带来的相关数据限制被移除。这打开了一扇门,为新事物带来了无限可能,企业可以更快、更好地创新。
限制被移除后,一些组织对什么是要紧的事有了更清楚的认识,并投入工作。例如,数十年来,UPS一直通过使用信息和分析,应对“旅行推销员”问题。在UPS最新的代表作中,他们使用更多的遥测和交通数据,有效减少货车行驶里程达数百万英里,节省成百上千万加仑燃料。其他公司也将尝试做更多事情,他们的努力和收益变得更碎片化。
EMC联邦的数据湖解决方案是什么?
EMC联邦的数据湖解决方案提供了一套技术参考架构,以及服务,横跨EMC II、Pivotal和VMware。
这是一个打包方案,帮助客户加速从数据仓库向数据湖的转变,这一过程不仅是通过一套经验证的结构完成的,而且还有全球服务帮助完成迁移。
想的候选者是那些在满足ETL窗口或最大化资源方面存在麻烦的组织,拥有大型数据仓库。当你将ETL处理从昂贵的数据仓库迁移到更低成本的数据湖时,能节约20%-50%的成本。
如何解决数据抽取技术短缺这一问题?
EMC联邦的数据湖解决方案通过三种方式解决这一问题:
通过将一套技术参考架构放到一起,EMC加速数据湖的进化。
通过将EMC全球服务的专业知识打包,EMC帮助客户确定最有业务影响力的用例,并为执行创建后续的项目计划,客户可快速启动。
EMC的大数据课程培训公司高管、商业领袖和数据科学家,帮助他们成功确定用例并实施。例如,EMC培训用户新技术,例如Hadoop,这是一个更现代化、强大且敏捷的ETL处理工具。