0
点赞
收藏
分享

微信扫一扫

Hortonworks联合Jethro扩充其数据仓库解决方案

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。


Hadoop做数仓,不是啥子新鲜概念,各家Hadoop厂商都有自己的方案。Hortonworks这两天突然官方宣布与Jethro一起来玩EDW,Fayson也没搞太懂。从Jethro的文档看上去应该很早就支持CDH5.9/5.10和HDP2.3/2.4了。参考:

​​http://docs.jethro.io/docs/latest/jethro-manager/supported-platforms​​

 

Hadoop做数仓一个关键东西就是SQL工具,说起这个,HDP其实挺逗的,我们看看HDP之上SQL工具的历史:

2013年2月推出Hive on Tez:

​​https://hortonworks.com/blog/100x-faster-hive/​​

2014年9月继续Tez:

 ​​https://hortonworks.com/blog/stinger-next-enterprise-sql-hadoop-scale-apache-hive/​​

2016年4月是Hawq:

 ​​https://hortonworks.com/press-releases/hortonworks-pivotal-expand-relationship-deliver-enterprise-ready-modern-data-platforms-data-management-analytics/​​

2016年6月是Hive LLAP:

​​https://hortonworks.com/blog/llap-enables-sub-second-sql-hadoop/​​

2016年6月还有一个AtScale:

 ​​https://hortonworks.com/blog/partnering-with-atscale-to-bridge-the-gap-between-business-users-and-hadoop/​​

2017年5月是德鲁伊Druid:

​​https://hortonworks.com/blog/sub-second-analytics-hive-druid/​​

2017年6月还有IBM的Big SQL:

​​https://hortonworks.com/press-releases/ibm-hortonworks-expand-partnership/​​

然后现在是Jethro

……

 

反正我已经晕了,到底该用哪个呢。这SQL on HDP,风雨飘摇,摇摆不定,定力不够,够不着就有点蛋疼了。

 

好了,开个玩笑,以下内容是原文翻译,翻译的不好,将就着看吧。内容其实挺简单的,建议阅读时间为30s。


1.简介



企业数据仓库(EDW)存储着企业大量重要的数据,是关键业务分析的基础。随着企业内部业务数据的持续增长,以及最近几年大数据技术的蓬勃发展,大家突然发现传统的EDW无论是从规模,多样性以及使用方式上都无法满足自己了。

 

于是Hortonworks今天很高兴宣布与Jethro达成战略合作伙伴关系,从而扩充优化EDW的解决方案,帮助客户解决企业大数据仓库的规模和性能问题。

Hortonworks联合Jethro扩充其数据仓库解决方案_hive


2.传统EDW的问题



传统的EDW系统一般使用专门的数据库运行在特有的硬件环境之上,以分析从有限的数据源比如ERP或者CRM导过来的结构化数据。经过一些调优后,可以加速BI工具比如Tableau,Qlik或MicroStrategy的访问。当交互式BI应用场景成为常态的应用场景时,传统的EDW一般会存在以下问题:

 

  • 业务交易量的增长和业务监控的进步无情的推动了数据量的持续增长,于是需要对EDW进行扩容,一般都会要花很多钱。为了满足系统的ROI目标,IT部门只能控制整体数据量,比如1年甚至更少,不可避免的限制了对所有数据的访问。

 

  • 新的EDW的数据源是非常多的,比如系统日志,物联网流式数据或者网站数据。这些数据不仅体量大,而且类型多样,除了结构化,还有半结构化以及非结构化数据。

 

  • 传统的EDW一般只能服务有限的用户或者应用,但大数据EDW可以服务更多的用户,比如可以从数据科学家到品牌营销经理。数据是动态的,非隔离的,任何用户都可以访问数据的任何部分,同时实时ETL还可以保证数据的时效性。

 

无论数据量多大,数据源怎么多样,数据如何复杂 – 业务用户都只有一个简单的目标,就是可以得到交互式的响应,从而更高效的完成工作。


3. Hortonworks的EDW解决方案



Hortonworks的EDW解决方案结合了HDP,Synsort和Jethro Data,包含附带的服务,以此来解决大数据EDW带来的挑战和问题。

 

Hortonworks Data Platform (HDP)  - 集成数据治理,数据采集,数据管理,数据访问,安全和使用操作的开源Hadoop平台

 

Syncsort – 高效的ETL工具方便将企业内部的数据抽取到HDP

 

Jethro Data – 基于Hadoop数据的高效的交互式BI分析引擎

 

Professional Services – 专家级的指导和支持,通过最大限度的完整测试和验证,从而快速证明基于Hortonworks优化的解决方案的新架构的价值。

 

Hortonworks的EDW解决方案提供了一个完整的集成解决方案,来解决大数据EDW带来的挑战和问题。首先是一流的ETL工具,用于访问各种各样的数据源,可扩展的Hadoop数据湖,以及高性能的交互式BI引擎,构成了一个全面且性价比高的解决方案。


4.为什么选择Jethro Data



Jethro Data全面支持索引,动态的cubes以及查询缓存,从而在超大数据集的基础之上为交互式BI查询提供秒级响应。Jethro不需要您对应用程序进行修改,也不会更改底层数据。Jethro基于Hadoop为您提供EDW服务,成本也较低。


5.参考原文



​​https://zh.hortonworks.com/blog/jethro-data-partnership-extends-hortonworks-enterprise-data-warehouse-solution/​​

​​https://jethro.io​​


好好过节,还最后一天了,时日无多,大家抓紧浪吧。回头有时间给大家再讲解和分析Jethro。



醉酒鞭名马,少年多浮夸! 岭南浣溪沙,呕吐酒肆下!挚友不肯放,数据玩的花!

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。





Hortonworks联合Jethro扩充其数据仓库解决方案_hive_02



举报

相关推荐

0 条评论