热搜词：

打造“ 融合、智能、合作 ” 数据基础设施携手迈入智能时代

时间：2019-11-19

淘米云智能家居官方版4.1.1安卓版

软件大小：168.4M

　　11月19日华为在深圳举办2019全球数据基础设施论坛面向鲲鹏计算产业宣布全面启动数据基础设施战略并开源数据虚拟化引擎HetuEngine(河图引擎) 希望让伙伴像使用“数据库”一样使用“大数据” 让数据治理使用更简单。这是继今年9月基于“鲲鹏+昇腾”双引擎全面启航计算战略后华为从数据角度对计算战略的再度阐述。华为数据基础设施战略围绕数据“采-存-算-管-用”的全生命周期诠释了华为通过提供融合智能开放的数据基础设施使能各行各业客户释放数据价值让智能无所不及。

　　华为Cloud & AI产品与服务总裁侯金龙在大会上发表主题演讲

　　以下是侯金龙演讲全文

　　女士们先生们朋友们大家上午好!欢迎大家来到深圳参加首届全球数据基础设施论坛。

　　人类正迈入万物互联的智能时代而数据将成为智能世界的关键生产资料。今天我分享的主题是《打造“融合智能开放”数据基础设施携手迈入智能时代》。

　　构建万物互联的智能世界

　　华为公司的愿景与使命是：“把数字世界带入每个人每个家庭每个组织构建万物互联的智能世界”。在智能世界算力成为新生产力数据成为新生产资料 “5G AI 云”成为新生产工具将使能千行百业迈入智能时代。

　　两个月前华为在全联接大会上发布了“一云两翼双引擎”的鲲鹏计算产业布局基于“鲲鹏+昇腾”双引擎全面启航计算战略为世界提供最强算力。

　　“一云”是指华为云是生态伙伴发展的黑土地。“两翼”是指智能计算和智能数据。数据作为鲲鹏产业中的关键一翼华为将围绕数据构建端到端的能力包括存算用的能力通过5G+云+AI能力打造“融合智能开放”的数据基础设施释放数据价值让智能无所不及!

　　智能世界从数据管理走向数据运营

　　首先数据将驱动客户体验。当你打开一个App 就会收到你感兴趣的内容推送。精准推送的背后其实就是数据在驱动。比如快手每天产生1.2亿个内容标签与用户画像实时匹配数据运营实现内容精准推送。

　　其次在企业经营活动中数据驱动企业生产决策。以大港油田为例在经历了50年持续开采后面临资源枯竭产量下降的挑战。2019年以来大港油田采用华为大数据和AI技术利用测井曲线结合经验模型生成了每口井的孔隙度渗透率找到了更多的新的油气层。通过数据运营为长期稳产500万吨提供了决策支撑。

　　最后我介绍下数据驱动企业流程简化。华为每年有近300万人次出差以前出差涉及考勤机票酒店包括报销等十几个申请流程现在只需要一个流程就可以真正实现“说走就走”。这是每天45万次后台数据关联碰撞的结果。数据运营实现“让数据多跑路员工少跑腿”。

　　智能世界需求与资源存在巨大落差

　　随着5G AI和云的普及数据量正以惊人的速度增长：从1080P到4K 8K 视频数据量将提升40倍从4K到4K VR要增加6倍以上;未来每辆自动驾驶汽车每天就会产生高达64 TB数据;深圳一个城市有超过200万摄像头每天将产生80 PB数据平均保存30天大家希望保存更长时间;大量的数据过去只需存几天现在需要保存几个月甚至永久保存。

　　根据预测全球数据量将从2018年的33 ZB快速增长到2025年的180 ZB。但是产生的数据中仅有不到2%被保存而被保存的数据中仅有不到10%被应用。

　　这些海量数据的增长背后是需要海量存储和计算的资源数据增长是无限的而存储资源却是有限的。

　　数据全生命周期每比特价值最大每比特成本最优

　　我们希望对数据的采存算管用实施端到端的整合和优化让数据在全生命周期内更好用数据的每比特发挥价值最大数据的每比特成本最优!

　　打造“融合智能开放”数据基础设施

　　为实现这个追求华为打造融合智能开放的数据基础设施让数据系统从孤立走向融合从复杂走向智能从封闭走向开放：

　　通过“打破数据处理与数据存储的边界” 实现数据高效共享和分析降本增效。

　　通过“AI+存储+云” 实现数据全生命周期内智能管理和智能运营让存储越用越快价值越来越大。

　　通过“数据虚拟化引擎” 统一SQL语法像使用数据库一样使用大数据。

　　融合：使用极简

　　数据应用的核心包括存储和分析。烟囱式IT业务系统带来两个问题：存的时候会产生多个冗余副本且数据无法流动存储成本高;分析的时候会导致大量数据搬迁分析效率低。

　　通过10余年技术积累和创新华为在存储数据库和大数据技术上实现了一系列突破通过打破4堵墙让数据的每比特发挥价值最大数据的每比特成本最优。

　　打破存储内部系统墙：通过一套架构实现生产分析备份归档的统一管理一份数据在各个系统中平滑流动减少拷贝 TCO降低30%以上。

　　打破数据库与存储链路墙：通过算子下推实现近数据计算减少存储层与计算层之间的数据交换数据访问和处理性能提升2倍。

　　打破大数据与存储配置墙：通过存算分离实现资源灵活配置计算不足扩计算存储不足扩存储。并通过弹性EC 数据缩减技术减少冗余整体TCO降低30%以上。

　　打破数据库与大数据协同墙：通过协同分析实现数据零搬迁数据库和大数据共享一份数据分析效率提升100%。

　　智能：体验极致

　　过去主要依靠人来完成设备配置和运维运维人员经验和能力的高低决定了管理效率的优劣。华为基于AI芯片存储和华为云的三层架构通过云上训练和云下推理让系统越用越快越用越省。

　　依托昇腾处理器的AI能力自动学习和识别IO流提升Cache预取命中率系统整体性能提升20%。

　　依托鲲鹏处理器的多核算力根据不同的数据类型实时优化数据缩减算法 TCO降低25%。

　　结合华为云自身大规模运维运营经验当前可以实现提前14天预测硬盘故障提前60天预测性能瓶颈提前365天预测容量不足其中30%的故障可以自我修复。

　　开放：开发极简

　　随着业务类型日益增多大量业务需要跨平台跨数据源协同分析。这种场景下最突出的3个问题是：找数难取数难用数难。

　　找数难：传统企业数据类型越来越多结构化半结构化非结构化数据并存缺少统一数据目录和全局数据视图要在众多异构数据源中找到特定数据好比大海捞针。

　　取数难：一个典型的分析业务通常依赖跨地域跨平台数据协同需要从多个业务系统获取数据这要经过多部门间协调核实才能获取。

　　用数难：多业务分析需要多引擎协同这将依赖多种数据访问技术就需要开发人员掌握多种开发工具和语言从而导致开发门槛变高开发周期变长。

　　为了屏蔽数据类型差异地域差异语法差异让数据治理简单使用简单华为推出了“河图引擎”。

　　HetuEngine 从“大数据”走向“大数据库”

　　我们将数据虚拟化引擎命名为河图就是屏蔽数据基础设施的复杂度让开发者像使用数据库一样使用大数据复用现有的生态工具和技能提升开发效率2到10倍。“大禹得河图后始见清明” 传说中大禹通过河图掌握河流山川复杂的地形地貌顺利完成治水大业。

　　河图引擎就是要让数据治理简单使用简单更方便的挖掘数据价值。它具备4个核心能力：

　　一个目录：通过元数据在线感知构建1000+异地异构数据源全局虚拟数据视图打破数据孤岛数据全局可视解决企业找数难问题。

　　一个入口：通过开放的连接框架 5000节点SQL引擎实现30种异地异构数据源统一SQL访问秒级获取数据全局可得解决企业取数难问题。

　　一份数据：通过CarbonData技术实现一份数据多场景分析多应用共享数据零搬迁数据全局可用解决企业用数难问题。

　　统一安全：通过细粒度动态授权敏感数据自动感知技术实现异地异构数据源集中式安全配置与管控数据全局可控数据授权时间从天到秒解决企业数据安全与合规问题。

　　开源河图引擎HetuEngine

　　为了更好地发展数据产业今天我宣布开源河图引擎开源版本的河图引擎叫openHetu 将于2020年6月上线。我们将开源内核开发者可以基于开源代码进行定制包括数据源扩展 SQL执行策略等实现应用快速对接提升开发效率。

华为Cloud & AI产品与服务总裁侯金龙宣布开源数据虚拟化引擎HetuEngine

　　平台+生态携手迈入智能时代

　　华为始终践行“平台+生态”策略通过硬件开放软件开源使能伙伴共建开放繁荣的鲲鹏计算产业生态共同迈入智能时代。

　　谢谢大家!

最新

打造“ 融合、智能、合作 ” 数据基础设施 携手迈入智能时代

打造“ 融合、智能、合作 ” 数据基础设施携手迈入智能时代