如何面对数字经济大潮下迅猛增长的数据量?如何应对多样性数据带来的存算挑战?又如何在保障高效利用、存储、共享的前提下进一步挖掘和激发数据的价值?今天,对以“数据为基”的金融行业而言,这些问题已经变得尤为重要。协同行业共探“科技金融”发展新方向与技术突破口,11月26日,以“数智金融•使能创新”为主题的“2020华为数智金融论坛”在东莞松山湖溪村拉开帷幕,作为“科技金融”战略的践行者,招商银行在此次论坛期间分享了自身“数智化” 转型升级的经验。
够大、够快、够稳,招行这样选择数据仓库选型
作为全国最早建设数仓的银行之一,招商银行的数据基础设施经历了数十年的持续建设,积累了丰富的平台经验。伴随全行业的“数智化”浪潮,与自身业务的快速发展,原平台在持续有效支撑业务需求和持有成本方面的瓶颈开始凸显,新一代的数据仓库建设势在必行。
招商银行数据中心应用及数据库管理主管田永江指出:“在数据平台的建设上,招行始终以解决实际问题为出发点,以客户满意度和结果为导向,沉淀可复用易扩展的数据使能平台能力,确保运行的稳定性、服务的易得性、效果的显著性以及科技的领先性,实现‘源于业务,高于业务,先于业务’的中台理念。”
作为数据平台建设的关键一环,招行面临传统数仓向分布式架构转型所带来成本压力,如何从传统数仓过渡到新一代的数仓,从传统一体机转向X86或鲲鹏平台,为此,在平台选型上招行特别制定了POC测试计划,在MPP数据库的功能和性能是否全面满足数仓要求、基础设施配置是否满足机房的配置要求、容灾能否承载RTO和RPO要求,以及数据库管理工具是否具备快速运维和集中管控能力,数据库是否有扩展能力和安全能力等方面进行了严苛的验证与评估。
通过对多家数据仓库平台在基准、场景、运维三大类的测试,包括配置、可用性、扩展性、易管理性、性能、安全等在内的六大类运维指标,招行确定了华为GaussDB(DWS)数据仓库产品在内核上有相对的先进性和完整性。
田永江表示:“数据仓库选型,要注重够大、够快、够稳。我们希望它的性能容量线性比非常高以便于扩容,能够扩充到集群规模上千台、100PB的级别。在快速方面,希望它能在不同主机之间充分并行,把性能发挥到极致。同时稳定也特别重要,有没有多活、备份、多级的保护,既满足高可用又有容灾机制,各种故障场景都能从容应对。我们多个部门联合进行了全面选型,最终确定华为GaussDB(DWS)数据仓库作为我们新一代的平台。”
携手华为联合创新,全面实现“人人用数”
一个集群再大也有极限,如果业务量非常大,在平台不能满足的时候,就要有很多的集群,还不仅仅包括MPP,还有Hadoop、图数据库等等。在多种数据源的情况下,如何形成一个统一的视图,构建一个虚拟化引擎,使得无论是数据分析、实时风控,还是业务人员的一次简单营销、获客分析等,都能够快速地、简单地获得服务。
田永江强调:“在与华为合作的过程中,招行也在持续探索数据虚拟化引擎,目标构建统一的目录查询能力,解决找数难问题,力图用一个统一的入口解决取数难问题,而不是把所有的数据聚在一起。”
在数据使能和数据基础设施平台方面,招行与华为达成共识,双方联合成立了“联创实验室”,一方面加速建设鲲鹏生态,全面提升多元计算的能力。另一方面,也全面激活数仓双活能力。招行在多年的数仓运维过程中发现,在高度复杂、海量数据的情况下,远端的数据供给以及自身的技术复杂度方面都会遇到许多挑战,因此数仓的双活能力非常重要,高可用,尤其是双活系统的能力是评价数仓非常重要的一个标准。而华为GaussDB(DWS)这一方面也被招行寄予厚望。除此外,华为与招行的联创实验室还将进一步探索云数仓支持OBS存储的实践,包括在历史数据永久保存的前提下如何实现数据联合分析。
展望未来,招行希望与华为携手,基于GaussDB(DWS)构筑新一代数仓平台,助力实现“人人用数”,支撑行内创新持续前行。