探索中国CIO人才现状 | 第四季调研报告
银行应对大数据之道
2013-02-25  作者:企业网 

  “大数据时代”来临


  随着我们的生活进入信息时代,数据正在迅速膨胀并呈现出几何级数的增长,数据决定着银行的未来发展。虽然有些银行可能还没有意识到数据爆炸性增长带来的问题,但是数据对于银行的重要性已经成为业界的共识。


  进入2012年,一个新名词——“大数据”(BigData),迅速成为全球IT界的热点,以至于《纽约时报》惊呼“大数据时代已经降临”。


  所谓“大数据”可以归结为4个V,即:


  Volume(体量),数据的规模庞大、增长速度快,从TB(1000GB)级别,跃升到PB(1000TB)甚至EB(1000PB)、ZB(1000EB)级别。


  Variety(多样),数据的类型繁多、构成复杂,除了传统的结构化数据外,还包括了文字、语音、视频、文档、图片等多种非结构化数据。


  Value(价值),数据的价值潜力巨大,但隐藏较深,需要用综合多种复杂的分析算法对数据进行“提纯”。


  Velocity(速度),数据的处理速度快、时效性强,要进行实时或准实时的处理,并实时反馈处理结果。


  总体来说,大数据的主体是非结构化数据。在当前的数据构成上,80%的数据是非结构化或半结构化的,结构化数据仅有20%。如果说对于结构化数据的处理和分析已经较为成熟的话,那么,对于非结构化数据的处理和分析才刚刚起步,但已经呈现出一派生机勃勃的景象,这也正是人们惊呼“大数据时代已经降临”的原因。


  中国有着庞大的人群和应用市场,复杂性且充满变化,如此庞大的用户群体,使中国即将成为世界上最大数据的国家,探索以大数据为基础的解决方案,是中国的银行提高自身竞争力的重要手段。可以说,大数据时代对银行的数据驾驭能力提出了新的挑战,也为银行获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。


  银行应对之道


  在“大数据时代”,银行所面临的竞争不仅仅来自于同行业内部,外部的挑战也日益严峻。互联网、电子商务等新兴企业在产品创新能力、市场敏感度和“大数据”处理经验等方面都拥有明显的优势,一旦涉足金融领域,将对银行形成较大的威胁。日前,互联网公司阿里巴巴已开始在利用大数据技术提供金融服务,通过其掌握的电商平台阿里巴巴、淘宝网和支付宝等的各种信息数据,借助大数据分析技术自动判定是否给予企业贷款,全程几乎不用出现人工干预。这种基于“大数据”分析能力的竞争优势已明鲜显示了这种威胁的现实性和急迫性。


  数据将是未来银行的核心竞争力之一,这已成为银行业界的共识。应该说,银行对于传统的结构化数据的挖掘和分析是处于领先水平的,但一方面银行传统的数据库信息量并不丰富和完整,如客户信息,银行拥有客户的基本身份信息,但客户其他的信息,如性格特征、兴趣爱好、生活习惯、行业领域、家庭状况等却是银行难以准确掌握的;另一方面对于多种异构数据的分析是难以处理的,如银行有客户的资金往来的信息、网页浏览的行为信息、服务通话的语音信息、营业厅、ATM的录像信息,但除了结构化数据外,其他数据无法进行分析,更谈不上对多种信息进行综合分析,无法打破“信息孤岛”的格局。也就是说,在“大数据时代”,银行的数据挖掘和分析能力严重不足。


  因此,对于银行来讲,要拥有强大的“大数据”处理能力,才能使数据真正成为核心竞争力。


  构建银行强大的“大数据”处理能力应该是两条腿走路:


  一是要“走出去”。即与互联网社区、电子商务等企业进行深入的合作,获取更多的用户行为信息,从而开展“大数据”分析。这方面,很多商业银行已经开始了有益的尝试和探索。如中信银行(601998,股吧)、宁波银行(002142,股吧)等已经开始了银行网上社区的建设,为中小企业、个人用户提供开放的服务平台;光大银行(601818,股吧)与新浪微博合作进行舆情监控和开发缴费应用;而交通银行的电子商城已向普通用户开放注册账户,并为其提供一系列相应的服务。


  二是要“请进来”。即与各类数据分析的专业厂商合作,对银行已经存在的“大数据”进行综合处理与分析。银行与专业厂商在数据分析领域的合作有着悠久的历史,在传统结构化数据分析方面有着众多的成功案例,但由于“大数据”的分析处理仍处于初创的时期,各家银行和专业厂商都在进行探索。在这方面,交通银行信用卡中心应用智能语音云对银行的语音数据进行分析处理是一个较为成功的案例,为同业提供了很多有益的经验和启示。


  交通银行的探索


  交通银行信用卡中心的大量服务基于电话完成,客服、电销、信审、催收等部门包括自有和外包的电话服务人员总计达数千人,而且随着银行业务的不断扩展,人员规模还在持续增加。由于业务繁忙、工作压力大,员工的流失频率高,服务质量控制难度大。银行之间的信用卡业务竞争非常激烈,各行的信用卡部门经常推出新的服务或活动,不断冲击固有的市场,因此急需提高响应速度、应变能力和创新能力。


  面对以上问题,交通银行信用卡中心着眼于“大数据”的挖掘和分析,通过对海量语音数据的持续在线和实时处理,为服务质量改善、经营效率提升、服务模式创新提供支撑,从全面提升运营管理水平。


  交行信用卡中心最丰富的数据,是与客户电话沟通过程中的录音数据。录音数据是典型的非结构化数据,也是典型的“大数据”。一方面,数据不断累积,而且随着业务的繁忙,还在不断加速增长,存储和管理都较为麻烦,除了存储备用和少量的人工的质检调听外,几乎没有其他用途,海量数据大都成为了“沉没数据”;另一方面,大家都知道这些语音数据里蕴含了丰富的客户信息,如客户身份信息、客户偏好信息、服务质量信息、市场动态信息、竞争对手信息等,但由于技术的限制,一直没有有效的分析处理手段,数据的价值无法体现,具有丰富价值的数据却成为了“死数据”。


  交通银行信用卡中心的破局之道,是采用智能语音云(SmartVoiceCloud)产品对海量语音数据进行分析处理。智能语音云是新型数据服务平台,它采用了大规模异构数据的高效存管和流式数据处理机制,实现了海量语音数据的归集、处理、存储、调用和分析。


  交通银行信用卡中心对智能语音云的应用主要集中在四个方面:


  录音的高效检索。采用语音识别技术对海量语音内容进行分析识别,较准确的还原出每段录音的具体内容,通过输入语音内容中的关键词即可快速找到所需要的语音,大幅度提高了语音的使用效率,极大地方便了客户录音的检索和调用,为服务质量管理和风险控制提供了更高效的支撑。


  准实时自动质检。采用语义分析和情绪分析技术,通过预先定义的质检规则,对每段录音的内容进行自动检查,筛选出服务质量较差的录音,供质检人员进行人工检查和复核,改变了以往由质检人员随即抽查的质检方式,一方面大大提高了的质检部门的工作质量和工作效率,另一方面提升了服务质量的控制水平,服务改进的周期明显缩短。


  多维度业务分析。基于语音识别和语义分析的结果,综合多种类型数据分析算法,对海量语音的内容进行了多维度、多角度、全方位的深入分析,并以图形化方式直观的呈现出来。目前应用的话务量结构分析、话务异常原因分析、客户流失原因分析、业务热点趋势分析等,已经对提高对市场的反应能力、促进经营效率的改善起到了较为明显的作用。


  声纹识别与语音导航。采用了基于声纹分析的对话识别技术,利用人类声纹的独特性,快速、准确地分辨出通话人的身份,提供了安全、便捷的客户身份验证方式和渠道,一方面为服务流程的改善提供了新的方法,另一方面为服务模式的创新提供了新的思路。


  交通银行信用卡中心的智能语音云于2011年9月开始,2012年2月11日一期产品正式上线投产。目前,数据处理时效采用T+1的准实时方式,每天平均数据处理量约5000小时、20GB,高峰日超过100GB,历史语音检索调听花费的时间从3~5个工作日缩短为5分钟,检索反馈时效低于100毫秒,调听反馈时效低于1秒,系统整体可用性达到了99.9%,达到了预期的指标,取得了令人满意的效果。后续拟基于当前平台陆续增加自动质检和业务分析应用,预计实施完成后,质检覆盖率可提高到70%以上,违规行为检出率可提高到15%以上。


  交通银行采用的智能语音云是平台架构,各项服务既能单独成为独立的向客户提供专项服务,也可以根据客户的需要将多种服务灵活组合。由于采用了基于业务需求的持续迭代开发方式,智能语音云将采取分期实施方式,根据业务需要逐步增加应用内容,从而减少了产品生产与项目实施的风险。这也是交通银行信用卡中心选择智能语音云的重要原因。


  通过对智能语音云的应用,交通银行信用卡中心的海量语音数据得到了深入的挖掘和应用,对提高工作效率、改善服务质量起到了明显的作用,为创新服务模式提供了很多新的方法和途径,对经营效率的提升和运营管理水平的起到了良好的推动作用。


  信息时代的到来,给银行业带来了前所有为有的一波又一波的强烈冲击,通讯工具的普及催生了电话银行,互联网的浪潮催生了网上银行,移动互联网的兴起催生了手机银行。那么,“大数据时代”的到来又会给银行带来怎样的变化?这是一个银行必须面对和回答的问题,能否交出一份漂亮的答卷很可能决定银行的未来。银行对这个问题的探索和尝试正在进行,生活中的我们作为银行用户也在期待答案。