8月12-13日,O'Reilly Velocity China 2014 Web 性能与运维大会北京站盛大召开,全国乃至世界范围内的IT界的幕后精英们聚集一堂,前台亮相,探讨和分享大数据时代下,数据和服务系统运营的全新挑战和宝贵经验。构建更快速、更健壮的 Web,海量数据处理的效率和稳定性,直接关系到绝大多数网络应用,也是IT企业实力的重要体现。本次大会期间,国内互联网厂商八仙过海,各显神通,其中搜狗向业界展示了其商业运维自动化改造的经验与心得,更是受到了同行的广泛认同和好评。
近年来,互联网市场规模持续高速增长,虽然这顶轿子越来越大也越来越华丽,抬轿子的任务也更重更艰难了。用户眼中强大的web 应用、安全可靠的企业数据、分布式计算,在配置、管理和运维方面均面临许多困难,如系统初始化繁琐、权限管理复杂 、数据存取是否安全可靠、故障如何快速定位等。在互联网业务高速发展过程中,系统的可用性和易用性直接影响用户体验。因此,搜狗商业团队高度重视系统运维,通过持续优化和改进,目前在自动化运维方面取得了突破性进展。
“数据库的运维包括部署安装、性能优化、备份容灾、故障恢复、预防性巡检等工作”搜狗商业数据库负责人王林平向记者解释道,“这几个方面都存在不少重复度高、工作量大的任务,有的甚至还可以并行处理,这些都是搜狗运维自动化的重点目标。通过优化这些工作,我们在投入较少人力的情况下,实现了对大规模集群的高效管理,满足了sogou业务的快速发展需求。
俗话说,好钢用在刀刃上,磨刀不误砍柴工,搜狗在这方面为业界做出了漂亮的示范。经过自动化改造,搜狗商业平台运维部的实现了数据库的“一键部署”,将原本耗时30到40分钟的人工繁琐部署过程,浓缩至自动化分钟级的一键部署解决方案,大大提升了工作效率;数据库的自动监控系统表现同样出色,不仅实现了从硬件和软件实例的全方位监控,还能根据自定义阈值及时有效地对数据库的异常进行报警。为更好的提升客户体验,sogou商业运维团队结合自身业务特点探索出“搜狗商业数据库健康评价体系”,并定期生成自动化评估报告,弥补了传统 “故障驱动”方法的缺陷,使得性能隐患得以提前发现,有效提升了系统的稳定性。同时,sogou商业运维团队也在数据库安全存储、异地备份和容灾方面做出了积极努力,为sogou商业客户的数据安全和系统可靠性起到了保驾护航的作用。
商业平台研发部数据架构师 王林平
“运维自动化体系形成之前,我们DBA的日常例行工作在总工作量中占比较高,很消耗人力,员工疲于奔命但工作效率不高,也很容易出差错。自动化平台把我们的员工从繁琐的常规工作中解放出来,更专注于做架构优化类有创造性的工作,效率也有了进一步的改善。” 王林平介绍道。
对搜狗所展示的运维自动化系统,国内同行普遍给予了正面的评价。一位相关评论人认为,搜狗近年来始终处于业务高增长的态势下,今年Q2财报更是报出营收同比增长高达66.7%,这使得搜狗所面临的技术问题较之国内其他IT巨头更具挑战性。在这样的背景下,无论从过往的用户调查或是从本次报告来看,搜狗对其数据处理量的爆炸性增长可谓应对自如,甚至在与腾讯联手的过程中也实现了平滑过渡。如此佳绩不仅体现出搜狗坚实的技术实力,更向整个行业充分展示了大数据时代自动化运维技术的重要价值。