5分钟完成业务实时监控系统搭建,是一种什么样的体验?

 

凌云时刻 · 故事

导读:从前端、应用至底层机器,ARMS 实时监控应用服务的每一次运行、每一个慢 SQL、每一个异常。

作者|折松

来源|阿里巴巴中间件

前言

深圳市道旅旅游科技股份有限公司(以下简称:道旅)是一家总部位于中国的全球酒店资源批发商。自 2012 年成立以来,道旅凭借其全球优质的直签产品和丰富的第三方产品,以及顶尖的技术实力,赢得了包括 OTA、差旅管理公司、航空公司、旅行社等超过 23,000 家客户的信赖和支持。在资源端,道旅不仅有超过 30,000+ 具有竞争力的直签酒店资源,并且拥有来自于 600+ 全球供应商的 70 万家酒店,资源覆盖了全球超过 200 个国家或地区。

道旅从未停下脚步,始终专注于为同业提供可靠的服务和有竞争力的资源,并加速在直签资源的布局,让同业伙伴的旅游生意更好做!道旅一路走过,收获喜人:

  • 2018 年单日交易额突破 1000 万,获得深创投,国隆资本联合投资。

  • 2019 年单日交易额突破 1800 万,荣膺 2019 深圳 500 强企业。

  • 2020 年获得广东省旅行社百强第二名。

新的需求

道旅需要构建一个全面的指标监控系统,既包括系统的业务指标:如各类业务类型的请求数变化,不同供应商信息的变化,客户请求的明细大盘,各酒店请求量的排名变化,不同城市的订单转换率分析报表等;也包括系统的运行指标:如服务器请求响应时间, 带宽使用情况;

在选型上主要考虑点有:

1. 指标监控系统的挑战主要有请求量大,集群和监控类别多

2. 指标监控系统需要实时性配置简单,可以让业务部门去做定义报表。

3. 指标监控系统构建简单,尽可能减少管理的组件数,可用性要求高,性能要求高的特点。

评估了市场上的监控产品之后,道旅选择了阿里云应用实时监控服务 ARMS。它是一个云原生一体化可观测性平台,可以提供全栈式的性能监控和端到端的全链路追踪诊断能力。

从前端、应用至底层机器,ARMS 实时监控应用服务的每一次运行、每一个慢 SQL、每一个异常。ARMS 提供了完整的数据大盘监控,展示请求量、响应时间、FullGC 次数、慢 SQL 和异常次数、应用间调用次数与耗时等重要的关键指标,时刻了解应用程序的运行状况,确保提供最优的使用体验。

ARMS 官网展示

相比开源使用 pinpoint 和 skywalking,阿里云 ARMS 提供了移动端、前端、后端服务主机资源监控一体化,全视角洞悉系统性能问题,企业无需自己构建,几分钟就能有一个完整的运维监控平台。对于首次构建业务监控系统的企业来说,ARMS 是首选。

道旅使用 ARMS 自定义监控支持的监控任务类型和创建流程,通过配置接入数据源、清洗日志和创建数据集三个关键步骤,快速自定义监控任务。借用 ARMS 完成流式计算服务的工作,整个方案配置简单,读写性能好,不需要维护存储,能快速生成监控数据。

通过道旅监控接口系统 Dida 获取 ARMS 产生的监控数据,并提供给 Grafana,可以方便地生成各种报表。

新的改变

道旅通过使用 ARMS,在业务监控、运维搭建、成本优化等方面效果显著。

实时业务大盘:通过 ARMS 提供的可视化数据清洗任务,创建出来的业务大盘实时性好,可以一目了然地知道业务的变化,指导公司的经营与决策。

运维搭建简单:使用 ARMS 不需要搭建流式计算系统,也不需要提供昂贵的存储,通过简单的配置就可以生成目标监控数据集,非常方便。

更优化的成本:使用 ARMS 的方式构建业务指标系统,在实时性满足的情况下,对于道旅来说,比其他方式的大数据方案更具有竞争力。

正如道旅 CTO James 在应用 ARMS 之后感叹:“凭借 ARMS,道旅 IT 人员能够在 5 分钟内搭建和启动基于大数据平台的业务实时监控系统,在充分发挥数据监控时效性的同时,大幅提升了 IT 人员效率!”

产品答疑

 非阿里云用户是否可用?

可用,无论客户是公有云/专有云/ 混合云/自建 IDC,无论什么云厂商,只要在公网可访问就能通过 ARMS 来监控。

 接入 ARMS 是否需要修改代码?

不需要改动代码,加载探针即可实现监控。

 ARMS 支持哪些监控?

ARMS 支持 Java、PHP 应用监控以及用户体验监控(Web 端和移动端),各种组件及业务监控(Prometheus 托管)。

END

往期精彩文章回顾

企业 IT 治理沙龙·北京站:业务优先?治理优先?您的企业是哪种上云姿势?

轻松玩转全链路监控

连续 3 年支撑双 11,阿里云神龙如何扛住全球流量洪峰?

Cloud Native Infrastructures Meetup 精彩回顾(内含 PPT 下载)

降本增效利器!趣头条 Spark Remote Shuffle Service 最佳实践

ECS 云助手,实现云上运维自动化

米熊科技:给烘培加点“云”的味道

服务器迁移中心 SMC 最佳实践及新特性介绍

云原生体系下的技海浮沉与理论探索

最后7天!阿里云2020云内存数据库峰会现场参会报名中


长按扫描二维码关注凌云时刻

每日收获前沿技术与科技洞见

相关推荐