服务器、应用程序、业务的健康情况和产品的各运营指标都藏在服务器产生的数据里,运维使用这些数据可以做成服务质量、服务性能、服务容量的监控告警,也可为运营部门出各种
服务器、应用程序、业务的健康情况和产品的各运营指标都藏在服务器产生的数据里,运维使用这些数据可以做成服务质量、服务性能、服务容量的监控告警,也可为运营部门出各种指标数据,仅仅使用counter计数监控告警是不够的,还需要一套强有力的数据分析方案,能查到数据详细,多维度聚合分析,目前把我实践中使用的方案做个梳理,同时也是小数据到大数据的架构演进,由于运维的数据分析偏实时多维度,前期使用elk体系方案即可,后续根据实际需要加入hadoop体系,存储历史数据,跑一些老数据的job。
“运维网咖社”原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处、作者信息和本声明。否则将追究法律责任。http://www.net-add.com
©本站文章(技术文章和tank手记)均为社长"矢量比特"工作.实践.学习中的心得原创或手记,请勿转载!
欢迎扫描关注微信公众号【运维网咖社】
社长"矢量比特",曾就职中软、新浪,现任职小米,致力于DevOps运维体系的探索和运维技术的研究实践. |