Nginx有两套日志,一套access.log一套error.log,access.log是可以用户自定义,两套日志处理好,业务的质量就了然于心了,另外,日志关键指标可视化分析我认为是运维中最重要的事情了,没有之一...
2019-05-13 798℃ 矢量bit 5 喜欢
有这么一种场景,grafana同一个dashboard需要进行多个业务切换查看不同指标的变化,或从idc看到单个或某几个host,其实就是关联钻取,进而进行问题的分析,zabbix是可以实现的,但用e...
2019-01-16 937℃ 矢量bit 8 喜欢
在做日志分析和日志清洗时,最重要的知识之一就是正则表达式和grok正则解析,可能谁都懂一点,但要系统的知道吃透了的也不多,作为一个基础工具知识,现做下整理,方便查阅。 正则表...
2018-07-17 829℃ 矢量bit 6 喜欢
服务器、应用程序、业务的健康情况和产品的各运营指标都藏在服务器产生的数据里,运维使用这些数据可以做成服务质量、服务性能、服务容量的监控告警,也可为运营部门出各种...
2018-06-19 868℃ 矢量bit 8 喜欢
需求是小日志量下,通过filebeat收集多套日志,发送到logstash的5044端口,通过logstash进行分离清洗,然后分别建立索引,好了上配置文件。 日志格式如下 日志1:2018-06-1403:03:04|tj1-sre-te...
2018-06-14 1139℃ 矢量bit 4 喜欢
处理的是nginx日志,场景是不同业务域名有一套独立的access.log和error.log,需求是通过filebeat采集后推送到不同的kafka,配置文件如下: filebeat.prospectors:-type:logenabled:truepaths:-/home/work/log/...
2018-06-13 1013℃ 矢量bit 7 喜欢
在elk集群搭建过程中,为了极大程度的利用服务器资源,kafka、zookeeper、logstash规划混跑在了同一组服务器上。随着业务量的增加,要频繁增加调整kafka的topic,出现问题时还要去服务器敲命令查...
2018-05-24 3225℃ 矢量bit 34 喜欢
网络属于基础资源,每当收到告警时总难免要先看一下网络有没有问题,即时没有收到网络方面的通告,业务开发也难免怀疑是网络抖动导致,每次找网络部门查,查多了也伤感情,在...
2018-05-24 346℃ 矢量bit 3 喜欢
不管什么业务,吞吐量的本质是木桶原理,能跑多大量取决于木桶最短那个板(脑袋里是不立刻出现了木桶模型,哈哈)!!换句话说,当有能力提高短板的高度时,业务的吞吐量就会上升,但...
2018-05-16 4046℃ 矢量bit 43 喜欢
实时日志分析作为掌握业务情况、故障分析排查的一个重要手段,目前使用最多最成熟的莫过于ELK方案,整体方案也有各种架构组合,像(Rsyslog/filebeat/...)->Elastic->Kibana、(Rsyslog/filebeat/...)->Redis...
2018-04-15 9550℃ 矢量bit 146 喜欢