elk_网咖社—壹起思考探索实践|DevOps|应用运维|AiOps|tank手记|原创

Logstash对nginx的access/error.log日志清洗并数据可视化监控设计

Nginx有两套日志，一套access.log一套error.log，access.log是可以用户自定义，两套日志处理好，业务的质量就了然于心了，另外，日志关键指标可视化分析我认为是运维中最重要的事情了，没有之一...

2019-05-13 798℃ 矢量bit 5 喜欢

有这么一种场景，grafana同一个dashboard需要进行多个业务切换查看不同指标的变化，或从idc看到单个或某几个host，其实就是关联钻取，进而进行问题的分析，zabbix是可以实现的，但用e...

2019-01-16 937℃ 矢量bit 8 喜欢

服务器、应用程序、业务的健康情况和产品的各运营指标都藏在服务器产生的数据里，运维使用这些数据可以做成服务质量、服务性能、服务容量的监控告警，也可为运营部门出各种...

2018-06-19 868℃ 矢量bit 8 喜欢

在elk集群搭建过程中，为了极大程度的利用服务器资源，kafka、zookeeper、logstash规划混跑在了同一组服务器上。随着业务量的增加，要频繁增加调整kafka的topic，出现问题时还要去服务器敲命令查...

2018-05-24 3225℃ 矢量bit 34 喜欢

实时日志分析作为掌握业务情况、故障分析排查的一个重要手段，目前使用最多最成熟的莫过于ELK方案，整体方案也有各种架构组合，像(Rsyslog/filebeat/...)->Elastic->Kibana、(Rsyslog/filebeat/...)->Redis...

2018-04-15 9550℃ 矢量bit 146 喜欢

logstash在整个日志分析方案中起到了数据清洗的作用，在向es推数据时一个很重的细节是timestamp的设定，如果按照流时间走默认值，是不利于后期的分析的，所以需要通过各种方式将日志...

2017-12-13 1903℃ 矢量bit 3 喜欢

随着日志量的增加，es在不停的调整，结构层面的冷热数据分离、master和client节点的分离并引入部落节点，es集群层面的index优化、flush优化、merge优化、内存熔断优化，系统层面的GC、文...

2017-08-16 1962℃ 矢量bit 36 喜欢

业务中通过rsyslog监控本地文件收集了一些redis和mc的慢日志，推到elk集群分析，这些日志一天一个文件，每晚零点5分通过计划任务用软连接的方式将新的文件固定到指定文件下，但是最...

2017-06-13 1038℃ 矢量bit 12 喜欢

ES老集群用的2.4.1版本，跑的比较好就一直没动，最近看资料ES5.X已经稳定，并且性能有较大提升，心里就发痒了，但由于业务要保持高可用的属性，就得想一个平滑升级的方案，最后想到了多实...

2017-04-10 809℃ 矢量bit 11 喜欢