27得票6回答
如何查找存储在Prometheus LevelDB中的时间序列数量

我负责维护我们公司的Prometheus服务器。但是指标是由各个团队提供的。 有没有办法找出Prometheus数据库中存储的时间序列数量?我们正在使用默认的LevelDB数据存储方式。 我需要这些值来判断是否需要调整我们的Prometheus实例的本地存储设置。 谢谢你的帮助。

11得票4回答
在RHEL7上,你如何区分崩溃和重启呢?

有没有办法确定RHEL7服务器是通过systemctl(或reboot / shutdown别名)重新启动的,还是服务器崩溃了?在使用Pre-systemd之前,可以通过last -x runlevel相对容易地确定,但在RHEL7中就不太清楚了。

10得票1回答
如何最好地监控Windows服务器?

我在一家为我们的小型企业客户提供IT支持的公司工作。我的任务之一是执行服务检查,其中包括检查事件查看器中的关键错误/警告以及DHCP和DNS管理控制台。客户工作站的事件查看器也会被定期检查,但不如服务器频繁。 是否有一个现有的解决方案,可以集中查看所有这些日志,这样我就不必远程访问每个服务器...

8得票2回答
负载平均值大于EC2计算单元的数量

在一个EC2 m1.large实例上,有一个如下所示的平均CPU利用率图表: 如何可能负载平均值大于 EC2 计算单元数(4)? cat /proc/loadavg 5.78 5.57 5.44 1/188 9388

7得票2回答
无代理监控:它是如何工作的?与传统监控相比有哪些优势?

无代理监控是如何工作的? 从我所了解的(或者不了解的)来看,似乎是通过从中央服务器登录到被监控节点,并在其上上传和运行脚本来实现的? 代理基础监控和无代理监控之间的主要区别是什么?在使用无代理监控解决方案时,我可以期待哪些优势和劣势?

7得票4回答
SNMP服务安全选项卡丢失 - Windows Server 2012 R2 - DC

我需要为Windows Server配置SNMP服务的安全设置,但它们不见了! 以下是事实: - 操作系统:Windows Server 2012 R2 - 我已经安装了SNMP功能,并且我相信我已经配置了该服务(但我忘记在“安全”选项卡下添加另一个IP) - 我知道安装完功能后必须重新启...

7得票1回答
如何在Monit中重新启动和警报,如果条件匹配?

如何在条件匹配时执行多个操作?例如,如果我想重新启动一个进程并发送警报电子邮件。我知道我可以用两行分别完成它们,但我能否将它们合并? if cpu > 95% for 2 cycles then restart if cpu > 95% for 2 cycles then ale...

6得票1回答
可用性期间开始时的Nagios OK通知

我正在监控一个应用程序,它在营业时间开始前启动,并在一天结束时关闭,使用的是Nagios 4.3。我已经配置了通知周期,使其在应用程序预计启动后的3分钟内开始。我希望Nagios在通知周期开始时,如果发现应用程序处于良好状态,发送一个OK警报。您有什么建议吗? 另外,我希望在通知周期开始时收...

5得票2回答
iotop不显示写入操作。

磁盘上可能写了什么,iotop没有显示出来? # iotop -a Total DISK READ: 8.19 M/s | Total ****DISK WRITE: 3.34 M/s**** TID PRIO USER DISK READ DISK WRITE> S...

5得票1回答
GCP虚拟机磁盘空间警报

如何配置GCP的监控套件以查看磁盘利用率(以总空间使用量为单位,而不是IOPs)? 在指标资源管理器中,我只看到了一种“磁盘使用”指标,似乎是按每秒计算的某种单位。 我的最终目标是在磁盘达到某个阈值(例如85%)之前设置警报,以防止其填满。