什么是监视?
Posted: Thu Feb 20, 2025 5:39 am
监视是采取主动措施以获取对服务的见解的过程。这些见解可能与系统状态,内存使用情况或其他方面有关,具体取决于您的用例。
与大多数任务一样,手动完成任务既艰辛又效率低下。而且,不可能跟踪,记录,管理和审查它们,或者提醒人们它们已完成。
自动化是答案–,但是哪些功能对您的监控工具很重要?而且,这些工具本身不会消耗资源吗?
普罗米修斯
Prometheus是SoundCloud的一个开源项目,始于2012年。根据Cloud Native Computing Foundation(CNCF)的说法,它是云原生生态系统中最受欢迎的项目之一。
普罗米修斯最简单的形式是,以您指定的间隔从您指定的来源连续收集数据。例如,“每两分钟捕获一次名为Name1的节点的CPU使用情况。” 数据源称为“目标,”数据称为“指标”,带有时间戳的收集过程称为“时间序列数据。” The 警报管理器 根据指标向利益相关者发送警报。
普罗米修斯使用 拉模型,它与目标(应用程序)交互以收集数据。目标必须使用Prometheus格式公开指标。
要查看指标,可以使用PromQL,这是一种旨在与Prometheus一起使用的查询语言。
Prometheus的好处之一是它通过公开使用量度来监视自己。尽管您获得了一些基本指标 马其顿电话号码列表 的视觉效果,但它不够强大,无法提供深入的见解。 格拉法纳 可用于扩展和抽象普罗米修斯的复杂性。
格拉法纳
Grafana是一种开源数据分析解决方案。简而言之,它从一个或多个来源获取数据,对其进行分析并以视觉方式呈现。就我们而言,数据源来自普罗米修斯。您可以查询和分析指标,而不必编写PromQL查询。
Grafana还简化了为警报添加新联系点(电子邮件,松弛等)的过程。
例子
现在,让我们练习到目前为止所学的知识。假设您是一名管理员,并负责实施一个系统,该系统可以检测Kubernetes作业何时失败并发出警报。以下是最简单的方法来配置此过程;
步骤1:确定可以帮助您实现此目标的指标。
与大多数任务一样,手动完成任务既艰辛又效率低下。而且,不可能跟踪,记录,管理和审查它们,或者提醒人们它们已完成。
自动化是答案–,但是哪些功能对您的监控工具很重要?而且,这些工具本身不会消耗资源吗?
普罗米修斯
Prometheus是SoundCloud的一个开源项目,始于2012年。根据Cloud Native Computing Foundation(CNCF)的说法,它是云原生生态系统中最受欢迎的项目之一。
普罗米修斯最简单的形式是,以您指定的间隔从您指定的来源连续收集数据。例如,“每两分钟捕获一次名为Name1的节点的CPU使用情况。” 数据源称为“目标,”数据称为“指标”,带有时间戳的收集过程称为“时间序列数据。” The 警报管理器 根据指标向利益相关者发送警报。
普罗米修斯使用 拉模型,它与目标(应用程序)交互以收集数据。目标必须使用Prometheus格式公开指标。
要查看指标,可以使用PromQL,这是一种旨在与Prometheus一起使用的查询语言。
Prometheus的好处之一是它通过公开使用量度来监视自己。尽管您获得了一些基本指标 马其顿电话号码列表 的视觉效果,但它不够强大,无法提供深入的见解。 格拉法纳 可用于扩展和抽象普罗米修斯的复杂性。
格拉法纳
Grafana是一种开源数据分析解决方案。简而言之,它从一个或多个来源获取数据,对其进行分析并以视觉方式呈现。就我们而言,数据源来自普罗米修斯。您可以查询和分析指标,而不必编写PromQL查询。
Grafana还简化了为警报添加新联系点(电子邮件,松弛等)的过程。
例子
现在,让我们练习到目前为止所学的知识。假设您是一名管理员,并负责实施一个系统,该系统可以检测Kubernetes作业何时失败并发出警报。以下是最简单的方法来配置此过程;
步骤1:确定可以帮助您实现此目标的指标。