作者因拥有过多分散的监控仪表板而感到困扰,决定构建一个统一的解决方案Ridgeline来整合所有监控数据,以提高工作效率和系统可见性。
#monitoring
17 条相关内容
作者用 C++ 构建了一个轻量级生产监控系统 PulseGrid,旨在探索不依赖重型框架的现代后端运行时。该系统能够监控 HTTP 端点、追踪正常运行时间和延迟,并通过 WebSocket 实时推送更新。其架构清晰,分为领域层、应用层、基础设施层和表示层,运行在低成本 VPS 上并处理真实流量。项目基于 Vix.cpp 框架开发,源代码已开源在 GitHub 上。
Grafana 13
2.0Grafana 13 版本发布,带来了多项新功能和改进,包括增强的可视化选项、性能优化以及更好的用户体验,帮助用户更高效地监控和分析数据。
pg_roast是一个Postgres扩展,它会以幽默而严厉的方式评估你的数据库设计,指出各种问题并给出尖锐的批评,帮助开发者发现潜在的性能和架构缺陷。
本文介绍了如何在资源有限的微型VPS上,用更轻量级的Gatus替代Uptime Kuma进行服务监控,实现每年仅1.20美元的低成本运行方案。
OpenData Timeseries 提供了一种在对象存储上存储和查询时间序列数据的新方法,兼容Prometheus格式,使大规模指标管理更加经济高效。
AI智能体的可观测性
2.0本文探讨了AI智能体可观测性的重要性,介绍了监控和追踪AI系统行为的关键方法,帮助开发者理解模型决策过程、检测异常并提升系统可靠性。
本文介绍了如何使用AppSignal监控工具来跟踪虚拟专用服务器(VPS)的CPU和内存使用情况,帮助开发者及时发现性能问题并优化资源分配。
我们构建了一个指标模拟器
1.5我们开发了一个指标模拟器工具,用于生成和测试监控指标,帮助团队在真实数据可用之前验证告警规则和仪表板配置。
本文介绍了可观测性工具Signoz自身如何构建其内部可观测性系统,展示了他们如何实践自己所倡导的理念,通过详细的架构和实现方案为其他团队提供参考。
这是一个用于Linux系统中RDMA(RoCE)网卡统计数据的Prometheus导出器,能够收集和暴露RDMA设备的性能指标,便于通过Prometheus进行监控和告警。
Evlog是一个专注于广泛事件日志记录的平台,提供全面的日志管理和分析功能,帮助用户追踪和监控系统活动。
Vale 可观测性指标
1.0Vale 可观测性指标提供了一套全面的监控工具,帮助开发者和运维团队实时追踪系统性能、识别潜在问题并优化应用程序的运行状态。
该工具提供了一个仪表板,用于监控和管理您的 Pi 或 OMP 会话,让您能够实时跟踪会话状态、性能指标和资源使用情况。
本文介绍了如何通过回溯采样技术优化OpenTelemetry中的尾部采样,这种方法能够在数据收集后重新评估采样决策,提高分布式追踪系统的效率和成本效益。
作者通过亲身经历说明,在某些情况下,通过命令行工具打印文本表格比网页表格更简单实用。在断电故障排查中,同事使用"promdownhosts"脚本快速获取宕机主机信息,并能方便地过滤数据,这比网页仪表板更灵活高效。
欧盟多国(以丹麦为首)正推动强制WhatsApp/Signal等应用使用人工智能扫描用户所有照片和链接。若AI怀疑内容可能涉及儿童色情,用户的照片、位置、电话号码等数据将被上报给欧洲刑警组织和当地警方。