John的笔记
首页
搜索
⌘ K
中文
首页
/
全栈可观察性从 0 到大师
全栈可观察性从 0 到大师
Full-Stack Observability: From Zero to Guru - 本课程将带你从零开始学习全栈可观察性,涵盖从基础概念到生产实践的完整内容。
可观察性
•
19 个章节
•
171 堂讲座
19
章节
171
讲座
20-25
小时
课程内容
可观察性基础概念
00.1
什么是可观察性
00.2
三大支柱 Traces Metrics Logs
00.3
信号关联 为什么需要关联
00.4
课程项目介绍 ShoeHub电商系统
从单体到微服务
01.1
单体架构vs微服务架构
01.2
分布式系统的复杂性
01.3
可观察性的价值
01.4
行业案例 真实企业实践
01.5
讨论 你的组织面临的挑战
OpenTelemetry架构概览
02.1
OpenTelemetry是什么
02.2
核心组件 API SDK Collector
02.3
数据流 从应用到可视化
02.4
自动插桩vs手动插桩
02.5
采样策略 控制成本和数据完整性
02.6
语义约定 标准化属性命名
Prometheus安装与配置
03.1
Prometheus简介
03.2
安装Prometheus 多平台
03.3
Prometheus配置基础
03.4
Node Exporter 系统指标收集
03.5
Prometheus数据模型
03.6
PromQL查询语言基础
03.7
PromQL高级查询
03.8
使用Docker Compose部署Prometheus
03.9
练习 Prometheus实战
03.10
Prometheus最佳实践
Grafana安装与基础使用
04.1
Grafana简介
04.2
安装Grafana 多平台
04.3
Grafana配置基础
04.4
连接Prometheus数据源
04.5
Grafana界面导航
04.6
使用Docker Compose部署Grafana Stack
Grafana Dashboard创建基础
05.1
Dashboard设计最佳实践
05.2
创建第一个Dashboard
05.3
时间序列面板 Time Series
05.4
图表类型选择
05.5
数据转换 Transformations
05.6
变量 Variables 和动态Dashboard
05.7
阈值和告警状态
05.8
注释 Annotations
05.9
仪表盘链接和跳转
05.10
练习 创建ShoeHub基础设施Dashboard
Grafana Loki日志管理
06.1
Grafana Loki简介
06.2
安装Loki和Promtail
06.3
Promtail配置
06.4
静态标签vs动态标签
06.5
LogQL查询语言
06.6
在Dashboard中可视化日志
Grafana Alloy和OpenTelemetry Collector
07.1
Grafana Alloy简介
07.2
安装Grafana Alloy
07.3
Alloy配置基础
07.4
配置Alloy接收OpenTelemetry信号
07.5
Alloy数据处理和路由
07.6
Alloy导出到Grafana Stack
07.7
Alloy高级配置
07.8
练习 配置Alloy处理微服务数据
Grafana Tempo分布式追踪
08.1
分布式追踪基础
08.2
Grafana Tempo简介
08.3
安装Grafana Tempo
08.4
配置Alloy转发Traces到Tempo
08.5
在Grafana中查询Traces
08.6
TraceQL查询语言
后端集成 Java Spring Boot OpenTelemetry
09.1
Spring Boot项目初始化
09.2
添加OpenTelemetry依赖
09.3
OpenTelemetry配置
09.4
自动插桩 HTTP请求追踪
09.5
自动插桩 数据库查询追踪
09.6
自动插桩 消息队列追踪
09.7
手动插桩 自定义业务Span
09.8
Metrics收集 自定义业务指标
09.9
Logs关联 Trace ID注入
09.10
完整示例 订单服务实现
09.11
测试和验证
09.12
生产环境配置
09.13
微服务间追踪传播
09.14
性能优化
09.15
练习 构建完整的后端服务
前端集成 React OpenTelemetry
10.1
React项目初始化
10.2
OpenTelemetry Web SDK安装
10.3
初始化OpenTelemetry SDK
10.4
自动插桩 页面加载追踪
10.5
自动插桩 用户交互追踪
10.6
自动插桩 网络请求追踪
10.7
自动插桩 错误捕获
10.8
手动插桩 自定义业务事件
10.9
前后端追踪关联
10.10
Core Web Vitals监控
10.11
用户会话追踪
10.12
React Router集成
10.13
性能监控
10.14
完整示例 ShoeHub前端应用
10.15
前端最佳实践
数据库监控和追踪
11.1
数据库监控概述
11.2
SQL查询追踪
11.3
数据库连接池监控
11.4
数据库性能指标
11.5
数据库Dashboard设计
全栈 Dashboard 设计实战
12.1
Dashboard设计方法论
12.2
前端性能Dashboard
12.3
后端服务Dashboard
12.4
基础设施Dashboard
12.5
业务指标Dashboard
12.6
端到端追踪Dashboard
12.7
前后端关联Dashboard
12.8
数据库Dashboard
12.9
Dashboard联动和跳转
12.10
实践 构建ShoeHub完整Dashboard集
12.11
Dashboard分享和协作
12.12
移动端Dashboard
故障排查 Troubleshooting 实战
13.1
故障排查方法论
13.2
场景1 API响应慢
13.3
场景2 错误率突然上升
13.4
场景3 数据库连接池耗尽
13.5
场景4 前端性能问题
13.6
场景5 微服务调用失败
13.7
场景6 内存泄漏
13.8
场景7 缓存命中率低
13.9
使用TraceQL进行复杂查询
13.10
使用LogQL进行日志分析
13.11
告警和通知配置
13.12
故障演练 Runbook
13.13
实践 完整的故障排查演练
KPI 定义和量化指标
14.1
KPI基础概念
14.2
SLO SLI SLA定义
14.3
技术KPI设计
14.4
业务KPI设计
14.5
从Traces到KPI
14.6
从Metrics到KPI
14.7
从Logs到KPI
14.8
KPI Dashboard设计
14.9
KPI告警配置
14.10
实践 为ShoeHub定义KPI
14.11
KPI追踪和报告
14.12
KPI最佳实践
用 KPI 驱动 OKR 落地
15.1
OKR基础概念
15.2
从KPI到OKR
15.3
工程团队OKR案例
15.4
业务团队OKR案例
15.5
跨团队OKR协作
15.6
OKR Dashboard设计
15.7
定期回顾和调整
15.8
实践 构建OKR Dashboard
15.9
OKR工具集成
15.10
OKR最佳实践
Grafana Mimir 大规模指标存储
16.1
Grafana Mimir简介
16.2
单体模式部署
16.3
微服务模式部署
16.4
AWS S3后端存储
16.5
Mimir告警管理
16.6
Mimirtool使用
16.7
从Prometheus迁移到Mimir
16.8
性能调优
高级主题和最佳实践
17.1
AI辅助可观察性
17.2
成本优化
17.3
安全性和合规
17.4
多环境管理
17.5
可扩展性设计
17.6
灾难恢复
17.7
性能测试
17.8
监控可观察性系统
17.9
团队协作和知识共享
17.10
常见问题和解决方案
17.11
2026年趋势展望
17.12
持续学习和改进
综合实战项目
18.1
项目需求分析
18.2
环境搭建
18.3
后端服务集成
18.4
前端应用集成
18.5
Dashboard创建
18.6
告警配置
18.7
故障排查演练
18.8
项目总结和优化