分布式链路追踪—SkyWalking网站首页 技术交流

分布式链路追踪—SkyWalking

hdn_kb 2023-06-02 12:00:03

简介分布式链路追踪—SkyWalking

文章目录

1. 总览
2. 为什么要使用分布式链路追踪
3. 了解OpenTracing
- OpenTracing数据模型
4. 使用分布式链路追踪的好处
5. SkyWalking相关问题思考

1. 总览

在这里插入图片描述

2. 为什么要使用分布式链路追踪

在微服务架构中会存在以下问题：

排查问题难度大，周期长
特定场景难复现
系统性能瓶颈分析较难（如请求耗时、异常、响应慢的原因）

3. 了解OpenTracing

OpenTracing 提供了一套标准：提供与平台和厂商无关的API

OpenTracing数据模型

Trace：一个完整的请求链路
Span：内部的每一次调用过程，需要有开始时间和结束时间
SpanContext：Trace的全局上下文信息，包含traceId

4. 使用分布式链路追踪的好处

自动采集数据
数据分析，可形成一条完整的调用链
数据可视化：每个组件的性能可视化（可展示耗时、状态、IP的等等），能够帮助我们很好地定位系统的瓶颈，即使找到问题所在

5. SkyWalking相关问题思考

5.1 如何自动采集数据

SkyWalking采用插件化+javaagent的形式实现了span数据的自动采集，做到对代码无侵入性

5.2 如何跨进程传递

数据包含header和body，body存放着业务数据，可以把链路数据context通过数据的header进行传递

5.3 traceId如何保证全局唯一

采用本地生成ID的方式：雪花算法。由于雪花算法存在时间回调的问题，会导致ID重复。故SkyWalking针对此问题的解决方案如下：

每生成一个id，都会将生成id的时间戳记录下来（lastTimestamp），如果发现当前时间比记录下来的lastTimestamp还小，就说明发生了时间回调，此时就会生成一个随机数作为traceId。

5.4 请求量大，采集数据对性能的影响

SkyWalking默认设置3秒采样3次，其余请求不采样。但是为了保证服务调用不在同一个时间节点上，导致部分数据丢失，SkyWalking做了如下处理：

如果上游携带有Context，就说明上游采样了，则下游也会强制进行采样，以此来保证来链路的完整性。

风语者！平时喜欢研究各种技术，目前在从事后端开发工作，热爱生活、热爱工作。

上一篇
RUST 每日一省：智能指针

下一篇
rcoketMq事务消息

站长推荐

QT多线程的5种用法，通过使用线程解决UI主界面的耗时操作代码，防止界面卡死。
QT多线程的5种用法，通过使用线程解决UI主界面的耗时操作代码，防止界面卡死。...
U8W/U8W-Mini使用与常见问题解决
U8W/U8W-Mini使用与常见问题解决
stm32使用HAL库配置串口中断收发数据（保姆级教程）
stm32使用HAL库配置串口中断收发数据（保姆级教程）
分享几个国内免费的ChatGPT镜像网址(亲测有效)
分享几个国内免费的ChatGPT镜像网址(亲测有效)
Allegro16.6差分等长设置及走线总结
Allegro16.6差分等长设置及走线总结

您现在的位置是：首页 >技术交流 >分布式链路追踪—SkyWalking网站首页技术交流