当前根据traceId点查trace详情的耗时很长,有两个影响:
目前点查trace详情的主要耗时来源于下面的sql,用途是获取改traceId下的所有app和开始结束时间。
... ➦当前端上使用一个long值的16进制的字符串作为traceId。目前存在两个问题:
1. 64位随机数的碰撞概率高,目前已经出现traceId碰撞的情况
... ➦上下游拓扑及上下游调用性能指标是链路监控的重要部份。从生成过程来看,先给trace个案进行分类,然后按类汇总出同类trace的调用路径,这个调用路径通常是一个有向无环图,也就是拓扑。按照什么标准进行分类是上述过程的重点,上面所说的分类和汇总,表述成SQL大概就是聚合函数(count、avg等)和groupBy语句的结合,其中groupBy语句就是分类标准, count和avg是相关的性能指标。
... ➦Generate by ChatGPT4
W3C (World Wide Web Consortium)推出了Trace Context规范,旨在规范分布式追踪中跟踪信息的传播格式。Trace Context规范主要定义了两个HTTP头部字段:traceparent和tracestate。