使用 OpenTelemetry 统一不同服务的范围
php小编小新今天为大家介绍一种强大的工具——OpenTelemetry,它可以帮助开发者在不同的服务中实现统一的范围管理。在现代的分布式系统中,应用程序通常由多个微服务组成,每个微服务都有自己的日志、指标和追踪信息。OpenTelemetry提供了一种简单而强大的方式来集成和管理这些信息,使得开发者能够更好地理解和调试整个系统的性能和行为。无论是在本地开发环境还是在生产环境中,OpenTelemetry都能帮助开发者更好地理解和优化他们的应用程序。
问题内容我刚刚开始使用 opentelemetry,并为此创建了两个(微)服务:standard 和 geomap。
最终用户向standard服务发送请求,后者又向geomap发送请求以获取信息,然后再将结果返回给最终用户。我使用 gr电脑端 进行所有通信。
我已经对我的功能进行了这样的检测:
对于标准:
type standardservice struct { pb.unimplementedstandardserviceserver } func (s *standardservice) getstandard(ctx context.context, in *pb.getstandardrequest) (*pb.getstandardresponse, error) { conn, _:= createclient(ctx, geomapsvcaddr) defer conn1.close() newctx, span1 := otel.tracer(name).start(ctx, "getstandard") defer span1.end() countryinfo, err := pb.newgeomapserviceclient(conn).getcountry(newctx, &pb.getcountryrequest{ name: in.name, }) //... return &pb.getstandardresponse{ standard: standard, }, nil } func createclient(ctx context.context, svcaddr string) (*gr电脑端.clientconn, error) { return gr电脑端.dialcontext(ctx, svcaddr, gr电脑端.withtransportcredentials(insecure.newcredentials()), gr电脑端.withunaryinterceptor(otelgr电脑端.unaryclientinterceptor()), ) }
对于地理地图:
type geomapservice struct { pb.unimplementedgeomapserviceserver } func (s *geomapservice) getcountry(ctx context.context, in *pb.getcountryrequest) (*pb.getcountryresponse, error) { _, span := otel.tracer(name).start(ctx, "getcountry") defer span.end() span.setattributes(attribute.string("country", in.name)) span.addevent("retrieving country info") //... span.addevent("country info retrieved") return &pb.getcountryresponse{ country: &country, }, nil }
这两个服务都配置为将其跨度发送到 jaeger 后端并共享几乎相同的主要功能(评论中指出了细微的差异):
const ( name = "mapedia" service = "geomap" //or standard environment = "production" id = 1 ) func tracerProvider(url string) (*tracesdk.TracerProvider, error) { // Create the Jaeger exporter exp, err := jaeger.New(jaeger.WithCollectorEndpoint(jaeger.WithEndpoint(url))) if err != nil { return nil, err } tp := tracesdk.NewTracerProvider( // Always be sure to batch in production. tracesdk.WithBatcher(exp), // Record information about this application in a Resource. tracesdk.WithResource(resource.NewWithAttributes( semconv.SchemaURL, semconv.ServiceName(service), attribute.String("environment", environment), attribute.Int64("ID", id), )), ) return tp, nil } func main() { tp, err := tracerProvider("localhost:14268/api/traces") if err != nil { log.Fatal(err) } defer func() { if err := tp.Shutdown(context.Background()); err != nil { log.Fatal(err) } }() otel.SetTracerProvider(tp) listener, err := net.Listen("tcp", ":"+port) if err != nil { panic(err) } s := gr电脑端.NewServer( gr电脑端.UnaryInterceptor(otelgr电脑端.UnaryServerInterceptor()), ) reflection.Register(s) pb.RegisterGeoMapServiceServer(s, &geomapService{}) // or pb.RegisterStandardServiceServer(s, &standardService{}) if err := s.Serve(listener); err != nil { log.Fatalf("Failed to serve: %v", err) } }
当我查看最终用户对标准服务的请求生成的跟踪时,我可以看到它正如预期的那样,调用其geomap服务:
但是,我没有看到已添加到子范围的任何属性或事件(我在检测 geomap< 的 getcountry 函数时添加了一个属性和 2 个事件/em>)。 然而,我注意到这些属性在另一个单独的跟踪中可用(在 jaeger 中的“geomap”服务下可用),其跨度 id 与标准服务中的子跨度完全无关: 现在我期望的是有一个跟踪,并查看与 标准 范围内的子范围中的 geomap 相关的所有属性/事件。如何从这里得到预期的结果? 跨度上下文(包含跟踪 id 和跨度 id,如“service instrumentation & 中所述)术语”)应该从父跨度传播到子跨度,以便它们成为同一跟踪的一部分。 使用 opentelemetry,这通常是通过使用为各种库(包括 gr电脑端)提供的插件来检测代码来自动完成的。 在您的代码中,您将在 函数中启动一个新范围,然后在发出 请求时使用该上下文 ()。这是正确的,因为新上下文应该包含父跨度的跨度上下文 ()。 您正确使用了 在这里,这应该确保上下文正确传播,但不清楚何时调用此函数。如果在调用 函数之前调用它,则用于创建客户端的上下文将不包含来自 的跨度上下文。 为了进行测试,请尝试确保在调用 函数之后创建客户端,并且在整个请求中使用相同的上下文。 您可以通过将 直接传递给 函数来完成此操作,如 函数的修改版本所示: 现在,用于创建客户端并发出 请求的上下文将包括来自 的跨度上下文,并且它们应作为 jaeger 中同一跟踪的一部分出现。 (一如既往,请检查 和 等函数返回的错误,为简洁起见,此处未显示)。 此外: 另请检查您的传播器:确保您使用相同的上下文传播器 在这两个服务中,最好是 w3c tracecontextpropagator,这是 opentelemetry 中默认的。 您可以按如下方式显式设置传播器: 将以上行添加到两个服务中 函数的开头。 确保传递元数据:gr电脑端 拦截器应自动从请求的元数据中注入/提取跟踪上下文,但要仔细检查以确保其正常工作。 在 函数中启动跨度后,您可以记录跟踪 id 和跨度 id: 并在 函数中执行相同的操作: 如果上下文正确传播,两个服务中的跟踪 id 应该匹配。
但是,在您的情况下,传播似乎无法正常工作。
但问题可能与您的 函数有关:func createclient(ctx context.context, svcaddr string) (*gr电脑端.clientconn, error) {
return gr电脑端.dialcontext(ctx, svcaddr,
gr电脑端.withtransportcredentials(insecure.newcredentials()),
gr电脑端.withunaryinterceptor(otelgr电脑端.unaryclientinterceptor()),
)
}
func (s *standardservice) getstandard(ctx context.context, in *pb.getstandardrequest) (*pb.getstandardresponse, error) {
newctx, span1 := otel.tracer(name).start(ctx, "getstandard")
defer span1.end()
conn, _:= createclient(newctx, geomapsvcaddr)
defer conn.close()
countryinfo, err := pb.newgeomapserviceclient(conn).getcountry(newctx,
&pb.getcountryrequest{
name: in.name,
})
//...
return &pb.getstandardresponse{
standard: standard,
}, nil
}
otel.settextmappropagator(propagation.tracecontext{})
ctx, span := otel.tracer(name).start(ctx, "getcountry")
sc := trace.spancontextfromcontext(ctx)
log.printf("trace id: %s, span id: %s", sc.traceid(), sc.spanid())
defer span.end()
newCtx, span1 := otel.Tracer(name).Start(ctx, "GetStandard")
sc := trace.SpanContextFromContext(newCtx)
log.Printf("Trace ID: %s, Span ID: %s", sc.TraceID(), sc.SpanID())
defer span1.End()
相关推荐
-
C语言中如何正确使用scanf函数处理用户输入
标题:C语言中正确使用scanf函数进行用户输入的解析在C语言中,scanf函数是用来从标准输入读取数据的常用函数之一。它可以按照格式化字符串的要求,将用户输入的数据解析并赋值给变量。本文将介绍如何正
-
示例及解析:C语言中scanf函数的输入格式
C语言是一种十分重要的程序设计语言,很多初学者在学习和使用C语言的过程中,经常会用到输入函数scanf()。通过scanf()函数,我们可以从用户处获取输入数据,然后将其存储到指定的变量中。本文将介绍
-
精通C语言函数:全面解析常用函数的用法与原理
精通C语言函数:全面解析常用函数的用法与原理摘要:C语言中的函数是实现代码复用和模块化的重要工具,也是程序设计中不可或缺的一部分。本文将全面解析常用函数的用法与原理,包括函数的定义、调用和返回值,以及
-
Python中strip 函数的用法
Python中strip()函数的用法及代码示例Python中的strip()函数是用来去除字符串开头和结尾的指定字符(默认为空格)的函数。它可以非常方便地处理字符串的处理和整理。本文将介绍strip
-
C语言中scanf函数的使用方法详解
C语言中scanf函数的使用方法详解及代码示例C语言是一门广泛应用于各种软件开发的编程语言,其中的输入输出函数在编写程序时起着非常重要的作用。其中,scanf函数是C语言中用于读取标准输入的函数之一,