Exposing trace context to python backend #6985

oandreeva-nv · 2024-03-14T18:20:46Z

The purpose of this PR:
This PR is a Stage 1 towards adding an ability for users to create custom traces in python backend.
This set of PRs is heavily focused on OpenTelemetry trace mode.

Functionality:

Prepares OpenTelemetry trace context via PrepareTraceContext and attaches it to TRITONSERVER_InferenceTrace instance through TRITONSERVER_InferenceTraceSetContex at the moment in time, when REQUEST_START callback happens. That one is happening from the core side, so when PBE model starts execution, it should have context attached to its trace.
Context is passed as a string and for OpenTelemetry is essentially 2 headers traceparent : "..." and tracestate: "...". Some of you may know about them from OpenTelemetry context propagation discussions. It's the same.
We do nothing with trace Context in Triton mode. On the core side TRITONSERVER_InferenceTrace is initiated with an empty string as a context, since it is never updated, pbe will get an empty string and return None with request.trace().get_context()

Below is a POC illustrated.

mode=triton tests are on the way.

Related PRs:
python_be: triton-inference-server/python_backend#346
core: triton-inference-server/core#334

POC:

created with model.py:

import time
import json

import numpy as np
import triton_python_backend_utils as pb_utils

from opentelemetry import trace
from opentelemetry.propagate import inject
from opentelemetry.sdk.trace import TracerProvider
from opentelemetry.sdk.trace.export import (
    BatchSpanProcessor
)
from opentelemetry.trace.propagation.tracecontext import TraceContextTextMapPropagator
from opentelemetry.exporter.otlp.proto.http.trace_exporter import OTLPSpanExporter



class TritonPythonModel:

    def initialize(self, args):
    	trace.set_tracer_provider(TracerProvider())
    	self.tracer = trace.get_tracer_provider().get_tracer("pbe")
    	trace.get_tracer_provider().add_span_processor(
	    BatchSpanProcessor(OTLPSpanExporter(endpoint="http://localhost:4318/v1/traces"))
	)

    def execute(self, requests):
        logger = pb_utils.Logger
        logger.log_info(f"got {len(requests)} requests")

        responses = []
        for request in requests:
            inp = pb_utils.get_input_tensor_by_name(request, "INPUT0").as_numpy()
            context = request.trace().get_context()
            if context == None:
            	context = "{}"
            ctx = TraceContextTextMapPropagator().extract(carrier=json.loads(context))

            # emulate some work
            with self.tracer.start_as_current_span('child', context=ctx) as span:
            	time.sleep(3)
            
            time.sleep(3)

            output_tensors = [pb_utils.Tensor("OUTPUT0", inp.astype(np.float32))]
            inference_response = pb_utils.InferenceResponse(output_tensors=output_tensors)
            responses.append(inference_response)

        return responses

src/tracer.cc

qa/L0_trace/trace_context.py

qa/L0_trace/opentelemetry_unittest.py

rmccorm4

Nice work 🚀

* Added TRITONSERVER_InferenceTraceSetContext logic

kthui · 2024-03-19T01:35:55Z

qa/L0_trace/trace_context.py

@@ -0,0 +1,46 @@
+import numpy as np


@oandreeva-nv do we need a copyright statement for this file?

Good catch, will follow up shortly

oandreeva-nv added 3 commits March 13, 2024 18:54

Added TRITONSERVER_InferenceTraceSetContext logic

3508e73

CMake clean up

ed1dc2a

Code clean up

4f22df2

oandreeva-nv commented Mar 14, 2024

View reviewed changes

src/tracer.cc Show resolved Hide resolved

rmccorm4 reviewed Mar 14, 2024

View reviewed changes

src/tracer.cc Show resolved Hide resolved

Added basic test

db08e38

oandreeva-nv mentioned this pull request Mar 14, 2024

Exposing trace context to python backend triton-inference-server/core#334

Merged

github-advanced-security bot found potential problems Mar 14, 2024

View reviewed changes

qa/L0_trace/trace_context.py Fixed Show fixed Hide fixed

oandreeva-nv marked this pull request as ready for review March 14, 2024 19:52

oandreeva-nv requested review from rmccorm4, Tabrizian, nnshah1, kthui, GuanLuo and krishung5 March 14, 2024 19:53

rmccorm4 reviewed Mar 14, 2024

View reviewed changes

qa/L0_trace/trace_context.py Outdated Show resolved Hide resolved

rmccorm4 reviewed Mar 14, 2024

View reviewed changes

qa/L0_trace/trace_context.py Outdated Show resolved Hide resolved

rmccorm4 reviewed Mar 14, 2024

View reviewed changes

qa/L0_trace/opentelemetry_unittest.py Show resolved Hide resolved

oandreeva-nv mentioned this pull request Mar 14, 2024

Exposing trace context to python backend triton-inference-server/python_backend#346

Merged

review 1

b963934

github-advanced-security bot found potential problems Mar 15, 2024

View reviewed changes

qa/L0_trace/opentelemetry_unittest.py Fixed Show fixed Hide fixed

removed unused import

0081ce0

rmccorm4 previously approved these changes Mar 15, 2024

View reviewed changes

Fixed test

5fb590d

oandreeva-nv dismissed rmccorm4’s stale review via 5fb590d March 15, 2024 15:47

Adjusted expected num tests

0015b72

kthui reviewed Mar 15, 2024

View reviewed changes

qa/L0_trace/opentelemetry_unittest.py Show resolved Hide resolved

rmccorm4 approved these changes Mar 15, 2024

View reviewed changes

oandreeva-nv merged commit 06b73f3 into main Mar 15, 2024
3 checks passed

oandreeva-nv deleted the oandreeva_expose_otel_context_pb branch March 15, 2024 21:52

oandreeva-nv added a commit that referenced this pull request Mar 15, 2024

Exposing trace context to python backend (#6985)

f17f40b

* Added TRITONSERVER_InferenceTraceSetContext logic

GuanLuo pushed a commit that referenced this pull request Mar 15, 2024

Exposing trace context to python backend (#6985) (#6993)

4f1aadb

* Added TRITONSERVER_InferenceTraceSetContext logic

kthui reviewed Mar 19, 2024

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Exposing trace context to python backend #6985

Exposing trace context to python backend #6985

oandreeva-nv commented Mar 14, 2024 •

edited

Loading

rmccorm4 left a comment

kthui Mar 19, 2024

oandreeva-nv Mar 19, 2024

Exposing trace context to python backend #6985

Exposing trace context to python backend #6985

Conversation

oandreeva-nv commented Mar 14, 2024 • edited Loading

rmccorm4 left a comment

Choose a reason for hiding this comment

kthui Mar 19, 2024

Choose a reason for hiding this comment

oandreeva-nv Mar 19, 2024

Choose a reason for hiding this comment

oandreeva-nv commented Mar 14, 2024 •

edited

Loading