Add support for request rescheduling #319

krishung5 · 2023-11-02T16:55:45Z

Testing: triton-inference-server/server#6509

src/resources/triton_python_backend_utils.py

src/infer_request.h

src/pb_stub.cc

README.md

src/pb_stub.cc

README.md

src/python_be.h

…hon_backend into krish-request-reschedule

Tabrizian

The code changes look good to me. I was wondering do you think there could be a memory leak in non-decoupled case with these changes? For non-decoupled we create N responses in the beginning:

python_backend/src/python_be.cc

Line 1380 in 60a9091

auto err = TRITONBACKEND_ResponseNew(&response, requests[i]);

How is the None responses going to be treated by server? I didn't see any flags adjustments for non-decoupled mode for responses.

krishung5 · 2023-11-08T23:10:32Z

The code changes look good to me. I was wondering do you think there could be a memory leak in non-decoupled case with these changes? For non-decoupled we create N responses in the beginning:

python_backend/src/python_be.cc

Line 1380 in 60a9091

auto err = TRITONBACKEND_ResponseNew(&response, requests[i]);

How is the None responses going to be treated by server? I didn't see any flags adjustments for non-decoupled mode for responses.

The backend will clean up the response if the associated request is rescheduled. Please see here:

python_backend/src/python_be.cc

Lines 1577 to 1585 in 8b01823

    
           if (pb_infer_requests[r]->ReleaseFlags() == 
        
               TRITONSERVER_REQUEST_RELEASE_RESCHEDULE) { 
        
             // For rescheduled requests, we do not need to send a response. 
        
             LOG_IF_ERROR( 
        
                 TRITONBACKEND_ResponseDelete((*responses)[r]), 
        
                 "failed to delete response"); 
        
             (*responses)[r] = nullptr; 
        
             continue; 
        
           }

* Add support for request rescheduling * Address comment * Add documentation * Fix up for doc * Revert response sender changes * Address comment

krishung5 requested review from Tabrizian and GuanLuo November 2, 2023 17:01

krishung5 mentioned this pull request Nov 2, 2023

Add testing for Python backend request rescheduling triton-inference-server/server#6509

Merged

krishung5 requested a review from nnshah1 November 2, 2023 17:48

nnshah1 reviewed Nov 2, 2023

View reviewed changes

src/resources/triton_python_backend_utils.py Show resolved Hide resolved

GuanLuo reviewed Nov 3, 2023

View reviewed changes

src/infer_request.h Outdated Show resolved Hide resolved

src/pb_stub.cc Show resolved Hide resolved

krishung5 added 3 commits November 6, 2023 18:27

Add support for request rescheduling

482d4bb

Address comment

8ab6186

Add documentation

5c007f8

krishung5 force-pushed the krish-request-reschedule branch from aa2b6c4 to 5c007f8 Compare November 7, 2023 02:27

Fix up for doc

3246685

krishung5 requested review from nnshah1 and GuanLuo November 7, 2023 02:37

Tabrizian reviewed Nov 7, 2023

View reviewed changes

README.md Show resolved Hide resolved

src/pb_stub.cc Show resolved Hide resolved

Revert response sender changes

543187c

Tabrizian reviewed Nov 8, 2023

View reviewed changes

README.md Show resolved Hide resolved

README.md Show resolved Hide resolved

src/python_be.h Show resolved Hide resolved

krishung5 added 2 commits November 8, 2023 12:27

Address comment

b8f3375

Merge branch 'main' of https://github.com/triton-inference-server/pyt…

8b01823

…hon_backend into krish-request-reschedule

krishung5 requested a review from Tabrizian November 8, 2023 20:40

Tabrizian reviewed Nov 8, 2023

View reviewed changes

Tabrizian approved these changes Nov 8, 2023

View reviewed changes

krishung5 merged commit 889585c into main Nov 9, 2023

krishung5 deleted the krish-request-reschedule branch November 9, 2023 19:58

krishung5 added a commit that referenced this pull request Nov 9, 2023

Add support for request rescheduling (#319)

b0c7e04

* Add support for request rescheduling * Address comment * Add documentation * Fix up for doc * Revert response sender changes * Address comment

krishung5 added a commit that referenced this pull request Nov 9, 2023

Add support for request rescheduling (#319) (#321)

fbd6d84

* Add support for request rescheduling * Address comment * Add documentation * Fix up for doc * Revert response sender changes * Address comment

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add support for request rescheduling #319

Add support for request rescheduling #319

krishung5 commented Nov 2, 2023 •

edited

Loading

Tabrizian left a comment

krishung5 commented Nov 8, 2023 •

edited

Loading

Add support for request rescheduling #319

Add support for request rescheduling #319

Conversation

krishung5 commented Nov 2, 2023 • edited Loading

Tabrizian left a comment

Choose a reason for hiding this comment

krishung5 commented Nov 8, 2023 • edited Loading

krishung5 commented Nov 2, 2023 •

edited

Loading

krishung5 commented Nov 8, 2023 •

edited

Loading