Why does vLLM use eager mode based execution for CPUs #10716

amd-lalithnc · 2024-11-27T15:27:27Z

amd-lalithnc
Nov 27, 2024

Looking through the code, I figured vLLM uses eager mode based execution for models.

I understand most ops are rewritten and replaced in the source model, are there any advantages or disadvantages to using eager mode over inductor path/torchscript path?

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Why does vLLM use eager mode based execution for CPUs #10716

{{title}}

Replies: 0 comments

Select a reply

Why does vLLM use eager mode based execution for CPUs #10716

amd-lalithnc Nov 27, 2024

Replies: 0 comments

amd-lalithnc
Nov 27, 2024