[nomerge] Potential perf opt on bbox kernels #6872

datumbox · 2022-10-31T12:45:00Z

No description provided.

datumbox · 2022-10-31T12:46:22Z

torchvision/prototype/transforms/functional/_geometry.py

@@ -759,6 +764,7 @@ def pad_bounding_box(

    bounding_box = bounding_box.clone()

+    # TODO: avoid repeated indexing and perform concurrently. `output.add_(torch.tensor([left, top, left, top]))` is 3x faster


A quick check of:

def single(inpt, left, top): output = inpt.clone() output[..., 0] += left output[..., 1] += top output[..., 2] += left output[..., 3] += top return output def concurrent(inpt, left, top): output = inpt.clone() output.add_(torch.tensor([left, top, left, top])) return output

Shows:

[-------- Pad cpu torch.float32 --------] | single | concurrent 1 threads: ------------------------------ (16, 4) | 60 | 20 6 threads: ------------------------------ (16, 4) | 58 | 15 Times are in microseconds (us).

There might be multiple opportunities for speed up like this.

[nomerge] Potential perf opt on bbox kernels

0a1223a

facebook-github-bot added the cla signed label Oct 31, 2022

datumbox commented Oct 31, 2022

View reviewed changes

datumbox requested a review from vfdev-5 October 31, 2022 12:46

datumbox closed this Oct 31, 2022

datumbox deleted the nomerge/perf_bbox branch October 31, 2022 12:46

datumbox mentioned this pull request Nov 3, 2022

Remaining BBox kernel perf optimizations #6896

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[nomerge] Potential perf opt on bbox kernels #6872

[nomerge] Potential perf opt on bbox kernels #6872

datumbox commented Oct 31, 2022

datumbox Oct 31, 2022

		@@ -759,6 +764,7 @@ def pad_bounding_box(

		bounding_box = bounding_box.clone()

		# TODO: avoid repeated indexing and perform concurrently. `output.add_(torch.tensor([left, top, left, top]))` is 3x faster

[nomerge] Potential perf opt on bbox kernels #6872

[nomerge] Potential perf opt on bbox kernels #6872

Conversation

datumbox commented Oct 31, 2022

datumbox Oct 31, 2022

Choose a reason for hiding this comment