[TRANSFORMATIONS][GPU] Add GroupNormalization fusion to common optimizations #28387

jhajducz · 2025-01-11T02:03:54Z

Details:

Added GroupNormalization fusion pass that can handle pattern observed in many customer models that were exported via ONNX in a way that uses InstanceNormalization as a proxy for GroupNormalization. It covers also more traditional cases without additional instance norm related parameters.
Per suggestion from @vladimir-paramuzov, for now enabled GroupNormalization fusion only for GPU plugin. Once it will be verified that it doesn't cause regressions in other backends, we can enable it for them as well.

Tickets:

160436

mlukasze · 2025-01-13T05:52:12Z

build_jenkins

t-jankowski

Lgtm regarding Core part.

src/common/transformations/tests/common_optimizations/group_normalization_fusion_tests.cpp

src/core/include/openvino/core/type/element_type.hpp

praasz · 2025-01-13T11:14:44Z

build_jenkins

...mmon/transformations/src/transformations/common_optimizations/group_normalization_fusion.cpp

src/plugins/intel_gpu/src/plugin/transformations_pipeline.cpp

.../transformations/include/transformations/common_optimizations/group_normalization_fusion.hpp

...mmon/transformations/src/transformations/common_optimizations/group_normalization_fusion.cpp

src/common/transformations/tests/common_optimizations/group_normalization_fusion_tests.cpp

...mmon/transformations/src/transformations/common_optimizations/group_normalization_fusion.cpp

src/common/transformations/tests/common_optimizations/group_normalization_fusion_tests.cpp

.../transformations/include/transformations/common_optimizations/group_normalization_fusion.hpp

...mmon/transformations/src/transformations/common_optimizations/group_normalization_fusion.cpp

…lizationFusion tests

…sformations pipeline

…es in GroupNormalizationFusion pass

…usion pass

…sion pass

…tionFusion pass

…est for GPU

…l subgraph test

…unctional subraph test fixture class

…ationFusionTestBase in derived classes' templates

…tional subgraph test

…izationFusion tests

…pNormalizationFusion pass and tests

vladimir-paramuzov · 2025-02-11T10:48:46Z

...mmon/transformations/src/transformations/common_optimizations/group_normalization_fusion.cpp

+                return false;
+            break;
+        case ov::element::u64:
+            if (!pre_mvn_shape_vals_correct<uint64_t>(pre_mvn_shape_const, input_ps, num_groups))


I think this switch can be removed and replaced with single if:

if (!pre_mvn_shape_vals_correct(pre_mvn_shape_const->cast_vector<int64_t>(), input_ps, num_groups))

vladimir-paramuzov · 2025-02-11T10:49:04Z

...mmon/transformations/src/transformations/common_optimizations/group_normalization_fusion.cpp

+        const auto& mvn_reduction_axes_out_shape = mvn_reduction_axes.get_shape();
+        if (mvn_reduction_axes_out_shape[0] != 1)
+            return false;
+        switch (mvn_reduction_axes_const->get_element_type()) {


vladimir-paramuzov · 2025-02-11T10:51:16Z

...mmon/transformations/src/transformations/common_optimizations/group_normalization_fusion.cpp

+            return false;
+
+        // number of elements in group_norm_beta must be equal to
+        // number of channels


nit: IMO, comment here and above are not needed as the code is more or less simple

vladimir-paramuzov · 2025-02-11T10:53:39Z

...mmon/transformations/src/transformations/common_optimizations/group_normalization_fusion.cpp

+        for (auto i = 0ull; i < num_groups; i++)
+            gather_indices_vals.insert(gather_indices_vals.end(), channels_to_groups_ratio, i);
+        auto gather_indices_const_m =
+            op::v0::Constant::create(element::i64, Shape{static_cast<size_t>(num_channels)}, gather_indices_vals);


Suggested change

op::v0::Constant::create(element::i64, Shape{static_cast<size_t>(num_channels)}, gather_indices_vals);

op::v0::Constant::create(element::i64, Shape{num_channels}, gather_indices_vals);

vladimir-paramuzov · 2025-02-11T11:01:16Z

src/common/transformations/tests/common_optimizations/group_normalization_fusion_tests.cpp

+class GroupNormalizationFusionTransformationTestsF_f32
+    : public GroupNormalizationFusionTransformationTestsF<element::Type_t::f32> {};
+class GroupNormalizationFusionTransformationTestsF_f16
+    : public GroupNormalizationFusionTransformationTestsF<element::Type_t::f16> {};
+class GroupNormalizationFusionTransformationTestsF_bf16
+    : public GroupNormalizationFusionTransformationTestsF<element::Type_t::bf16> {};
+class GroupNormalizationFusionTransformationTestsF_u8
+    : public GroupNormalizationFusionTransformationTestsF<element::Type_t::u8> {};
+class GroupNormalizationFusionTransformationTestsF_u16
+    : public GroupNormalizationFusionTransformationTestsF<element::Type_t::u16> {};
+class GroupNormalizationFusionTransformationTestsF_u32
+    : public GroupNormalizationFusionTransformationTestsF<element::Type_t::u32> {};
+class GroupNormalizationFusionTransformationTestsF_u64
+    : public GroupNormalizationFusionTransformationTestsF<element::Type_t::u64> {};
+class GroupNormalizationFusionTransformationTestsF_i8
+    : public GroupNormalizationFusionTransformationTestsF<element::Type_t::i8> {};
+class GroupNormalizationFusionTransformationTestsF_i16
+    : public GroupNormalizationFusionTransformationTestsF<element::Type_t::i16> {};
+class GroupNormalizationFusionTransformationTestsF_i32
+    : public GroupNormalizationFusionTransformationTestsF<element::Type_t::i32> {};
+class GroupNormalizationFusionTransformationTestsF_i64
+    : public GroupNormalizationFusionTransformationTestsF<element::Type_t::i64> {};
+class GroupNormalizationFusionTransformationTestsF_f8e4m3
+    : public GroupNormalizationFusionTransformationTestsF<element::Type_t::f8e4m3> {};
+class GroupNormalizationFusionTransformationTestsF_f8e5m2
+    : public GroupNormalizationFusionTransformationTestsF<element::Type_t::f8e5m2> {};
+class GroupNormalizationFusionTransformationTestsF_f4e2m1
+    : public GroupNormalizationFusionTransformationTestsF<element::Type_t::f4e2m1> {};
+class GroupNormalizationFusionTransformationTestsF_f8e8m0
+    : public GroupNormalizationFusionTransformationTestsF<element::Type_t::f8e8m0> {};


IMO, test cases for integer types shall be removed as spec says that supported tensor types are floating-point for this op

vladimir-paramuzov · 2025-02-11T11:25:28Z

...onal/shared_test_classes/include/shared_test_classes/subgraph/group_normalization_fusion.hpp

+}
+
+template <element::Type_t T_elem_t>
+class GroupNormalizationFusionTestBase {


I think type template is not needed for this test as it can be just a parameter of the test. As I can see, in most of the cases you actually use element::Type object as a parameter. The only exception is const data generation, but you can use ov::test::utils::create_and_fill_tensor method to instead, thus the template arg won't be needed here too. That change will simplify tests instantiations I believe

vladimir-paramuzov · 2025-02-11T11:28:12Z

...el_gpu/tests/functional/shared_tests_instances/subgraph_tests/group_normalization_fusion.cpp

+                         GroupNormalizationFusionSubgraphTestsF_f4e2m1::getTestCaseName);
+
+INSTANTIATE_TEST_SUITE_P(GroupNormalizationFusionSubgraphNegativeTestsValidVals_f8e8m0,
+                         GroupNormalizationFusionSubgraphTestsF_f8e8m0,


I wonder why these test cases work while fp8/fp4/bf16 types are not supported by GPU plugin at all and integer types are not supported by the kernel?

vladimir-paramuzov · 2025-02-11T11:28:40Z

...el_gpu/tests/functional/shared_tests_instances/subgraph_tests/group_normalization_fusion.cpp

+                                                  ov::test::utils::DEVICE_TEMPLATE,
+                                                  {{"DISABLE_TRANSFORMATIONS", true}}))),


Why do we need these args as tests parametes? I'd expect them to be hardcoded in the test

vladimir-paramuzov · 2025-02-11T11:34:02Z

...onal/shared_test_classes/include/shared_test_classes/subgraph/group_normalization_fusion.hpp

+        refInferRequest.infer();
+    }
+
+    std::vector<ov::Tensor> calculate_refs() override {


What's the difference between this and base class version? The base one also runs model via template plugin

vladimir-paramuzov · 2025-02-11T11:36:36Z

...onal/shared_test_classes/include/shared_test_classes/subgraph/group_normalization_fusion.hpp

+    }
+
+public:
+    void run() override {


I see some small difference for this impl vs base method, but IMO those differences should be handled separately to avoid copy-pasting of key execution logic. For instance, count of group norm ops can be checked in a separate method like this:

TEST_P(GroupNormalizationFusionSubgraphTestsF, CompareWithRefs) { run(); check_some_plugin_or_test_specific_things_after_base_values_checks(); // add this method to GroupNormalizationFusionSubgraphTestsF };

github-actions bot added category: Core OpenVINO Core (aka ngraph) category: GPU OpenVINO GPU plugin category: transformations OpenVINO Runtime library - Transformations category: CPP API OpenVINO CPP API bindings labels Jan 11, 2025

sys-openvino-ci added the ExternalIntelPR External contributor from Intel label Jan 11, 2025

jhajducz force-pushed the private/jhajducz/gpu_gn_fusion branch from 3a67c81 to ba87e35 Compare January 12, 2025 17:37

jhajducz marked this pull request as ready for review January 13, 2025 00:38

jhajducz requested review from a team as code owners January 13, 2025 00:38

jhajducz requested review from itikhono and removed request for a team January 13, 2025 00:38

t-jankowski approved these changes Jan 13, 2025

View reviewed changes

src/common/transformations/tests/common_optimizations/group_normalization_fusion_tests.cpp Show resolved Hide resolved

jhajducz force-pushed the private/jhajducz/gpu_gn_fusion branch from ba87e35 to 3bd623d Compare January 13, 2025 10:49

praasz requested changes Jan 13, 2025

View reviewed changes

src/core/include/openvino/core/type/element_type.hpp Outdated Show resolved Hide resolved

jhajducz force-pushed the private/jhajducz/gpu_gn_fusion branch from 3bd623d to d69391b Compare January 14, 2025 13:05

github-actions bot removed category: Core OpenVINO Core (aka ngraph) category: CPP API OpenVINO CPP API bindings labels Jan 14, 2025

jhajducz requested a review from praasz January 14, 2025 15:39

jhajducz force-pushed the private/jhajducz/gpu_gn_fusion branch from d69391b to b1ac67d Compare January 14, 2025 20:29

vladimir-paramuzov reviewed Jan 15, 2025

View reviewed changes

praasz reviewed Jan 15, 2025

View reviewed changes

t-jankowski requested changes Jan 15, 2025

View reviewed changes

.../transformations/include/transformations/common_optimizations/group_normalization_fusion.hpp Outdated Show resolved Hide resolved

jhajducz force-pushed the private/jhajducz/gpu_gn_fusion branch 3 times, most recently from 9cf1017 to 8382572 Compare January 16, 2025 20:23

vladimir-paramuzov reviewed Jan 17, 2025

View reviewed changes

jhajducz added 27 commits February 10, 2025 12:29

Avoid Shape->PartialShape conversion for in/out tensors in GroupNorma…

f109e3d

…lizationFusion tests

Use global testing namespace in GroupNormalizationFusion tests

c2b9dd3

Another update of copyright notice

e705d15

Use const references where possible in GroupNormalizationFusion pass

3712c71

Move GroupNormalizationFusion after MVNFusion pass in GPU plugin tran…

46a5dd9

…sformations pipeline

Use OV ptr cast for MVN in GroupNormalizationFusion pass

f0552d8

Add 5d and 6d cases to GroupNormalizationFusion tests + fix formatting

4e88ca6

Use predicates for type & shape checks that don't depend on other nod…

d281c08

…es in GroupNormalizationFusion pass

Use ov::pass::pattern namespace in GroupNormalizationFusion pass

194619d

Remove redundant has_integral_type predicate from GroupNormalizationF…

7c83090

…usion pass

Simplify accessing nodes partial shapes in GroupNormalizationFusion pass

057908c

Fix typo in one of types in GroupNormalizationFusion tests

093e37e

Remove unused include files from GroupNormalizationFusion pass

a1356c6

Fix handling instance norm gamma & beta in GroupNormalizationFusion pass

bf0fd58

Validate pre-MVN shape and MVN reduction axes in GroupNormalizationFu…

1c597d8

…sion pass

Make instance norm gamma & beta explicitly optional in GroupNormaliza…

0f3dedd

…tionFusion pass

Add GroupNormalizationFusion shared functional subgraph test

dcebce6

Add instance of GroupNormalizationFusion shared functional subgraph t…

6f18aa0

…est for GPU

Refactor GroupNormalizationFusion transformation test

fe477c0

Add missing include file in GroupNormalizationFusion shared functiona…

60cb45b

…l subgraph test

Cosmetic changes in ov::test::SubgraphBaseTest class

8c9d4b5

Remove redundant virtual keyword in GroupNormalizationFusion shared f…

3153430

…unctional subraph test fixture class

Fix accessing type and members variables/functions from GroupNormaliz…

254cc1c

…ationFusionTestBase in derived classes' templates

Add missing override keywords in GroupNormalizationFusion shared func…

a5d6869

…tional subgraph test

Fix usage of ov::element::Type_t and ov::element::Type in GroupNormal…

394dc63

…izationFusion tests

Fix comparison of integer expressions of different signedness in Grou…

0daca6e

…pNormalizationFusion pass and tests

Override init_thresholds() in MHA shared functional test class

e73dd5d

jhajducz force-pushed the private/jhajducz/gpu_gn_fusion branch from 493e486 to e73dd5d Compare February 10, 2025 11:29

itikhono requested a review from CuriousPanCake February 10, 2025 11:43

vladimir-paramuzov reviewed Feb 11, 2025

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[TRANSFORMATIONS][GPU] Add GroupNormalization fusion to common optimizations #28387

[TRANSFORMATIONS][GPU] Add GroupNormalization fusion to common optimizations #28387

jhajducz commented Jan 11, 2025 •

edited

Loading

mlukasze commented Jan 13, 2025

t-jankowski left a comment

praasz commented Jan 13, 2025

vladimir-paramuzov Feb 11, 2025

vladimir-paramuzov Feb 11, 2025

vladimir-paramuzov Feb 11, 2025

vladimir-paramuzov Feb 11, 2025

vladimir-paramuzov Feb 11, 2025

vladimir-paramuzov Feb 11, 2025

vladimir-paramuzov Feb 11, 2025

vladimir-paramuzov Feb 11, 2025

vladimir-paramuzov Feb 11, 2025

vladimir-paramuzov Feb 11, 2025

	op::v0::Constant::create(element::i64, Shape{static_cast<size_t>(num_channels)}, gather_indices_vals);
	op::v0::Constant::create(element::i64, Shape{num_channels}, gather_indices_vals);

		ov::test::utils::DEVICE_TEMPLATE,
		{{"DISABLE_TRANSFORMATIONS", true}}))),

[TRANSFORMATIONS][GPU] Add GroupNormalization fusion to common optimizations #28387

Are you sure you want to change the base?

[TRANSFORMATIONS][GPU] Add GroupNormalization fusion to common optimizations #28387

Conversation

jhajducz commented Jan 11, 2025 • edited Loading

Details:

Tickets:

mlukasze commented Jan 13, 2025

t-jankowski left a comment

Choose a reason for hiding this comment

praasz commented Jan 13, 2025

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

jhajducz commented Jan 11, 2025 •

edited

Loading