initial take on groupconv support

aobolensk · aobolensk · commit 97493d89cef6 · 2025-03-12T15:02:01.000+01:00
diff --git a/src/common/transformations/include/ov_ops/convolution.hpp b/src/common/transformations/include/ov_ops/convolution.hpp
@@ -20,27 +20,40 @@ class TRANSFORMATIONS_API Convolution : public ov::op::util::ConvolutionFwdPropB
 
     Convolution() = default;
 
-    Convolution(const Output<Node>& data_batch,
-                const Output<Node>& filters,
-                const Strides& strides,
-                const CoordinateDiff& pads_begin,
-                const CoordinateDiff& pads_end,
-                const Strides& dilations,
-                const PadType& auto_pad = PadType::EXPLICIT);
-
     Convolution(const Output<Node>& data_batch,
                 const Output<Node>& filters,
                 const Output<Node>& bias,
                 const Strides& strides,
                 const CoordinateDiff& pads_begin,
                 const CoordinateDiff& pads_end,
                 const Strides& dilations,
-                const PadType& auto_pad = PadType::EXPLICIT);
+                const int64_t& groups,
+                const PadType& auto_pad,
+                const element::Type& output_type);
 
     void validate_and_infer_types() override;
     bool visit_attributes(AttributeVisitor& visitor) override;
 
     std::shared_ptr<Node> clone_with_new_inputs(const OutputVector& new_args) const override;
+
+    bool has_groups() const;
+    int64_t get_groups() const;
+
+    bool is_asymmetric() const;
+
+    struct Args {
+        static constexpr const size_t INPUT = 0;
+        static constexpr const size_t WEIGHTS = 1;
+        static constexpr const size_t BIAS = 2;
+        static constexpr const size_t AZP = 3;
+        static constexpr const size_t WZP = 4;
+        static constexpr const size_t COMPENSATION = 5;
+    };
+
+protected:
+    int64_t m_groups = -1;  // negative value means no groups
+    bool m_asymmetric = false;
+    ov::element::Type m_output_type = ov::element::dynamic;
 };
 
 }  // namespace internal
diff --git a/src/common/transformations/include/transformations/op_conversions/convert_group_convolution_to_convolution_internal.hpp b/src/common/transformations/include/transformations/op_conversions/convert_group_convolution_to_convolution_internal.hpp
@@ -0,0 +1,22 @@
+// Copyright (C) 2018-2025 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#pragma once
+
+#include "openvino/pass/matcher_pass.hpp"
+#include "transformations_visibility.hpp"
+
+namespace ov {
+namespace pass {
+
+class TRANSFORMATIONS_API ConvertGroupConvolutionToConvolutionInternal;
+
+}  // namespace pass
+}  // namespace ov
+
+class ov::pass::ConvertGroupConvolutionToConvolutionInternal : public ov::pass::MatcherPass {
+public:
+    OPENVINO_MATCHER_PASS_RTTI("ConvertGroupConvolutionToConvolutionInternal");
+    ConvertGroupConvolutionToConvolutionInternal();
+};
diff --git a/src/common/transformations/src/ov_ops/convolution.cpp b/src/common/transformations/src/ov_ops/convolution.cpp
@@ -4,38 +4,33 @@
 
 #include "ov_ops/convolution.hpp"
 
-#include "convolution_shape_inference.hpp"
+#include "internal_convolution_shape_inference.hpp"
 #include "itt.hpp"
 #include "openvino/op/util/precision_sensitive_attribute.hpp"
 
 using namespace std;
 
 namespace ov {
-op::internal::Convolution::Convolution(const Output<Node>& data_batch,
-                                       const Output<Node>& filters,
-                                       const Strides& strides,
-                                       const CoordinateDiff& pads_begin,
-                                       const CoordinateDiff& pads_end,
-                                       const Strides& dilations,
-                                       const PadType& auto_pad)
-    : op::util::ConvolutionFwdPropBase({data_batch, filters}, strides, pads_begin, pads_end, dilations, auto_pad) {
-    constructor_validate_and_infer_types();
-}
-
 op::internal::Convolution::Convolution(const Output<Node>& data_batch,
                                        const Output<Node>& filters,
                                        const Output<Node>& bias,
                                        const Strides& strides,
                                        const CoordinateDiff& pads_begin,
                                        const CoordinateDiff& pads_end,
                                        const Strides& dilations,
-                                       const PadType& auto_pad)
-    : op::util::ConvolutionFwdPropBase({data_batch, filters, bias},
-                                       strides,
-                                       pads_begin,
-                                       pads_end,
-                                       dilations,
-                                       auto_pad) {
+                                       const int64_t& groups,
+                                       const PadType& auto_pad,
+                                       const element::Type& output_type)
+    : op::util::ConvolutionFwdPropBase(
+          bias.get_node() ? OutputVector{data_batch, filters, bias} : OutputVector{data_batch, filters},
+          strides,
+          pads_begin,
+          pads_end,
+          dilations,
+          auto_pad),
+      m_groups(groups),
+      m_asymmetric(false),
+      m_output_type(output_type) {
     constructor_validate_and_infer_types();
 }
 
@@ -79,23 +74,28 @@ void op::internal::Convolution::validate_and_infer_types() {
 
 shared_ptr<Node> op::internal::Convolution::clone_with_new_inputs(const OutputVector& new_args) const {
     check_new_args_count(this, new_args);
-    if (new_args.size() == 2) {
-        return make_shared<internal::Convolution>(new_args.at(0),
-                                                  new_args.at(1),
-                                                  m_strides,
-                                                  m_pads_begin,
-                                                  m_pads_end,
-                                                  m_dilations,
-                                                  m_auto_pad);
-    }
     return make_shared<internal::Convolution>(new_args.at(0),
                                               new_args.at(1),
                                               new_args.at(2),
                                               m_strides,
                                               m_pads_begin,
                                               m_pads_end,
                                               m_dilations,
-                                              m_auto_pad);
+                                              m_groups,
+                                              m_auto_pad,
+                                              m_output_type);
+}
+
+bool op::internal::Convolution::has_groups() const {
+    return m_groups > 0;
+}
+
+int64_t op::internal::Convolution::get_groups() const {
+    return m_groups;
+}
+
+bool op::internal::Convolution::is_asymmetric() const {
+    return m_asymmetric;
 }
 
 }  // namespace ov
diff --git a/src/common/transformations/src/transformations/op_conversions/convert_convolution_to_convolution_internal.cpp b/src/common/transformations/src/transformations/op_conversions/convert_convolution_to_convolution_internal.cpp
@@ -2,12 +2,13 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
+#include "transformations/op_conversions/convert_convolution_to_convolution_internal.hpp"
+
 #include "itt.hpp"
 #include "openvino/core/rt_info.hpp"
 #include "openvino/op/convolution.hpp"
 #include "openvino/pass/pattern/op/wrap_type.hpp"
 #include "ov_ops/convolution.hpp"
-#include "transformations/op_conversions/convert_convolution_to_convolution_internal.hpp"
 
 using namespace ov;
 
@@ -24,11 +25,14 @@ ov::pass::ConvertConvolutionToConvolutionInternal::ConvertConvolutionToConvoluti
 
         auto new_conv = std::make_shared<ov::op::internal::Convolution>(conv->input_value(0),
                                                                         conv->input_value(1),
+                                                                        Output<Node>(),
                                                                         conv->get_strides(),
                                                                         conv->get_pads_begin(),
                                                                         conv->get_pads_end(),
                                                                         conv->get_dilations(),
-                                                                        conv->get_auto_pad());
+                                                                        -1,
+                                                                        conv->get_auto_pad(),
+                                                                        conv->get_output_element_type(0));
 
         new_conv->set_friendly_name(conv->get_friendly_name());
         copy_runtime_info(conv, new_conv);
diff --git a/src/common/transformations/src/transformations/op_conversions/convert_group_convolution_to_convolution_internal.cpp b/src/common/transformations/src/transformations/op_conversions/convert_group_convolution_to_convolution_internal.cpp
@@ -0,0 +1,52 @@
+// Copyright (C) 2018-2025 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include "transformations/op_conversions/convert_group_convolution_to_convolution_internal.hpp"
+
+#include "itt.hpp"
+#include "openvino/core/rt_info.hpp"
+#include "openvino/op/group_conv.hpp"
+#include "openvino/pass/pattern/op/wrap_type.hpp"
+#include "ov_ops/convolution.hpp"
+
+using namespace ov;
+
+ov::pass::ConvertGroupConvolutionToConvolutionInternal::ConvertGroupConvolutionToConvolutionInternal() {
+    MATCHER_SCOPE(ConvertGroupConvolutionToConvolutionInternal);
+
+    auto GroupConvolution = pattern::wrap_type<ov::op::v1::GroupConvolution>();
+
+    matcher_pass_callback gconv_callback = [](pattern::Matcher& m) {
+        auto gconv = ov::as_type_ptr<ov::op::v1::GroupConvolution>(m.get_match_root());
+        if (!gconv) {
+            return false;
+        }
+
+        int64_t groups = -1;
+        auto weights_shape = gconv->get_input_partial_shape(1);
+        if (weights_shape[0].is_dynamic()) {
+            return false;
+        }
+        groups = weights_shape[0].get_length();
+
+        auto new_conv = std::make_shared<ov::op::internal::Convolution>(gconv->input_value(0),
+                                                                        gconv->input_value(1),
+                                                                        Output<Node>(),
+                                                                        gconv->get_strides(),
+                                                                        gconv->get_pads_begin(),
+                                                                        gconv->get_pads_end(),
+                                                                        gconv->get_dilations(),
+                                                                        groups,
+                                                                        gconv->get_auto_pad(),
+                                                                        gconv->get_output_element_type(0));
+
+        new_conv->set_friendly_name(gconv->get_friendly_name());
+        copy_runtime_info(gconv, new_conv);
+        replace_node(gconv, new_conv);
+        return true;
+    };
+
+    auto gconv_m = std::make_shared<pattern::Matcher>(GroupConvolution, matcher_name);
+    this->register_matcher(gconv_m, gconv_callback);
+}
diff --git a/src/common/transformations/src/transformations/op_conversions/convolution_bias_fusion.cpp b/src/common/transformations/src/transformations/op_conversions/convolution_bias_fusion.cpp
@@ -110,7 +110,9 @@ ov::pass::ConvolutionBiasFusion::ConvolutionBiasFusion() {
                                                                         conv->get_pads_begin(),
                                                                         conv->get_pads_end(),
                                                                         conv->get_dilations(),
-                                                                        conv->get_auto_pad());
+                                                                        conv->get_groups(),
+                                                                        conv->get_auto_pad(),
+                                                                        conv->get_output_element_type(0));
 
         new_ops.push_back(new_conv);
 
diff --git a/src/core/shape_inference/include/convolution_shape_inference.hpp b/src/core/shape_inference/include/convolution_shape_inference.hpp
@@ -15,7 +15,6 @@ template <class TOp,
           class TShape,
           class TRShape = result_shape_t<TShape>,
           typename std::enable_if<std::is_same<TOp, v1::Convolution>::value ||
-                                  std::is_same<TOp, internal::Convolution>::value ||
                                   std::is_same<TOp, v1::BinaryConvolution>::value>::type* = nullptr>
 std::vector<TRShape> shape_infer(const TOp* op,
                                  const std::vector<TShape>& input_shapes,
diff --git a/src/core/shape_inference/include/internal_convolution_shape_inference.hpp b/src/core/shape_inference/include/internal_convolution_shape_inference.hpp
@@ -0,0 +1,93 @@
+// Copyright (C) 2018-2025 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+#pragma once
+
+#include "convolution_shape_inference_util.hpp"
+#include "openvino/op/convolution.hpp"
+#include "ov_ops/convolution.hpp"
+#include "utils.hpp"
+
+namespace ov {
+namespace op {
+
+template <class TOp,
+          class TShape,
+          class TRShape = result_shape_t<TShape>,
+          typename std::enable_if<std::is_same<TOp, internal::Convolution>::value>::type* = nullptr>
+std::vector<TRShape> shape_infer(const TOp* op,
+                                 const std::vector<TShape>& input_shapes,
+                                 CoordinateDiff& pads_begin,
+                                 CoordinateDiff& pads_end) {
+    NODE_VALIDATION_CHECK(op, input_shapes.size() >= 2);
+    using namespace ov::util;
+
+    const auto num_spatial = convolution::calculate_num_spatial(op, input_shapes);
+
+    auto output_shapes = std::vector<TRShape>(1);
+    auto& output_shape = output_shapes[0];
+    if (num_spatial != util::num_spatial_undefined) {
+        const auto& data_shape = input_shapes[0];
+        const auto& filters_shape = input_shapes[1];
+        const auto data_rank = data_shape.rank();
+        const auto filters_rank = filters_shape.rank();
+
+        if (op->get_groups() > 1) {
+            convolution::resize_empty_padding(num_spatial, pads_begin, pads_end);
+            if (is_attr_validation_required(op)) {
+                convolution::validate::data_shape(op, data_shape);
+
+                NODE_VALIDATION_CHECK(op,
+                                      data_rank.compatible(filters_rank - 1),
+                                      "Data batch and filters rank do not match (data batch shape: ",
+                                      data_shape,
+                                      ", filters shape: ",
+                                      filters_shape,
+                                      ").");
+
+                convolution::validate::common_attributes(op, num_spatial, pads_begin, pads_end);
+            }
+            convolution::apply_padding(op, data_shape, filters_shape, pads_begin, pads_end);
+
+            output_shape.reserve(util::spatial_dim_offset + num_spatial);
+            output_shape.emplace_back(data_rank.is_static() ? data_shape[0] : dim::inf_bound);
+
+            if (filters_rank.is_static()) {
+                auto groups = filters_shape[0];
+
+                if (data_rank.is_static() && filters_shape[2].is_static()) {
+                    NODE_VALIDATION_CHECK(
+                        op,
+                        groups.merge(groups, groups, (data_shape[1] / filters_shape[2].get_length())),
+                        "Input channels dimension of data batch is incompatible with filter groups or input channels.");
+                }
+
+                groups *= filters_shape[1];
+                output_shape.push_back(std::move(groups));
+            } else {
+                output_shape.emplace_back(dim::inf_bound);
+            }
+        } else {
+            convolution::resize_empty_padding(num_spatial, pads_begin, pads_end);
+            convolution::validate::filter_shape(op, filters_shape, data_shape);
+            if (is_attr_validation_required(op)) {
+                convolution::validate::data_shape(op, data_shape);
+                convolution::validate::common_attributes(op, num_spatial, pads_begin, pads_end);
+            }
+            convolution::apply_padding(op, data_shape, filters_shape, pads_begin, pads_end);
+
+            output_shape.reserve(util::spatial_dim_offset + num_spatial);
+            output_shape.emplace_back(data_rank.is_static() ? data_shape[0] : dim::inf_bound);
+            output_shape.emplace_back(filters_rank.is_static() ? filters_shape[0] : dim::inf_bound);
+        }
+
+        convolution::append_spatial_shape(op, data_shape, filters_shape, pads_begin, pads_end, output_shape);
+    } else {
+        output_shape = PartialShape::dynamic();
+    }
+
+    return output_shapes;
+}
+
+}  // namespace op
+}  // namespace ov
diff --git a/src/plugins/intel_cpu/src/graph_optimizer.cpp b/src/plugins/intel_cpu/src/graph_optimizer.cpp
@@ -328,9 +328,7 @@ void GraphOptimizer::FuseConvolutionMatMulDeconvAndBias(Graph& graph) {
         }
 
         if (!deconv) {
-            return (node->getType() == Type::MatMul ||
-                    (node->getType() == Type::Convolution && node->getAlgorithm() == Algorithm::ConvolutionGrouped)) &&
-                   node->getParentEdges().size() == 2;
+            return node->getType() == Type::MatMul && node->getParentEdges().size() == 2;
         }
         return deconv->canFuseBias();
     };
diff --git a/src/plugins/intel_cpu/src/nodes/conv.cpp b/src/plugins/intel_cpu/src/nodes/conv.cpp
@@ -272,10 +272,10 @@ Convolution::Convolution(const std::shared_ptr<ov::Node>& op, const GraphContext
     auto internalConvolutionOp = ov::as_type_ptr<ov::op::internal::Convolution>(op);
 
     if (internalConvolutionOp) {
-        algorithm = Algorithm::ConvolutionBiased;
-        withBiases = true;
-        groupNum = 1;
-        isGrouped = false;
+        withBiases = internalConvolutionOp->inputs().size() > 2;
+        isGrouped = internalConvolutionOp->get_groups() > 1;
+        groupNum = isGrouped ? internalConvolutionOp->input_value(1).get_shape()[0] : 1;
+        algorithm = isGrouped ? Algorithm::ConvolutionGrouped : Algorithm::ConvolutionBiased;
 
         weightDims = internalConvolutionOp->input_value(1).get_shape();
 
diff --git a/src/plugins/intel_cpu/src/shape_inference/shape_inference.cpp b/src/plugins/intel_cpu/src/shape_inference/shape_inference.cpp
@@ -65,6 +65,7 @@
 #include "gru_cell_shape_inference.hpp"
 #include "gru_sequence_shape_inference.hpp"
 #include "i420_shape_inference.hpp"
+#include "internal_convolution_shape_inference.hpp"
 #include "interpolate_shape_inference.hpp"
 #include "inverse_shape_inference.hpp"
 #include "irdft_shape_inference.hpp"
diff --git a/src/plugins/intel_cpu/src/transformations/cpu_opset/convert_to_cpu_specific_opset.hpp b/src/plugins/intel_cpu/src/transformations/cpu_opset/convert_to_cpu_specific_opset.hpp
diff --git a/src/plugins/intel_cpu/tests/unit/shape_inference_test/convolution_biased_shape_inference_test.cpp b/src/plugins/intel_cpu/tests/unit/shape_inference_test/convolution_biased_shape_inference_test.cpp

Original file line number	Diff line number	Diff line change
`@@ -328,9 +328,7 @@ void GraphOptimizer::FuseConvolutionMatMulDeconvAndBias(Graph& graph) {`
`328`	`328`	`}`
`329`	`329`
`330`	`330`	`if (!deconv) {`
`331`		`- return (node->getType() == Type::MatMul \|\|`
`332`		`- (node->getType() == Type::Convolution && node->getAlgorithm() == Algorithm::ConvolutionGrouped)) &&`
`333`		`- node->getParentEdges().size() == 2;`
	`331`	`+ return node->getType() == Type::MatMul && node->getParentEdges().size() == 2;`
`334`	`332`	`}`
`335`	`333`	`return deconv->canFuseBias();`
`336`	`334`	`};`