openvinotoolkit · Aryan8912 · Apr 28, 2024 · May 6, 2024 · May 6, 2024 · May 13, 2024
@@ -896,6 +896,55 @@ void jit_select_emitter::emit_isa(const std::vector<size_t> &in_vec_idxs, const
     h->mov(dst.b16, aux.b16);
 }
 
+// SoftPlus
+jit_soft_plus_emitter::jit_soft_plus_emitter(dnnl::impl::cpu::aarch64::jit_generator* host,
+                                             dnnl::impl::cpu::aarch64::cpu_isa_t host_isa,
+                                             const std::shared_ptr<ov::Node>& node)
+                                             : jit_emitter(host, host_isa, node, get_arithmetic_binary_exec_precision(node)) {
+}
+jit_soft_plus_emitter::jit_soft_plus_emitter(dnnl::impl::cpu::aarch64::jit_generator* host,
+                                             dnnl::impl::cpu::aarch64::cpu_isa_t host_isa,
+                                             const ov::element::Type exec_prc)
+                                             : jit_emitter(host, host_isa, exec_prc) {
+}
+size_t jit_soft_plus_emitter::get_inputs_count() const { return 1; }
+size_t jit_soft_plus_emitter::get_aux_vecs_count() const { return 1; }
+
+std::set<std::vector<element::Type>> jit_soft_plus_emitter::get_supported_precisions(const std::shared_ptr<ov::Node>& node) {
+    return {{element::f32}};
+}
+
+void jit_soft_plus_emitter::emit_impl(const std::vector<size_t>& in_vec_idxs, const std::vector<size_t>& out_vec_idxs) const {
+    if (host_isa_ == dnnl::impl::cpu::aarch64::asimd) {
+        emit_isa<dnnl::impl::cpu::aarch64::asimd>(in_vec_idxs, out_vec_idxs);
+    } else {
+        OV_CPU_JIT_EMITTER_THROW("Can't create jit eltwise kernel");
+    }
+}
+
+template <dnnl::impl::cpu::aarch64::cpu_isa_t isa>
+    void jit_soft_plus_emitter::emit_isa(const std::vector<size_t> &in_vec_idxs, const std::vector<size_t> &out_vec_idxs) const {
+        OV_CPU_JIT_EMITTER_ASSERT(exec_prc_ == ov::element::f32, "unsupported precision: " + exec_prc_.to_string());
+        using TReg = typename dnnl::impl::cpu::aarch64::cpu_isa_traits<isa>::TReg;
+        const TReg src = TReg(in_vec_idxs[0]);
+        const TReg dst = TReg(out_vec_idxs[0]);
+        const TReg aux = TReg(aux_vec_idxs[0]);
+        h->vldr(src.d, v0.d);
+        h->vmul(dst.d, v0.d, v0.d);
+        h->vcvt(dst.s, dst.d);
+        h->vfma(dst.s, v0.s, vptrue, v1.s, dst.s);
+        h->vmaxnm(dst.s, dst.s, vmmin.s);
+        h->vcvt(dst.d, dst.s);
+        h->vexp2(dst.d, dst.d);
+        h->vadd(dst.d, dst.d, vone.d);
+        h->vrcps(dst.d, dst.d);
+        h->vrsqrts(dst.d, dst.d);
+        h->vadd(dst.d, dst.d, vzero.d);
+        h->vst1(dst.d, ptr[dst_reg]);
+    }
+}    
+
+
 /// SIGMOID ///
 jit_sigmoid_emitter::jit_sigmoid_emitter(dnnl::impl::cpu::aarch64::jit_generator* host,
                                          dnnl::impl::cpu::aarch64::cpu_isa_t host_isa,

@@ -377,6 +377,29 @@ class jit_select_emitter : public jit_emitter {
     void emit_isa(const std::vector<size_t> &in_vec_idxs, const std::vector<size_t> &out_vec_idxs) const;
 };
 
+class jit_soft_plus_emitter : public jit_emitter {
+public:
+    jit_soft_plus_emitter(dnnl::impl::cpu::aarch64::jit_generator *host,
+                          dnnl::impl::cpu::aarch64::cpu_isa_t host_isa,
+                          const ov::element::Type exec_prc = ov::element::f32);
+
+    jit_soft_plus_emitter(dnnl::impl::cpu::aarch64::jit_generator *host,
+                          dnnl::impl::cpu::aarch64::cpu_isa_t host_isa,
+                          const std::shared_ptr<ov::Node>& node);
+
+    size_t get_inputs_count() const override;
+    size_t get_aux_vecs_count() const override;
+
+    static std::set<std::vector<element::Type>> get_supported_precisions(const std::shared_ptr<ov::Node>& node = nullptr);
+
+private:
+    void emit_impl(const std::vector<size_t> &in_vec_idxs, const
+    std::vector<size_t> &out_vec_idxs) const override;
+    template <dnnl::impl::cpu::aarch64::cpu_isa_t isa>
+    void emit_isa(const std::vector<size_t> &in_vec_idxs, const std::vector<size_t> &out_vec_idxs) const;
+};
+
+
 class jit_sigmoid_emitter : public jit_emitter {
 public:
     jit_sigmoid_emitter(dnnl::impl::cpu::aarch64::jit_generator* host,

@@ -33,6 +33,7 @@ bool JitEltwiseExecutor::isSupported(
                                      Algorithm::EltwisePrelu,
                                      Algorithm::EltwiseRelu,
                                      Algorithm::EltwiseSelect,
+                                     Algorithm::EltwiseSoftPlus,
                                      Algorithm::EltwiseSigmoid,
                                      Algorithm::EltwiseSubtract,
                                      Algorithm::EltwiseSwish,

@@ -634,6 +634,7 @@ std::shared_ptr<jit_emitter> jit_uni_eltwise_generic<isa>::create_eltwise_emitte
     OV_CASE(Algorithm::EltwisePrelu, ov::intel_cpu::aarch64::jit_prelu_emitter),
     OV_CASE(Algorithm::EltwiseRelu, ov::intel_cpu::aarch64::jit_relu_emitter),
     OV_CASE(Algorithm::EltwiseSelect, ov::intel_cpu::aarch64::jit_select_emitter),
+    OV_CASE(Algorithms::EltwiseSoftPlus, ov::intel_cpu::aarch64::jit_soft_plus_emitter),
     OV_CASE(Algorithm::EltwiseSigmoid, ov::intel_cpu::aarch64::jit_sigmoid_emitter),
     OV_CASE(Algorithm::EltwiseSubtract, ov::intel_cpu::aarch64::jit_subtract_emitter),
     OV_CASE(Algorithm::EltwiseSwish, ov::intel_cpu::aarch64::jit_swish_emitter),
@@ -797,6 +798,7 @@ std::set<std::vector<element::Type>> eltwise_precision_helper::get_supported_pre
         OV_CASE(Algorithm::EltwisePrelu, jit_prelu_emitter),
         OV_CASE(Algorithm::EltwisePowerStatic, jit_power_static_emitter),
         OV_CASE(Algorithm::EltwiseSelect, jit_select_emitter),
+        OV_CASE(Algorithms::EltwiseSoftPlus, jit_soft_plus_emitter),
         OV_CASE(Algorithm::EltwiseSigmoid, jit_sigmoid_emitter),
         OV_CASE(Algorithm::EltwiseSubtract, jit_subtract_emitter),
         OV_CASE(Algorithm::EltwiseSwish, jit_swish_emitter),

@@ -157,6 +157,7 @@ std::string ActivationLayerCPUTest::getPrimitiveType(const utils::ActivationType
         (activation_type == utils::ActivationTypes::Exp) ||
         (activation_type == utils::ActivationTypes::HSwish) ||
         (activation_type == utils::ActivationTypes::Relu) ||
+        (activation_type == utils::ActivationTypes::Softplus) ||
         (activation_type == utils::ActivationTypes::Sigmoid) ||
         (activation_type == utils::ActivationTypes::Swish) ||
         (activation_type == utils::ActivationTypes::Tanh))) {