dismecpp/reg__sq__hinge_8cpp_source.html

 // Copyright (c) 2021, Aalto University, developed by Erik Schultheis

 // All rights reserved.

 //

 // SPDX-License-Identifier: MIT


 #include "reg_sq_hinge.h"


 #include <utility>

 #include "utils/hash_vector.h"

 #include "utils/fast_sparse_row_iter.h"

 #include "reg_sq_hinge_detail.h"

 #include "spdlog/spdlog.h"

 #include "stats/collection.h"


 using namespace dismec::objective;

 using namespace dismec::l2_reg_sq_hinge_detail;


 namespace {

     using dismec::stats::stat_id_t;

     constexpr const stat_id_t STAT_GRAD_SPARSITY{8};

 }


 Regularized_SquaredHingeSVC::Regularized_SquaredHingeSVC(std::shared_ptr<const GenericFeatureMatrix> X,

                                                          std::unique_ptr<Objective> regularizer):

         LinearClassifierImpBase(std::move(X), std::move(regularizer))

 {


     if(!features().isCompressed()) {

         throw std::logic_error("feature matrix is not compressed.");

     }


     declare_stat(STAT_GRAD_SPARSITY, {"gradient_sparsity", "% non-zeros"});

 }


 void Regularized_SquaredHingeSVC::gradient_imp(const HashVector& location, Eigen::Ref<DenseRealVector> target) {

     gradient_and_pre_conditioner_tpl(location, target, nullptr);

 }


 void Regularized_SquaredHingeSVC::hessian_times_direction_imp(

         const HashVector& location, const DenseRealVector& direction, Eigen::Ref<DenseRealVector> output)

 {

     margin_error(location);

     htd_sum(m_MVPos, output, features(), costs(), direction);

 }


 void Regularized_SquaredHingeSVC::diag_preconditioner_imp(const HashVector& location, Eigen::Ref<DenseRealVector> target)

 {

     gradient_and_pre_conditioner_tpl(location, nullptr, target);

 }


 void Regularized_SquaredHingeSVC::gradient_and_pre_conditioner_imp(

         const HashVector& location,

         Eigen::Ref<DenseRealVector> gradient,

         Eigen::Ref<DenseRealVector> pre)

 {

     gradient_and_pre_conditioner_tpl(location, gradient, pre);

 }


 template<class T, class U>

 void Regularized_SquaredHingeSVC::gradient_and_pre_conditioner_tpl(const HashVector& location, T&& gradient, U&& pre) {

     // first, we determine whether we want to calculate gradient and/or preconditioning

     constexpr bool calc_grad = !std::is_same_v<T, std::nullptr_t>;

     constexpr bool calc_pre = !std::is_same_v<U, std::nullptr_t>;


     const auto& cost_vec = costs();

     const auto& label_vec = labels();


     margin_error(location);

     record(STAT_GRAD_SPARSITY, static_cast<real_t>(static_cast<double>(100*m_MVPos.size()) / label_vec.size()));


     const auto& ft = features();


     long shortlist_size = to_long(m_MVPos.size());

     for (long i = 0; i < shortlist_size; ++i)

     {

         int pos = m_MVPos[i];

         real_t cost = real_t{2.0} * cost_vec[pos];

         real_t vi = - cost * static_cast<real_t>(label_vec.coeff(pos)) * m_MVVal[i];

         for (FastSparseRowIter it(ft, pos); it; ++it)

         {

             if constexpr (calc_grad) {

                 gradient.coeffRef(it.col()) += it.value() * vi;

             }

             if constexpr (calc_pre) {

                 pre.coeffRef(it.col()) += it.value() * it.value() * cost;

             }

         }

     }

 }


 #include <iostream>

 void Regularized_SquaredHingeSVC::gradient_at_zero_imp(Eigen::Ref<DenseRealVector> target) {

     const auto& cost_vec = costs();

     const auto& label_vec = labels();


     for (int i = 0; i < cost_vec.size(); ++i)

     {

         real_t cost = real_t{2} * cost_vec[i];

         // margin_error = 1

         real_t vi = -cost * label_vec.coeff(i)  ;

         for (FastSparseRowIter it(features(), i); it; ++it)

         {

             target.coeffRef(it.col()) += it.value() * vi;

         }

     }

 }


 const Regularized_SquaredHingeSVC::features_t& Regularized_SquaredHingeSVC::features() const {

     return sparse_features();

 }


 void Regularized_SquaredHingeSVC::invalidate_labels() {

     // modifying the true labels invalidates margin caches

     m_Last_MV = {};

 }


 void Regularized_SquaredHingeSVC::margin_error(const HashVector& w) {

     if(w.hash() == m_Last_MV) {

         return;

     }


     m_MVPos.clear();

     m_MVVal.clear();

     m_Last_MV = w.hash();

     const auto& lbl = labels();

     const auto& xTw = x_times_w(w);

     for(Eigen::Index i = 0; i < lbl.size(); ++i) {

         real_t label = lbl.coeff(i);

         real_t d = real_t{1.0} - label * xTw.coeff(i);

         if (d > 0) {

             m_MVPos.push_back(i);

             m_MVVal.push_back(d);

         }

     }

 }

dismec::FastSparseRowIter
This is an almost verbatim copy of the SparseFeatures::InnerIterator provided by Eigen.
Definition: fast_sparse_row_iter.h:20

dismec::HashVector
An Eigen vector with versioning information, to implement simple caching of results.
Definition: hash_vector.h:43

dismec::HashVector::hash
VectorHash hash() const
Gets the unique id of this vector.
Definition: hash_vector.cpp:45

dismec::objective::LinearClassifierBase::sparse_features
const SparseFeatures & sparse_features() const
Definition: linear.cpp:43

dismec::objective::LinearClassifierBase::costs
const DenseRealVector & costs() const
Definition: linear.cpp:85

dismec::objective::LinearClassifierBase::labels
const BinaryLabelVector & labels() const
Definition: linear.cpp:89

dismec::objective::LinearClassifierBase::x_times_w
const DenseRealVector & x_times_w(const HashVector &w)
Calculates the vector of feature matrix times weights w
Definition: linear.cpp:51

dismec::objective::LinearClassifierImpBase
Implementation helper for linear classifier derived classes.
Definition: linear.h:124

dismec::objective::Objective::gradient
void gradient(const HashVector &location, Eigen::Ref< DenseRealVector > target)
Evaluate the gradient at location.
Definition: objective.cpp:96

dismec::objective::Regularized_SquaredHingeSVC::m_MVVal
std::vector< real_t > m_MVVal
Definition: reg_sq_hinge.h:61

dismec::objective::Regularized_SquaredHingeSVC::gradient_imp
void gradient_imp(const HashVector &location, Eigen::Ref< DenseRealVector > target)
Definition: reg_sq_hinge.cpp:35

dismec::objective::Regularized_SquaredHingeSVC::margin_error
void margin_error(const HashVector &w)
Definition: reg_sq_hinge.cpp:117

dismec::objective::Regularized_SquaredHingeSVC::m_Last_MV
VectorHash m_Last_MV
Definition: reg_sq_hinge.h:58

dismec::objective::Regularized_SquaredHingeSVC::hessian_times_direction_imp
void hessian_times_direction_imp(const HashVector &location, const DenseRealVector &direction, Eigen::Ref< DenseRealVector > target)
Definition: reg_sq_hinge.cpp:39

dismec::objective::Regularized_SquaredHingeSVC::gradient_and_pre_conditioner_tpl
void gradient_and_pre_conditioner_tpl(const HashVector &location, T &&gradient, U &&pre)
Definition: reg_sq_hinge.cpp:60

dismec::objective::Regularized_SquaredHingeSVC::features_t
SparseFeatures features_t
Definition: reg_sq_hinge.h:22

dismec::objective::Regularized_SquaredHingeSVC::diag_preconditioner_imp
void diag_preconditioner_imp(const HashVector &location, Eigen::Ref< DenseRealVector > target)
Definition: reg_sq_hinge.cpp:46

dismec::objective::Regularized_SquaredHingeSVC::gradient_and_pre_conditioner_imp
void gradient_and_pre_conditioner_imp(const HashVector &location, Eigen::Ref< DenseRealVector > gradient, Eigen::Ref< DenseRealVector > pre)
Definition: reg_sq_hinge.cpp:51

dismec::objective::Regularized_SquaredHingeSVC::Regularized_SquaredHingeSVC
Regularized_SquaredHingeSVC(std::shared_ptr< const GenericFeatureMatrix > X, std::unique_ptr< Objective > regularizer)
Definition: reg_sq_hinge.cpp:23

dismec::objective::Regularized_SquaredHingeSVC::gradient_at_zero_imp
void gradient_at_zero_imp(Eigen::Ref< DenseRealVector > target)
Definition: reg_sq_hinge.cpp:92

dismec::objective::Regularized_SquaredHingeSVC::features
const features_t & features() const
Definition: reg_sq_hinge.cpp:108

dismec::objective::Regularized_SquaredHingeSVC::m_MVPos
std::vector< int > m_MVPos
Definition: reg_sq_hinge.h:60

dismec::objective::Regularized_SquaredHingeSVC::invalidate_labels
void invalidate_labels() override
Definition: reg_sq_hinge.cpp:112

dismec::stats::Tracked::record
void record(stat_id_t stat, T &&value)
Record statistics. This function just forwards all its arguments to the internal StatisticsCollection...
Definition: tracked.h:90

dismec::stats::Tracked::declare_stat
void declare_stat(stat_id_t index, StatisticMetaData meta)
Declares a new statistics. This function just forwards all its arguments to the internal StatisticsCo...
Definition: tracked.cpp:16

collection.h

fast_sparse_row_iter.h

hash_vector.h

anonymous_namespace{reg_sq_hinge.cpp}::STAT_GRAD_SPARSITY
constexpr const stat_id_t STAT_GRAD_SPARSITY
Definition: reg_sq_hinge.cpp:20

dismec::l2_reg_sq_hinge_detail
Definition: reg_sq_hinge_detail.h:15

dismec::l2_reg_sq_hinge_detail::htd_sum
void htd_sum(const std::vector< int > &indices, Eigen::Ref< DenseRealVector > output, const SparseFeatures &features, const DenseRealVector &costs, const DenseRealVector &direction)
Definition: reg_sq_hinge_detail.h:27

dismec::objective
Definition: fwd.h:34

dismec::stats::stat_id_t
opaque_int_type< detail::stat_id_tag > stat_id_t
An opaque int-like type that is used to identify a statistic in a StatisticsCollection.
Definition: stat_id.h:24

dismec::to_long
constexpr long to_long(T value)
Convert the given value to long, throwing an error if the conversion is not possible.
Definition: conversion.h:14

dismec::DenseRealVector
types::DenseVector< real_t > DenseRealVector
Any dense, real values vector.
Definition: matrix_types.h:40

dismec::real_t
float real_t
The default type for floating point values.
Definition: config.h:17

reg_sq_hinge.h

reg_sq_hinge_detail.h