dismecpp/py__train_8cpp_source.html

 // Copyright (c) 2021, Aalto University, developed by Erik Schultheis

 // All rights reserved.

 //

 // SPDX-License-Identifier: MIT


 #include "binding.h"


 #include "data/data.h"


 #include "training/weighting.h"

 #include "training/training.h"

 #include "training/initializer.h"

 #include "training/postproc.h"


 #include "parallel/runner.h"

 #include "objective/regularizers.h"


 #include "spdlog/fmt/fmt.h"


 using namespace dismec;

 using PyWeighting = std::shared_ptr<WeightingScheme>;


 void register_regularizers(pybind11::module_& root) {

     auto m = root.def_submodule("reg", "Regularizer configuration types");

     py::class_<objective::SquaredNormConfig>(m, "SquaredNormConfig")

         .def(py::init<real_t, bool>(),

              py::kw_only(), py::arg("strength"), py::arg("ignore_bias") = true)

         .def_readwrite("strength", &objective::SquaredNormConfig::Strength)

         .def_readwrite("ignore_bias", &objective::SquaredNormConfig::IgnoreBias)

         .def("__repr__",

              [](const objective::SquaredNormConfig &a) {

                  return fmt::format("SquaredNormConfig(strength={}, ignore_bias={})", a.Strength, a.IgnoreBias ? "True" : "False");

              }

         );


     py::class_<objective::HuberConfig>(m, "HuberConfig")

         .def(py::init<real_t, real_t, bool>(),

              py::kw_only(), py::arg("strength"), py::arg("epsilon"), py::arg("ignore_bias") = true)

         .def_readwrite("strength", &objective::HuberConfig::Strength)

         .def_readwrite("epsilon", &objective::HuberConfig::Epsilon)

         .def_readwrite("ignore_bias", &objective::HuberConfig::IgnoreBias)

         .def("__repr__",

              [](const objective::HuberConfig &a) {

                  return fmt::format("HuberConfig(strength={}, epsilon={}, ignore_bias={})", a.Strength, a.Epsilon, a.IgnoreBias ? "True" : "False");

              }

         );


     py::class_<objective::ElasticConfig>(m, "ElasticConfig")

         .def(py::init<real_t, real_t, real_t, bool>(),

              py::kw_only(), py::arg("strength"), py::arg("epsilon"), py::arg("interpolation"), py::arg("ignore_bias") = true)

         .def_readwrite("strength", &objective::ElasticConfig::Strength)

         .def_readwrite("epsilon", &objective::ElasticConfig::Epsilon)

         .def_readwrite("interpolation", &objective::ElasticConfig::Interpolation)

         .def_readwrite("ignore_bias", &objective::ElasticConfig::IgnoreBias)

         .def("__repr__",

              [](const objective::ElasticConfig &a) {

                  return fmt::format("ElasticConfig(strength={}, epsilon={}, interpolation={}, ignore_bias={})", a.Strength, a.Epsilon, a.Interpolation, a.IgnoreBias ? "True" : "False");

              }

         );

 }


 namespace {

     auto get_positive_weight(const WeightingScheme& pds, long label) {

         return pds.get_positive_weight(label_id_t{label});

     }

     auto get_negative_weight(const WeightingScheme& pds, long label) {

         return pds.get_negative_weight(label_id_t{label});

     }


     PyWeighting make_constant(double pos, double neg) {

         return std::make_shared<ConstantWeighting>(pos, neg);

     }

     PyWeighting make_propensity(const DatasetBase& data, double a, double b) {

         return std::make_shared<PropensityWeighting>(PropensityModel(&data, a, b));

     }

     PyWeighting make_custom(DenseRealVector pos, DenseRealVector neg) {

         return std::make_shared<CustomWeighting>(std::move(pos), std::move(neg));

     }

 }


 void register_weighting(pybind11::module_& m) {

     py::class_<WeightingScheme, std::shared_ptr<WeightingScheme>>(m, "WeightingScheme")

         .def("positive_weight", get_positive_weight, py::arg("label"))

         .def("negative_weight", get_negative_weight, py::arg("label"))

         .def_static("Constant", make_constant,

                     py::kw_only(), py::arg("positive") = 1.0, py::arg("negative") = 1.0)

         .def_static("Propensity", make_propensity,

                     py::arg("dataset"),

                     py::kw_only(), py::arg("a") = 0.55, py::arg("b") = 1.5)

         .def_static("Custom", make_custom,

                     py::kw_only(), py::arg("positive"), py::arg("negative"))

         ;

 }


 void register_init(pybind11::module_& root) {

     auto m = root.def_submodule("init", "Initialization configuration types");

     using namespace init;


     py::class_<WeightInitializationStrategy, std::shared_ptr<WeightInitializationStrategy>>(m, "Initializer");

     m.def("zero", [](){

         return create_zero_initializer();

     });


     m.def("constant", [](const DenseRealVector& vec){

         return create_constant_initializer(vec);

     }, py::arg("vector"));


     m.def("feature_mean", [](std::shared_ptr<DatasetBase> dataset, real_t pos, real_t neg){

         return create_feature_mean_initializer(dataset, pos, neg);

     }, py::kw_only(), py::arg("data"), py::arg("positive_margin")=1, py::arg("negative_margin")=-2);


     m.def("multi_feature_mean", [](std::shared_ptr<DatasetBase> dataset, int max_pos, real_t pos, real_t neg){

         return create_multi_pos_mean_strategy(dataset, max_pos, pos, neg);

     }, py::kw_only(), py::arg("data"), py::arg("max_pos"), py::arg("positive_margin")=1, py::arg("negative_margin")=-2);


     m.def("ova_primal", [](std::shared_ptr<DatasetBase> dataset, RegularizerSpec reg, LossType loss){

         return create_ova_primal_initializer(dataset, reg, loss);

     }, py::kw_only(), py::arg("data"), py::arg("reg"), py::arg("loss"));

 }


 void register_training(pybind11::module_& m) {

     register_weighting(m);

     register_regularizers(m);

     register_init(m);


     py::class_<DismecTrainingConfig>(m, "TrainingConfig")

         .def(py::init([](PyWeighting weighting, RegularizerSpec regularizer, std::shared_ptr<init::WeightInitializationStrategy> init, LossType loss, real_t culling) {

             std::shared_ptr<postproc::PostProcessFactory> pf{};

             bool sparse = false;

             if(culling > 0) {

                 pf = postproc::create_culling(culling);

                 sparse = true;

             }

             return DismecTrainingConfig{std::move(weighting), std::move(init), std::move(pf), nullptr, sparse, regularizer, loss};

         }), py::kw_only(), py::arg("weighting"), py::arg("regularizer"), py::arg("init"),

              py::arg("loss"), py::arg("culling"))

         .def_readwrite("regularizer", &DismecTrainingConfig::Regularizer)

         .def_readwrite("sparse_model", &DismecTrainingConfig::Sparse)

         .def_readwrite("weighting", &DismecTrainingConfig::Weighting)

         .def_readwrite("loss", &DismecTrainingConfig::Loss);


     py::enum_<LossType>(m, "LossType")

         .value("SquaredHinge", LossType::SQUARED_HINGE)

         .value("Hinge", LossType::HINGE)

         .value("Logistic", LossType::LOGISTIC)

         .value("HuberHinge", LossType::HUBER_HINGE);


     /*

     std::shared_ptr<postproc::PostProcessFactory> PostProcessing;

     std::shared_ptr<TrainingStatsGatherer> StatsGatherer;

      */


     m.def("parallel_train", [](const PyDataSet& data, const py::dict& hyper_params,

             const DismecTrainingConfig& config, long label_begin,

             long label_end, long threads) -> py::dict

     {

         HyperParameters hps;

         for (auto item : hyper_params)

         {

             if(pybind11::isinstance<pybind11::int_>(item.second)) {

                 hps.set(item.first.cast<std::string>(), item.second.cast<long>());

             } else {

                 hps.set(item.first.cast<std::string>(), item.second.cast<double>());

             }

         }


         auto spec = create_dismec_training(data, hps, config);


         parallel::ParallelRunner runner(threads);

         runner.set_logger(spdlog::default_logger());

         // TODO give more detailled result

         auto result = run_training(runner, spec, label_id_t{label_begin}, label_id_t{label_end});

         py::dict rdict;

         rdict["loss"] = result.TotalLoss;

         rdict["grad"] = result.TotalGrad;

         rdict["finished"] = result.IsFinished;

         rdict["model"] = PyModel(std::move(result.Model));

         return rdict;

     }, py::arg("data"), py::arg("hyperparameters"), py::arg("spec"), py::arg("label_begin") = 0, py::arg("label_end") = -1,

         py::arg("num_threads") = -1, py::call_guard<py::gil_scoped_release>());

     // TODO check constness and lifetime of returns

 }

binding.h

PyDataSet
std::shared_ptr< dismec::DatasetBase > PyDataSet
Definition: binding.h:81

PyModel
PyWrapper< dismec::model::Model > PyModel
Definition: binding.h:83

PyWeighting
std::shared_ptr< dismec::WeightingScheme > PyWeighting
Definition: binding.h:82

dismec::DatasetBase
Definition: data.h:15

dismec::HyperParameters
This class represents a set of hyper-parameters.
Definition: hyperparams.h:241

dismec::PropensityModel
Definition: weighting.h:14

dismec::WeightingScheme
Base class for label-based weighting schemes.
Definition: weighting.h:32

dismec::WeightingScheme::get_positive_weight
virtual double get_positive_weight(label_id_t label_id) const =0
Gets the weight to use for all examples where the label label_id is present.

dismec::WeightingScheme::get_negative_weight
virtual double get_negative_weight(label_id_t label_id) const =0
Gets the weight to use for all examples where the label label_id is absent.

dismec::label_id_t
Strong typedef for an int to signify a label id.
Definition: types.h:20

dismec::parallel::ParallelRunner
Definition: runner.h:25

dismec::parallel::ParallelRunner::set_logger
void set_logger(std::shared_ptr< spdlog::logger > logger)
sets the logger object that is used for reporting. Set to nullptr for quiet mode.
Definition: runner.cpp:28

data.h

initializer.h

anonymous_namespace{py_train.cpp}::get_negative_weight
auto get_negative_weight(const WeightingScheme &pds, long label)
Definition: py_train.cpp:67

anonymous_namespace{py_train.cpp}::make_constant
PyWeighting make_constant(double pos, double neg)
Definition: py_train.cpp:71

anonymous_namespace{py_train.cpp}::make_propensity
PyWeighting make_propensity(const DatasetBase &data, double a, double b)
Definition: py_train.cpp:74

anonymous_namespace{py_train.cpp}::get_positive_weight
auto get_positive_weight(const WeightingScheme &pds, long label)
Definition: py_train.cpp:64

anonymous_namespace{py_train.cpp}::make_custom
PyWeighting make_custom(DenseRealVector pos, DenseRealVector neg)
Definition: py_train.cpp:77

dismec::init::create_zero_initializer
std::shared_ptr< WeightInitializationStrategy > create_zero_initializer()
Creates an initialization strategy that initializes all weight vectors to zero.
Definition: zero.cpp:33

dismec::init::create_feature_mean_initializer
std::shared_ptr< WeightInitializationStrategy > create_feature_mean_initializer(std::shared_ptr< DatasetBase > data, real_t pos=1, real_t neg=-2)
Creates an initialization strategy based on the mean of positive and negative features.
Definition: msi.cpp:90

dismec::init::create_multi_pos_mean_strategy
std::shared_ptr< WeightInitializationStrategy > create_multi_pos_mean_strategy(std::shared_ptr< DatasetBase > data, int max_pos, real_t pos=1, real_t neg=-2)
Creates an initialization strategy based on the mean of positive and negative features.
Definition: multi_pos.cpp:212

dismec::init::create_constant_initializer
std::shared_ptr< WeightInitializationStrategy > create_constant_initializer(DenseRealVector vec)
Definition: constant.cpp:56

dismec::init::create_ova_primal_initializer
std::shared_ptr< WeightInitializationStrategy > create_ova_primal_initializer(const std::shared_ptr< DatasetBase > &data, RegularizerSpec regularizer, LossType loss)
Definition: ova-primal.cpp:15

dismec::postproc::create_culling
FactoryPtr create_culling(real_t eps)
Definition: postproc.cpp:54

dismec
Main namespace in which all types, classes, and functions are defined.
Definition: app.h:15

dismec::run_training
TrainingResult run_training(parallel::ParallelRunner &runner, std::shared_ptr< TrainingSpec > spec, label_id_t begin_label=label_id_t{0}, label_id_t end_label=label_id_t{-1})
Definition: training.cpp:122

dismec::RegularizerSpec
std::variant< objective::SquaredNormConfig, objective::HuberConfig, objective::ElasticConfig > RegularizerSpec
Definition: spec.h:143

dismec::DenseRealVector
types::DenseVector< real_t > DenseRealVector
Any dense, real values vector.
Definition: matrix_types.h:40

dismec::LossType
LossType
Definition: spec.h:129

dismec::LossType::HINGE
@ HINGE

dismec::LossType::LOGISTIC
@ LOGISTIC

dismec::LossType::HUBER_HINGE
@ HUBER_HINGE

dismec::LossType::SQUARED_HINGE
@ SQUARED_HINGE

dismec::create_dismec_training
std::shared_ptr< TrainingSpec > create_dismec_training(std::shared_ptr< const DatasetBase > data, HyperParameters params, DismecTrainingConfig config)
Definition: dismec.cpp:157

dismec::real_t
float real_t
The default type for floating point values.
Definition: config.h:17

postproc.h

register_regularizers
void register_regularizers(pybind11::module_ &root)
Definition: py_train.cpp:23

register_weighting
void register_weighting(pybind11::module_ &m)
Definition: py_train.cpp:82

register_training
void register_training(pybind11::module_ &m)
Definition: py_train.cpp:123

register_init
void register_init(pybind11::module_ &root)
Definition: py_train.cpp:96

regularizers.h

runner.h

dismec::DismecTrainingConfig
Definition: spec.h:145

dismec::DismecTrainingConfig::Regularizer
RegularizerSpec Regularizer
Definition: spec.h:151

dismec::DismecTrainingConfig::Weighting
std::shared_ptr< WeightingScheme > Weighting
Definition: spec.h:146

dismec::DismecTrainingConfig::Sparse
bool Sparse
Definition: spec.h:150

dismec::DismecTrainingConfig::Loss
LossType Loss
Definition: spec.h:152

dismec::TrainingResult::TotalLoss
real_t TotalLoss
Definition: training.h:75

dismec::objective::ElasticConfig
Definition: regularizers.h:17

dismec::objective::ElasticConfig::Epsilon
real_t Epsilon
Definition: regularizers.h:17

dismec::objective::ElasticConfig::IgnoreBias
bool IgnoreBias
Definition: regularizers.h:17

dismec::objective::ElasticConfig::Strength
real_t Strength
Definition: regularizers.h:17

dismec::objective::ElasticConfig::Interpolation
real_t Interpolation
Definition: regularizers.h:17

dismec::objective::HuberConfig
Definition: regularizers.h:16

dismec::objective::HuberConfig::Strength
real_t Strength
Definition: regularizers.h:16

dismec::objective::HuberConfig::IgnoreBias
bool IgnoreBias
Definition: regularizers.h:16

dismec::objective::HuberConfig::Epsilon
real_t Epsilon
Definition: regularizers.h:16

dismec::objective::SquaredNormConfig
Definition: regularizers.h:15

dismec::objective::SquaredNormConfig::Strength
real_t Strength
Definition: regularizers.h:15

dismec::objective::SquaredNormConfig::IgnoreBias
bool IgnoreBias
Definition: regularizers.h:15

training.h

weighting.h