dismecpp/prediction_2prediction_8h_source.html

 // Copyright (c) 2021, Aalto University, developed by Erik Schultheis

 // All rights reserved.

 //

 // SPDX-License-Identifier: MIT


 #ifndef DISMEC_PREDICTION_H

 #define DISMEC_PREDICTION_H


 #include "parallel/task.h"

 #include "parallel/numa.h"

 #include "matrix_types.h"

 #include "fwd.h"

 #include <memory>


 namespace dismec::prediction {

     using model::Model;


     class PredictionBase : public parallel::TaskGenerator {

     public:

         PredictionBase(const DatasetBase* data, std::shared_ptr<const Model> model);


     protected:

         const DatasetBase* m_Data;

         std::shared_ptr<const Model> m_Model;


         void make_thread_local_features(long num_threads);


         void init_thread(thread_id_t thread_id) final;


         void do_prediction(long begin, long end, thread_id_t thread_id, Eigen::Ref<PredictionMatrix> target);


     private:

         parallel::NUMAReplicator<const GenericFeatureMatrix> m_FeatureReplicator;


         std::vector<std::shared_ptr<const GenericFeatureMatrix>> m_ThreadLocalFeatures;

     };


     class FullPredictionTaskGenerator : public PredictionBase {

     public:


         FullPredictionTaskGenerator(const DatasetBase* data, std::shared_ptr<const Model> model);


         void prepare(long num_threads, long chunk_size) override;

         void run_tasks(long begin, long end, thread_id_t thread_id) override;

         [[nodiscard]] long num_tasks() const override;


         [[nodiscard]] const PredictionMatrix& get_predictions() const { return m_Predictions; }

     private:

         PredictionMatrix m_Predictions;

     };


     class TopKPredictionTaskGenerator : public PredictionBase {

     public:

         TopKPredictionTaskGenerator(const DatasetBase* data, std::shared_ptr<const Model> model, long K);


         void update_model(std::shared_ptr<const Model> model);


         void run_tasks(long begin, long end, thread_id_t thread_id) override;


         [[nodiscard]] long num_tasks() const override;

         void prepare(long num_threads, long chunk_size) override;

         void finalize() override;


         [[nodiscard]] const PredictionMatrix& get_top_k_values() const { return m_TopKValues; }

         [[nodiscard]] const IndexMatrix& get_top_k_indices() const { return m_TopKIndices; }


         [[nodiscard]] const std::array<std::int64_t, 4>& get_confusion_matrix() const { return m_ConfusionMatrix; }


         static constexpr const int TRUE_POSITIVES  = 0;

         static constexpr const int FALSE_POSITIVES = 1;

         static constexpr const int TRUE_NEGATIVES  = 2;

         static constexpr const int FALSE_NEGATIVES = 3;

     private:

         long m_K;


         PredictionMatrix m_TopKValues;

         IndexMatrix m_TopKIndices;


         std::vector<PredictionMatrix> m_ThreadLocalPredictionCache;

         std::vector<PredictionMatrix> m_ThreadLocalTopKValues;

         std::vector<IndexMatrix> m_ThreadLocalTopKIndices;

         std::vector<std::array<std::int64_t, 4>> m_ThreadLocalConfusionMatrix;


         std::vector<std::vector<long>> m_GroundTruth;

         std::array<std::int64_t, 4> m_ConfusionMatrix;

     };

 }

 #endif //DISMEC_PREDICTION_H

dismec::DatasetBase
Definition: data.h:15

dismec::parallel::NUMAReplicator
Helper class to ensure that each NUMA node has its own copy of some immutable data.
Definition: numa.h:72

dismec::parallel::TaskGenerator
Base class for all parallelized operations.
Definition: task.h:21

dismec::parallel::thread_id_t
Strong typedef for an int to signify a thread id.
Definition: thread_id.h:20

dismec::prediction::FullPredictionTaskGenerator
Definition: prediction.h:70

dismec::prediction::FullPredictionTaskGenerator::num_tasks
long num_tasks() const override
Definition: prediction.cpp:65

dismec::prediction::FullPredictionTaskGenerator::run_tasks
void run_tasks(long begin, long end, thread_id_t thread_id) override
Definition: prediction.cpp:70

dismec::prediction::FullPredictionTaskGenerator::m_Predictions
PredictionMatrix m_Predictions
Definition: prediction.h:81

dismec::prediction::FullPredictionTaskGenerator::get_predictions
const PredictionMatrix & get_predictions() const
Definition: prediction.h:79

dismec::prediction::FullPredictionTaskGenerator::FullPredictionTaskGenerator
FullPredictionTaskGenerator(const DatasetBase *data, std::shared_ptr< const Model > model)
Definition: prediction.cpp:59

dismec::prediction::FullPredictionTaskGenerator::prepare
void prepare(long num_threads, long chunk_size) override
Called to notify the TaskGenerator about the number of threads.
Definition: prediction.cpp:75

dismec::prediction::PredictionBase
Base class for handling predictions.
Definition: prediction.h:34

dismec::prediction::PredictionBase::do_prediction
void do_prediction(long begin, long end, thread_id_t thread_id, Eigen::Ref< PredictionMatrix > target)
Predicts the scores for a subset of the instances given by the half-open interval [begin,...
Definition: prediction.cpp:51

dismec::prediction::PredictionBase::init_thread
void init_thread(thread_id_t thread_id) final
Called once a thread has spun up, but before it runs its first task.
Definition: prediction.cpp:38

dismec::prediction::PredictionBase::PredictionBase
PredictionBase(const DatasetBase *data, std::shared_ptr< const Model > model)
Constructor, checks that data and model are compatible.
Definition: prediction.cpp:17

dismec::prediction::PredictionBase::m_ThreadLocalFeatures
std::vector< std::shared_ptr< const GenericFeatureMatrix > > m_ThreadLocalFeatures
Definition: prediction.h:67

dismec::prediction::PredictionBase::m_Model
std::shared_ptr< const Model > m_Model
Model (possibly partial) for which prediction is run.
Definition: prediction.h:41

dismec::prediction::PredictionBase::m_Data
const DatasetBase * m_Data
Data on which the prediction is run.
Definition: prediction.h:40

dismec::prediction::PredictionBase::m_FeatureReplicator
parallel::NUMAReplicator< const GenericFeatureMatrix > m_FeatureReplicator
The NUMAReplicator that generates NUMA-local copies for the feature matrices.
Definition: prediction.h:63

dismec::prediction::PredictionBase::make_thread_local_features
void make_thread_local_features(long num_threads)
Definition: prediction.cpp:34

dismec::prediction::TopKPredictionTaskGenerator
Definition: prediction.h:84

dismec::prediction::TopKPredictionTaskGenerator::TRUE_POSITIVES
static constexpr const int TRUE_POSITIVES
Definition: prediction.h:101

dismec::prediction::TopKPredictionTaskGenerator::get_top_k_indices
const IndexMatrix & get_top_k_indices() const
Definition: prediction.h:97

dismec::prediction::TopKPredictionTaskGenerator::m_TopKIndices
IndexMatrix m_TopKIndices
Definition: prediction.h:109

dismec::prediction::TopKPredictionTaskGenerator::finalize
void finalize() override
Called after all threads have finished their tasks.
Definition: prediction.cpp:124

dismec::prediction::TopKPredictionTaskGenerator::m_ThreadLocalTopKValues
std::vector< PredictionMatrix > m_ThreadLocalTopKValues
Definition: prediction.h:112

dismec::prediction::TopKPredictionTaskGenerator::m_ThreadLocalPredictionCache
std::vector< PredictionMatrix > m_ThreadLocalPredictionCache
Definition: prediction.h:111

dismec::prediction::TopKPredictionTaskGenerator::update_model
void update_model(std::shared_ptr< const Model > model)
Definition: prediction.cpp:210

dismec::prediction::TopKPredictionTaskGenerator::get_top_k_values
const PredictionMatrix & get_top_k_values() const
Definition: prediction.h:96

dismec::prediction::TopKPredictionTaskGenerator::m_GroundTruth
std::vector< std::vector< long > > m_GroundTruth
Definition: prediction.h:116

dismec::prediction::TopKPredictionTaskGenerator::m_ThreadLocalTopKIndices
std::vector< IndexMatrix > m_ThreadLocalTopKIndices
Definition: prediction.h:113

dismec::prediction::TopKPredictionTaskGenerator::TRUE_NEGATIVES
static constexpr const int TRUE_NEGATIVES
Definition: prediction.h:103

dismec::prediction::TopKPredictionTaskGenerator::m_K
long m_K
Definition: prediction.h:106

dismec::prediction::TopKPredictionTaskGenerator::TopKPredictionTaskGenerator
TopKPredictionTaskGenerator(const DatasetBase *data, std::shared_ptr< const Model > model, long K)
Definition: prediction.cpp:80

dismec::prediction::TopKPredictionTaskGenerator::FALSE_POSITIVES
static constexpr const int FALSE_POSITIVES
Definition: prediction.h:102

dismec::prediction::TopKPredictionTaskGenerator::get_confusion_matrix
const std::array< std::int64_t, 4 > & get_confusion_matrix() const
Definition: prediction.h:99

dismec::prediction::TopKPredictionTaskGenerator::FALSE_NEGATIVES
static constexpr const int FALSE_NEGATIVES
Definition: prediction.h:104

dismec::prediction::TopKPredictionTaskGenerator::run_tasks
void run_tasks(long begin, long end, thread_id_t thread_id) override
Definition: prediction.cpp:133

dismec::prediction::TopKPredictionTaskGenerator::num_tasks
long num_tasks() const override
Definition: prediction.cpp:99

dismec::prediction::TopKPredictionTaskGenerator::prepare
void prepare(long num_threads, long chunk_size) override
Called to notify the TaskGenerator about the number of threads.
Definition: prediction.cpp:103

dismec::prediction::TopKPredictionTaskGenerator::m_ConfusionMatrix
std::array< std::int64_t, 4 > m_ConfusionMatrix
Definition: prediction.h:117

dismec::prediction::TopKPredictionTaskGenerator::m_TopKValues
PredictionMatrix m_TopKValues
Definition: prediction.h:108

dismec::prediction::TopKPredictionTaskGenerator::m_ThreadLocalConfusionMatrix
std::vector< std::array< std::int64_t, 4 > > m_ThreadLocalConfusionMatrix
Definition: prediction.h:114

fwd.h
Forward-declares types.

matrix_types.h

dismec::prediction
Definition: evaluate.h:14

dismec::IndexMatrix
types::DenseRowMajor< long > IndexMatrix
Matrix used for indices in sparse predictions.
Definition: matrix_types.h:81

dismec::PredictionMatrix
types::DenseRowMajor< real_t > PredictionMatrix
Dense matrix in Row Major format used for predictions.
Definition: matrix_types.h:75

numa.h

task.h