docs/html/regression_8hpp_source.html

 #ifndef REGRESSION_HPP
 #define REGRESSION_HPP


 #include <limits>

 #include <iostream>
 #include <fstream>
 #include <sstream>

 #include <stdio.h>

 #include <hmlp.h>

 #include <gofmm.hpp>
 #include <Data.hpp>
 #include <containers/KernelMatrix.hpp>


 using namespace std;
 using namespace hmlp;


 namespace hmlp
 {

 template<typename T>
 class Regression
 {
   public:

     Regression( size_t d, size_t n, Data<T> *X, Data<T> *Y )
     {
       this->d = d;
       this->n = n;
       this->X = X;
       this->Y = Y;
     };


     Data<T> Ridge( kernel_s<T> &kernel, size_t niter )
     {
       size_t nrhs = Y->col();

       Data<T> XXt( d, d, 0.0 );
       Data<T> XY( d, nrhs, 0.0 );

       xsyrk( "Lower", "No transpose", d, n,
           1.0, X->data(), d, 0.0, XXt.data(), d );

       for ( size_t i = 0; i < d; i ++ ) XXt( i, i ) += lambda;

       xgemm( "No transpose", "No transpose", d, n, nrhs,
           1.0, X->data(), d,
                Y->data(), Y->row(),
           0.0, XY.data(), d );

       xposv( "Lower", d, nrhs, X->data(), d, XY.data(), d );

       return XY;

     };
     Data<T> Lasso( kernel_s<T> &kernel, size_t niter )
     {
     };
     Data<T> SoftMax( kernel_s<T> &kernel, size_t nclass, size_t niter )
     {
       KernelMatrix<T> K( n, n, d, kernel, *X );

       gofmm::SimpleGOFMM<T, KernelMatrix<T>> H( K, 1E-3, 0.03 );

       Data<T> W( n, nclass, 1.0 );
       Data<T> P( n, nclass, 0.0 );

       for ( size_t it = 0; it < niter; it ++ )
       {
         Data<T> Gradient( n, nclass, 0.0 );

         H.Multiply( P, W );

         #pragma omp parallel for
         for ( size_t i = 0; i < n; i ++ )
         {
           T prob_all = 0.0;
           for ( size_t j = 0; j < nclass; j ++ ) prob_all  += P( i, j );
           for ( size_t j = 0; j < nclass; j ++ ) P( i, j ) /= prob_all;
           P( i, (size_t)(*Y)[ i ] ) -= 1.0;
         }

         H.Multiply( Gradient, P );

         #pragma omp parallel for
         for ( size_t i = 0; i < n; i ++ )
         {
           for ( size_t j = 0; j < nclass; j ++ )
           {
             W( i, j ) += ( -1.0 * alpha / n ) * Gradient( i, j );
           }
         }
       }

       H.Multiply( P, W );

       size_t n_correct = 0;
       for ( size_t i = 0; i < n; i ++ )
       {
         size_t goal = (*Y)[ i ];
         size_t pred = 0;
         T prob = 0.0;
         for ( size_t j = 0; j < nclass; j ++ )
         {
           if ( P( i, j ) > prob )
           {
             pred = j;
             prob = P( i, j );
           }
         }
         if ( pred == goal ) n_correct ++;
       }

       printf( "Accuracy: %lf\n", (double)n_correct / n );

       {
         ofstream fout( "weight.dat", ios::out | ios::binary );
         fout.write( (char*)W.data(), W.size() * sizeof(T) );
         fout.close();
       }


       return W;
     };


     Data<T> Solve( kernel_s<T> &kernel, size_t niter )
     {
       KernelMatrix<T> K( n, n, d, kernel, *X );

       gofmm::SimpleGOFMM<T, KernelMatrix<T>> H( K, 1E-3, 0.03 );

       Data<T> W( n, (size_t)1.0, 0.0 );
       Data<T> B( n, (size_t)1.0, 0.0 );

       for ( size_t it = 0; it < niter; it ++ )
       {
         hmlp::Data<T> Gradient( n, (size_t)1.0, 0.0 );

         //K.Multiply( Gradient, W );
         H.Multiply( Gradient, W );

         for ( size_t i = 0; i < n; i ++ )
           Gradient[ i ] += B[ i ] - (*Y)[ i ];

         //for ( size_t i = 0; i < n; i ++ )
         //  B[ i ] += ( -1.0 * alpha / n ) * Gradient[ i ];

         for ( size_t i = 0; i < n; i ++ )
           Gradient[ i ] += lambda * W[ i ];

         for ( size_t i = 0; i < n; i ++ )
           Gradient[ i ]  = ( -1.0 * alpha / n ) * Gradient[ i ];

         //K.Multiply( W, Gradient );

         hmlp::Data<T> tmp( n, (size_t)1.0, 0.0 );
         H.Multiply( tmp, Gradient );
         for ( size_t i = 0; i < n; i ++ )
           W[ i ] += tmp[ i ];


         if ( it % 100 == 0 )
         {
           hmlp::Data<T> Z = B;
           //K.Multiply( Z, W );
           H.Multiply( Z, W );

           size_t n_correct = 0;
           for ( size_t i = 0; i < n; i ++ )
           {
             double pred = (int)( Z[ i ] + 0.5 );
             double goal = (*Y)[ i ];
             if ( pred == goal ) n_correct ++;

           }

           printf( "it %4lu Accuracy: %lf\n", it, (double)n_correct / n );
         }
       };

       hmlp::Data<T> Z = B;
       //K.Multiply( Z, W );
       H.Multiply( Z, W );

       size_t n_correct = 0;
       for ( size_t i = 0; i < n; i ++ )
       {
         double pred = (int)( Z[ i ] + 0.5 );
         double goal = (*Y)[ i ];

         //printf( "pred %lf goal %lf\n", pred, goal );

         if ( pred == goal ) n_correct ++;
       }

       printf( "Accuracy: %lf\n", (double)n_correct / n );


       {
         std::ofstream fout( "weight.dat", std::ios::out | std::ios::binary );
         fout.write( (char*)W.data(), W.size() * sizeof(T) );
         fout.close();
       }
       {
         std::ofstream fout( "bias.dat", std::ios::out | std::ios::binary );
         fout.write( (char*)B.data(), B.size() * sizeof(T) );
         fout.close();
       }


       return W;
     };

   private:

     size_t d = 0;
     size_t n = 0;

     T lambda = 0.01;

     T alpha = 1.0;

     Data<T> *X = NULL;
     Data<T> *Y = NULL;

 };

 };

 #endif
hmlp::KernelMatrix
Definition: KernelMatrix.hpp:162

hmlp::Regression::SoftMax
Data< T > SoftMax(kernel_s< T > &kernel, size_t nclass, size_t niter)
Definition: regression.hpp:88

hmlp::Regression::Lasso
Data< T > Lasso(kernel_s< T > &kernel, size_t niter)
Definition: regression.hpp:82

hmlp::gofmm::SimpleGOFMM
Definition: gofmm.hpp:3779

std

hmlp::xgemm
void xgemm(const char *transA, const char *transB, int m, int n, int k, double alpha, const double *A, int lda, const double *B, int ldb, double beta, double *C, int ldc)
DGEMM wrapper.
Definition: blas_lapack.cpp:130

hmlp::kernel_s
Definition: KernelMatrix.hpp:54

hmlp::Regression
Definition: regression.hpp:30

hmlp::Data::col
size_t col() const noexcept
Definition: Data.hpp:281

hmlp::Regression::Ridge
Data< T > Ridge(kernel_s< T > &kernel, size_t niter)
: Support SVD
Definition: regression.hpp:48

hmlp::Data::row
size_t row() const noexcept
Definition: Data.hpp:278

hmlp::Data< T >

hmlp::Regression::Solve
Data< T > Solve(kernel_s< T > &kernel, size_t niter)
gradient descent
Definition: regression.hpp:167

hmlp
Definition: gofmm.hpp:83