df/d23/MLModelRunner_8h_source.html

//===- MLModelRunner.h ---- ML model runner interface -----------*- C++ -*-===//

//

// Part of the MLCompilerBridge Project, under the Apache License v2.0 with LLVM

// Exceptions. See the LICENSE file for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

// (Preliminary version adopted from MLModelRunner.h of LLVM 17.X)

//

//===----------------------------------------------------------------------===//

//===----------------------------------------------------------------------===//


#ifndef ML_MODEL_RUNNER_H

#define ML_MODEL_RUNNER_H


#include "SerDes/baseSerDes.h"

#include "SerDes/bitstreamSerDes.h"

#include "SerDes/jsonSerDes.h"


#include <cstdlib>

#include <future>

#include <memory>

#include <string>

#include <type_traits>


#ifndef C_LIBRARY

#include "SerDes/protobufSerDes.h"

#include "SerDes/tensorflowSerDes.h"

#endif

namespace MLBridge {


class MLModelRunner {

public:

  // Disallows copy and assign.

  MLModelRunner(const MLModelRunner &) = delete;

  MLModelRunner &operator=(const MLModelRunner &) = delete;

  virtual ~MLModelRunner() = default;


  template <typename T>


  typename std::enable_if<std::is_fundamental<T>::value, T>::type evaluate() {

    return *reinterpret_cast<T *>(evaluateUntyped());

  }


  template <typename T>

  typename std::enable_if<

      std::is_fundamental<typename std::remove_pointer<T>::type>::value,

      void>::type


  evaluate(T &data, size_t &dataSize) {

    using BaseType = typename std::remove_pointer<T>::type;

    void *res = evaluateUntyped();

    T ret = static_cast<T>(malloc(SerDes->getMessageLength()));

    memcpy(ret, res, SerDes->getMessageLength());

    dataSize = SerDes->getMessageLength() / sizeof(BaseType);

    data = ret;

  }


  enum class Kind : int { Unknown, Pipe, gRPC, ONNX, TFAOT };


  Kind getKind() const { return Type; }

  SerDesKind getSerDesKind() const { return SerDesType; }


  virtual void requestExit() = 0;


  template <typename U, typename T, typename... Types>


  void populateFeatures(const std::pair<U, T> &var1,

                        const std::pair<U, Types> &...var2) {

    SerDes->setFeature(var1.first, var1.second);

    populateFeatures(var2...);

  }


  template <typename U, typename T, typename... Types>


  void populateFeatures(const std::pair<U, T> &&var1,

                        const std::pair<U, Types> &&...var2) {

    SerDes->setFeature(var1.first, var1.second);

    populateFeatures(var2...);

  }


  void populateFeatures() {}


  void setRequest(void *request) { SerDes->setRequest(request); }


  void setResponse(void *response) { SerDes->setResponse(response); }


protected:


  MLModelRunner(Kind Type, SerDesKind SerDesType,

                llvm::LLVMContext *Ctx = nullptr)

      : Ctx(Ctx), Type(Type), SerDesType(SerDesType) {

    assert(Type != Kind::Unknown);

    initSerDes();

  }


  MLModelRunner(Kind Type, llvm::LLVMContext *Ctx = nullptr)

      : Ctx(Ctx), Type(Type), SerDesType(SerDesKind::Unknown) {

    SerDes = nullptr;

  };


  virtual void *evaluateUntyped() = 0;


  llvm::LLVMContext *Ctx;

  const Kind Type;

  const SerDesKind SerDesType;


protected:

  std::unique_ptr<BaseSerDes> SerDes;


private:


  void initSerDes() {

    switch (SerDesType) {

    case SerDesKind::Json:

      SerDes = std::make_unique<JsonSerDes>();

      break;

    case SerDesKind::Bitstream:

      SerDes = std::make_unique<BitstreamSerDes>();

      break;

#ifndef C_LIBRARY

    case SerDesKind::Protobuf:

      SerDes = std::make_unique<ProtobufSerDes>();

      break;

    case SerDesKind::Tensorflow:

      SerDes = std::make_unique<TensorflowSerDes>();

      break;

#endif

    case SerDesKind::Unknown:

      SerDes = nullptr;

      break;

    }

  }


};


} // namespace MLBridge


#endif // LLVM_MLMODELRUNNER_H

baseSerDes.h
Supporting new SerDes:

bitstreamSerDes.h
Bitstream Serialization/Deserialization which sends header information followed by the raw data.

MLBridge::MLModelRunner
MLModelRunner - The main interface for interacting with the ML models.
Definition MLModelRunner.h:56

MLBridge::MLModelRunner::SerDesType
const SerDesKind SerDesType
Definition MLModelRunner.h:139

MLBridge::MLModelRunner::SerDes
std::unique_ptr< BaseSerDes > SerDes
Definition MLModelRunner.h:142

MLBridge::MLModelRunner::populateFeatures
void populateFeatures()
Definition MLModelRunner.h:110

MLBridge::MLModelRunner::getSerDesKind
SerDesKind getSerDesKind() const
Definition MLModelRunner.h:87

MLBridge::MLModelRunner::Kind
Kind
Type of the MLModelRunner.
Definition MLModelRunner.h:84

MLBridge::MLModelRunner::Kind::TFAOT
@ TFAOT

MLBridge::MLModelRunner::Kind::gRPC
@ gRPC

MLBridge::MLModelRunner::Kind::Pipe
@ Pipe

MLBridge::MLModelRunner::Kind::Unknown
@ Unknown

MLBridge::MLModelRunner::Kind::ONNX
@ ONNX

MLBridge::MLModelRunner::setRequest
void setRequest(void *request)
Mainly used in the case of gRPC where the request object is not known explicitly.
Definition MLModelRunner.h:114

MLBridge::MLModelRunner::populateFeatures
void populateFeatures(const std::pair< U, T > &var1, const std::pair< U, Types > &...var2)
User-facing interface for setting the features to be sent to the model.
Definition MLModelRunner.h:97

MLBridge::MLModelRunner::MLModelRunner
MLModelRunner(Kind Type, llvm::LLVMContext *Ctx=nullptr)
Definition MLModelRunner.h:128

MLBridge::MLModelRunner::getKind
Kind getKind() const
Definition MLModelRunner.h:86

MLBridge::MLModelRunner::evaluate
std::enable_if< std::is_fundamental< T >::value, T >::type evaluate()
Main user-facing method for interacting with the ML models.
Definition MLModelRunner.h:65

MLBridge::MLModelRunner::MLModelRunner
MLModelRunner(Kind Type, SerDesKind SerDesType, llvm::LLVMContext *Ctx=nullptr)
Definition MLModelRunner.h:121

MLBridge::MLModelRunner::MLModelRunner
MLModelRunner(const MLModelRunner &)=delete

MLBridge::MLModelRunner::populateFeatures
void populateFeatures(const std::pair< U, T > &&var1, const std::pair< U, Types > &&...var2)
Definition MLModelRunner.h:104

MLBridge::MLModelRunner::Ctx
llvm::LLVMContext * Ctx
Definition MLModelRunner.h:137

MLBridge::MLModelRunner::~MLModelRunner
virtual ~MLModelRunner()=default

MLBridge::MLModelRunner::evaluate
std::enable_if< std::is_fundamental< typenamestd::remove_pointer< T >::type >::value, void >::type evaluate(T &data, size_t &dataSize)
Main user-facing method for interacting with the ML models.
Definition MLModelRunner.h:74

MLBridge::MLModelRunner::Type
const Kind Type
Definition MLModelRunner.h:138

MLBridge::MLModelRunner::operator=
MLModelRunner & operator=(const MLModelRunner &)=delete

MLBridge::MLModelRunner::initSerDes
void initSerDes()
Definition MLModelRunner.h:145

MLBridge::MLModelRunner::evaluateUntyped
virtual void * evaluateUntyped()=0
Should be implemented by the derived class to call the model and get the result.

MLBridge::MLModelRunner::setResponse
void setResponse(void *response)
Mainly used in the case of gRPC where the response object is not known explicitly.
Definition MLModelRunner.h:118

MLBridge::MLModelRunner::requestExit
virtual void requestExit()=0

jsonSerDes.h
Json Serialization/Deserialization using LLVM's json library.

MLBridge
Definition gRPCModelRunner.h:75

MLBridge::SerDesKind
SerDesKind
This is the base class for SerDes.
Definition baseSerDes.h:46

MLBridge::SerDesKind::Bitstream
@ Bitstream

MLBridge::SerDesKind::Unknown
@ Unknown

MLBridge::SerDesKind::Tensorflow
@ Tensorflow

MLBridge::SerDesKind::Protobuf
@ Protobuf

MLBridge::SerDesKind::Json
@ Json

protobufSerDes.h
Protobuf Serialization/Deserialization to support gRPC communication.

tensorflowSerDes.h
Serialization/Deserialization to support TF AOT models.