d4/d7b/gRPCModelRunner_8h_source.html

//=== MLModelRunner/gRPCModelRunner.h -MLConfig class definition - C++ -*--===//

//

// Part of the MLCompilerBridge Project, under the Apache License v2.0 with LLVM

// Exceptions. See the LICENSE file for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===---------------------------------------------------------------------===//

// ===----------------------------------------------------------------------===//


#ifndef GRPC_MODELRUNNER_H

#define GRPC_MODELRUNNER_H


#include "MLModelRunner/MLModelRunner.h"


#include <future>

#include <google/protobuf/text_format.h>

#include <grpcpp/grpcpp.h>

#include <grpcpp/health_check_service_interface.h>

#include <memory>

#include <thread>


namespace MLBridge {

template <class Client, class Stub, class Request, class Response>


class gRPCModelRunner : public MLModelRunner {

public:


  gRPCModelRunner(std::string server_address, grpc::Service *s,

                  llvm::LLVMContext *Ctx = nullptr)

      : MLModelRunner(MLModelRunner::Kind::gRPC, SerDesKind::Protobuf, Ctx),

        server_address(server_address), request(nullptr), response(nullptr),

        server_mode(true) {

    RunService(s);

  }


  gRPCModelRunner(std::string server_address, Request *request,

                  Response *response, llvm::LLVMContext *Ctx = nullptr)

      : MLModelRunner(MLModelRunner::Kind::gRPC, SerDesKind::Protobuf, Ctx),

        server_address(server_address), request(request), response(response),

        server_mode(false) {

    SetStub();

  }


  void requestExit() override {

    std::string input;

    std::cin >> input;

    if (input == "Terminate") {

      this->exit_requested->set_value();

    } else {

      std::cout << "Problem while closing server\n";

    }

  }


private:


  bool isPortAvailable(std::string addr) {

    int max_retries = 30, attempts = 0;

    double wait_seconds = 0.2, backoff_exp = 1.2;


    int idx = addr.find(":");

    int port = stoi(addr.substr(idx + 1, addr.size() - idx - 1));


    while (attempts < max_retries) {

      std::string command = "lsof -i :" + std::to_string(port);

      FILE *pipe = popen(command.c_str(), "r");

      if (!pipe) {

        std::cerr << "Error executing command: " << std::strerror(errno)

                  << std::endl;

        return false;

      }


      char buffer[256];

      std::string result = "";

      while (!feof(pipe)) {

        if (fgets(buffer, 256, pipe) != nullptr)

          result += buffer;

      }

      pclose(pipe);


      if (result.empty()) {

        return true;

      }

      attempts++;

      std::cout << "Port is unavailable retrying! attempt: " << attempts

                << std::endl;

      std::this_thread::sleep_for(std::chrono::duration<double>(wait_seconds));

      wait_seconds *= backoff_exp;

    }


    std::cout << "Port is unavailable now!" << std::endl;

    return false;

  }


  std::promise<void> *exit_requested;


  void *evaluateUntyped() override {

    assert(!server_mode &&

           "evaluateUntyped not implemented for gRPCModelRunner; "

           "Override gRPC method instead");

    assert(request != nullptr && "Request cannot be null");


    int max_retries = 30, attempts = 0;

    double retries_wait_secs = 0.2;

    int deadline_time = 10000;

    int deadline_max_retries = 30, deadline_attpts = 0;

    double retry_wait_backoff_exponent = 1.5;


    // setting a deadline

    auto deadline = std::chrono::system_clock::now() +

                    std::chrono::milliseconds(deadline_time);


    while (attempts < max_retries && deadline_attpts < deadline_max_retries) {

      grpc::ClientContext grpcCtx;

      request = getRequest();

      grpc::Status status;

      grpcCtx.set_deadline(deadline);


      status = stub_->getAdvice(&grpcCtx, *request, response);


      if (status.error_code() == grpc::StatusCode::DEADLINE_EXCEEDED) {

        deadline_attpts++;

        int ext_deadline = 2 * deadline_time;

        deadline_time = ext_deadline;

        std::cout << "Deadline Exceeded for Request! sending the message again "

                     "with extended deadline : "

                  << deadline_time << "\n";

        deadline = std::chrono::system_clock::now() +

                   std::chrono::milliseconds(deadline_time);

      } else if (status.error_code() == grpc::StatusCode::UNAVAILABLE) {

        attempts++;

        std::cout << "Server is unavailable retrying! attempt: " << attempts

                  << "\n";

        std::this_thread::sleep_for(

            std::chrono::duration<double>(retries_wait_secs));

        retries_wait_secs *= retry_wait_backoff_exponent;

      } else {

        request->Clear();

        if (!status.ok()) {

          if (Ctx)

            Ctx->emitError("gRPC failed: " + status.error_message());

          else

            std::cerr << "gRPC failed: " << status.error_message() << std::endl;

        }

        // auto *action = new int(); // Hard wired for PosetRL case, should be

        // fixed *action = response->action(); return action;

        return SerDes->deserializeUntyped(response);

      }

    }


    std::cout << "Server is unavailable now!!!\n";

    return new int(-1);

  }


  Stub *stub_;

  std::string server_address;

  Request *request;

  Response *response;

  bool server_mode;


  int RunService(grpc::Service *s) {

    exit_requested = new std::promise<void>();

    grpc::ServerBuilder builder;

    // if (!this->isPortAvailable(server_address)) return -1;

    builder.AddListeningPort(server_address, grpc::InsecureServerCredentials());

    builder.RegisterService(s);

    std::unique_ptr<grpc::Server> server(builder.BuildAndStart());

    std::cout << "Server Listening on " << server_address << std::endl;

    auto serveFn = [&]() { server->Wait(); };

    std::thread serving_thread(serveFn);

    auto f = exit_requested->get_future();

    this->requestExit();

    f.wait();

    server->Shutdown();

    serving_thread.join();

    std::cout << "Server Shutdowns Successfully" << std::endl;

    return 0;

  }


  int SetStub() {

    std::shared_ptr<grpc::Channel> channel =

        grpc::CreateChannel(server_address, grpc::InsecureChannelCredentials());

    auto Stub_temp = Client::NewStub(channel);

    stub_ = Stub_temp.release();

    return 0;

  }


  Request *getRequest() { return (Request *)SerDes->getRequest(); }


  Response *getResponse() { return (Response *)SerDes->getResponse(); }


  void printMessage(const google::protobuf::Message *message) {

    std::string s;

    if (google::protobuf::TextFormat::PrintToString(*message, &s)) {

      std::cout << "Your message: " << s << std::endl;

    } else {

      std::cerr << "Message not valid (partial content: "

                << request->ShortDebugString() << ")\n";

    }

  }


};


} // namespace MLBridge


#endif // GRPC_MODELRUNNER_H

MLModelRunner.h
The MLModelRunner class is the main interface for interacting with the ML models.

MLBridge::MLModelRunner
MLModelRunner - The main interface for interacting with the ML models.
Definition MLModelRunner.h:56

MLBridge::MLModelRunner::SerDes
std::unique_ptr< BaseSerDes > SerDes
Definition MLModelRunner.h:142

MLBridge::MLModelRunner::Kind
Kind
Type of the MLModelRunner.
Definition MLModelRunner.h:84

MLBridge::MLModelRunner::Kind::gRPC
@ gRPC

MLBridge::MLModelRunner::Ctx
llvm::LLVMContext * Ctx
Definition MLModelRunner.h:137

MLBridge::gRPCModelRunner
This class is used to create the grpc model runner object.
Definition gRPCModelRunner.h:80

MLBridge::gRPCModelRunner::server_address
std::string server_address
Definition gRPCModelRunner.h:213

MLBridge::gRPCModelRunner::response
Response * response
Definition gRPCModelRunner.h:215

MLBridge::gRPCModelRunner::RunService
int RunService(grpc::Service *s)
This method is used to create the server and start listening.
Definition gRPCModelRunner.h:220

MLBridge::gRPCModelRunner::stub_
Stub * stub_
Definition gRPCModelRunner.h:212

MLBridge::gRPCModelRunner::SetStub
int SetStub()
This method is used to create the stub. Used in client mode.
Definition gRPCModelRunner.h:240

MLBridge::gRPCModelRunner::getRequest
Request * getRequest()
Definition gRPCModelRunner.h:248

MLBridge::gRPCModelRunner::requestExit
void requestExit() override
Definition gRPCModelRunner.h:100

MLBridge::gRPCModelRunner::getResponse
Response * getResponse()
Definition gRPCModelRunner.h:250

MLBridge::gRPCModelRunner::gRPCModelRunner
gRPCModelRunner(std::string server_address, grpc::Service *s, llvm::LLVMContext *Ctx=nullptr)
For server mode.
Definition gRPCModelRunner.h:83

MLBridge::gRPCModelRunner::server_mode
bool server_mode
Definition gRPCModelRunner.h:216

MLBridge::gRPCModelRunner::request
Request * request
Definition gRPCModelRunner.h:214

MLBridge::gRPCModelRunner::gRPCModelRunner
gRPCModelRunner(std::string server_address, Request *request, Response *response, llvm::LLVMContext *Ctx=nullptr)
For client mode.
Definition gRPCModelRunner.h:92

MLBridge::gRPCModelRunner::exit_requested
std::promise< void > * exit_requested
Definition gRPCModelRunner.h:150

MLBridge::gRPCModelRunner::printMessage
void printMessage(const google::protobuf::Message *message)
Definition gRPCModelRunner.h:252

MLBridge::gRPCModelRunner::evaluateUntyped
void * evaluateUntyped() override
This method is used to send the request to the model and get the result.
Definition gRPCModelRunner.h:154

MLBridge::gRPCModelRunner::isPortAvailable
bool isPortAvailable(std::string addr)
checks whether a port number is available or not
Definition gRPCModelRunner.h:112

MLBridge
Definition gRPCModelRunner.h:75

MLBridge::SerDesKind
SerDesKind
This is the base class for SerDes.
Definition baseSerDes.h:46

MLBridge::SerDesKind::Protobuf
@ Protobuf