api/cpp/predict__util_8cc_source.html

/* Copyright 2018 Google Inc. All Rights Reserved.


Licensed under the Apache License, Version 2.0 (the "License");

you may not use this file except in compliance with the License.

You may obtain a copy of the License at


    http://www.apache.org/licenses/LICENSE-2.0


Unless required by applicable law or agreed to in writing, software

distributed under the License is distributed on an "AS IS" BASIS,

WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

See the License for the specific language governing permissions and

limitations under the License.

==============================================================================*/


#include "tensorflow_serving/servables/tensorflow/predict_util.h"


#include <map>

#include <memory>

#include <set>

#include <string>

#include <utility>

#include <vector>


#include "absl/strings/str_join.h"

#include "absl/strings/substitute.h"

#include "tensorflow/cc/saved_model/signature_constants.h"

#include "tensorflow/cc/saved_model/util.h"

#include "tensorflow/core/framework/tensor.pb.h"

#include "tensorflow/core/lib/core/errors.h"

#include "tensorflow/core/protobuf/named_tensor.pb.h"

#include "tensorflow_serving/servables/tensorflow/util.h"


namespace tensorflow {

namespace serving {

namespace {


Status VerifySignature(const SignatureDef& signature) {

  if (GetSignatureMethodNameCheckFeature() &&

      signature.method_name() != kPredictMethodName &&

      signature.method_name() != kClassifyMethodName &&

      signature.method_name() != kRegressMethodName) {

    return errors::Internal(strings::StrCat(

        "Expected prediction signature method_name to be one of {",

        kPredictMethodName, ", ", kClassifyMethodName, ", ", kRegressMethodName,

        "}. Was: ", signature.method_name()));

  }

  return absl::OkStatus();

}


Status VerifyRequestInputsSize(const SignatureDef& signature,

                               const PredictRequest& request) {

  if (request.inputs().size() > signature.inputs().size() ||

      (request.inputs().size() < signature.inputs().size() &&

       signature.defaults().empty())) {

    const std::set<string> request_inputs = GetMapKeys(request.inputs());

    const std::set<string> signature_inputs = GetMapKeys(signature.inputs());

    const std::set<string> sent_extra =

        SetDifference(request_inputs, signature_inputs);

    const std::set<string> missing =

        SetDifference(signature_inputs, request_inputs);

    return tensorflow::Status(

        static_cast<absl::StatusCode>(absl::StatusCode::kInvalidArgument),

        absl::StrCat(

            "input size does not match signature: ", request.inputs().size(),

            "!=", signature.inputs().size(), " len({",

            absl::StrJoin(request_inputs, ","), "}) != len({",

            absl::StrJoin(signature_inputs, ","), "}). Sent extra: {",

            absl::StrJoin(sent_extra, ","), "}. Missing but required: {",

            absl::StrJoin(missing, ","), "}."));

  }

  return absl::OkStatus();

}


}  // namespace


namespace internal {

Status RunPredict(

    const RunOptions& run_options, const MetaGraphDef& meta_graph_def,

    const absl::optional<int64_t>& servable_version,

    const internal::PredictResponseTensorSerializationOption option,

    Session* session, const PredictRequest& request, PredictResponse* response,

    const thread::ThreadPoolOptions& thread_pool_options) {

  // Validate signatures.

  const string signature_name = request.model_spec().signature_name().empty()

                                    ? kDefaultServingSignatureDefKey

                                    : request.model_spec().signature_name();

  auto iter = meta_graph_def.signature_def().find(signature_name);

  if (iter == meta_graph_def.signature_def().end()) {

    return errors::FailedPrecondition(strings::StrCat(

        "Serving signature key \"", signature_name, "\" not found."));

  }

  const SignatureDef& signature = iter->second;


  MakeModelSpec(request.model_spec().name(), signature_name, servable_version,

                response->mutable_model_spec());


  std::vector<std::pair<string, Tensor>> input_tensors;

  std::vector<string> output_tensor_names;

  std::vector<string> output_tensor_aliases;

  TF_RETURN_IF_ERROR(PreProcessPrediction(signature, request, &input_tensors,

                                          &output_tensor_names,

                                          &output_tensor_aliases));

  std::vector<Tensor> outputs;

  RunMetadata run_metadata;

  const uint64_t start_microseconds = EnvTime::NowMicros();

  TF_RETURN_IF_ERROR(session->Run(run_options, input_tensors,

                                  output_tensor_names, {}, &outputs,

                                  &run_metadata, thread_pool_options));

  const uint64_t end_microseconds = EnvTime::NowMicros();

  RecordRuntimeLatency(request.model_spec().name(), /*api=*/"Predict",

                       /*runtime=*/"TF1",

                       end_microseconds - start_microseconds);


  return PostProcessPredictionResult(output_tensor_aliases, outputs, option,

                                     response);

}


Status PreProcessPrediction(const SignatureDef& signature,

                            const PredictRequest& request,

                            std::vector<std::pair<string, Tensor>>* inputs,

                            std::vector<string>* output_tensor_names,

                            std::vector<string>* output_tensor_aliases) {

  TF_RETURN_IF_ERROR(VerifySignature(signature));

  TF_RETURN_IF_ERROR(VerifyRequestInputsSize(signature, request));

  TF_RETURN_IF_ERROR(

      saved_model::GetInputValues(signature, request.inputs(), *inputs));


  // Prepare run target.

  std::set<string> seen_outputs;

  std::vector<string> output_filter(request.output_filter().begin(),

                                    request.output_filter().end());

  for (auto& alias : output_filter) {

    auto iter = signature.outputs().find(alias);

    if (iter == signature.outputs().end()) {

      return tensorflow::Status(

          static_cast<absl::StatusCode>(absl::StatusCode::kInvalidArgument),

          strings::StrCat("output tensor alias not found in signature: ", alias,

                          " Outputs expected to be in the set {",

                          absl::StrJoin(GetMapKeys(signature.outputs()), ","),

                          "}."));

    }

    if (seen_outputs.find(alias) != seen_outputs.end()) {

      return tensorflow::Status(

          static_cast<absl::StatusCode>(absl::StatusCode::kInvalidArgument),

          "duplicate output tensor alias: " + alias);

    }

    seen_outputs.insert(alias);

    output_tensor_names->emplace_back(iter->second.name());

    output_tensor_aliases->emplace_back(alias);

  }

  // When no output is specified, fetch all output tensors specified in

  // the signature.

  if (output_tensor_names->empty()) {

    for (auto& iter : signature.outputs()) {

      output_tensor_names->emplace_back(iter.second.name());

      output_tensor_aliases->emplace_back(iter.first);

    }

  }

  return absl::OkStatus();

}


Status PostProcessPredictionResult(

    const std::vector<string>& output_tensor_aliases,

    const std::vector<Tensor>& output_tensors,

    const internal::PredictResponseTensorSerializationOption option,

    PredictResponse* response) {

  // Validate and return output.

  if (output_tensors.size() != output_tensor_aliases.size()) {

    return tensorflow::Status(

        static_cast<tensorflow::errors::Code>(absl::StatusCode::kUnknown),

        "Predict internal error");

  }

  switch (option) {

    case internal::PredictResponseTensorSerializationOption::kAsProtoField: {

      for (int i = 0; i < output_tensors.size(); i++) {

        output_tensors[i].AsProtoField(

            &((*response->mutable_outputs())[output_tensor_aliases[i]]));

      }

    } break;

    case internal::PredictResponseTensorSerializationOption::kAsProtoContent: {

      for (int i = 0; i < output_tensors.size(); i++) {

        output_tensors[i].AsProtoTensorContent(

            &((*response->mutable_outputs())[output_tensor_aliases[i]]));

      }

    } break;

  }


  return absl::OkStatus();

}


}  // namespace internal


Status RunPredict(const RunOptions& run_options,

                  const MetaGraphDef& meta_graph_def,

                  const absl::optional<int64_t>& servable_version,

                  Session* session, const PredictRequest& request,

                  PredictResponse* response,

                  const thread::ThreadPoolOptions& thread_pool_options) {

  return internal::RunPredict(

      run_options, meta_graph_def, servable_version,

      internal::PredictResponseTensorSerializationOption::kAsProtoField,

      session, request, response, thread_pool_options);

}


}  // namespace serving

}  // namespace tensorflow