Transformers documentation

模型输出

Transformers

You are viewing v4.36.1 version. A newer version v4.49.0 is available.

Join the Hugging Face community

and get access to the augmented documentation experience

Collaborate on models, datasets and Spaces

Faster examples with accelerated inference

Switch between documentation themes

to get started

模型输出

所有模型的输出都是 ModelOutput 的子类的实例。这些是包含模型返回的所有信息的数据结构，但也可以用作元组或字典。

让我们看一个例子：

from transformers import BertTokenizer, BertForSequenceClassification
import torch

tokenizer = BertTokenizer.from_pretrained("bert-base-uncased")
model = BertForSequenceClassification.from_pretrained("bert-base-uncased")

inputs = tokenizer("Hello, my dog is cute", return_tensors="pt")
labels = torch.tensor([1]).unsqueeze(0)  # Batch size 1
outputs = model(**inputs, labels=labels)

outputs 对象是 SequenceClassifierOutput，如下面该类的文档中所示，它表示它有一个可选的 loss，一个 logits，一个可选的 hidden_states 和一个可选的 attentions 属性。在这里，我们有 loss，因为我们传递了 labels，但我们没有 hidden_states 和 attentions，因为我们没有传递 output_hidden_states=True 或 output_attentions=True。

当传递 output_hidden_states=True 时，您可能希望 outputs.hidden_states[-1] 与 outputs.last_hidden_states 完全匹配。然而，这并不总是成立。一些模型在返回最后的 hidden state时对其应用归一化或其他后续处理。

您可以像往常一样访问每个属性，如果模型未返回该属性，您将得到 None。在这里，例如，outputs.loss 是模型计算的损失，而 outputs.attentions 是 None。

当将我们的 outputs 对象视为元组时，它仅考虑那些没有 None 值的属性。例如这里它有两个元素，loss 和 logits，所以

outputs[:2]

将返回元组 (outputs.loss, outputs.logits)。

将我们的 outputs 对象视为字典时，它仅考虑那些没有 None 值的属性。例如在这里它有两个键，分别是 loss 和 logits。

我们在这里记录了被多个类型模型使用的通用模型输出。特定输出类型在其相应的模型页面上有文档。

Transformers

模型输出

ModelOutput

class transformers.utils.ModelOutput

to_tuple

BaseModelOutput

class transformers.modeling_outputs.BaseModelOutput

BaseModelOutputWithPooling

class transformers.modeling_outputs.BaseModelOutputWithPooling

BaseModelOutputWithCrossAttentions

class transformers.modeling_outputs.BaseModelOutputWithCrossAttentions

BaseModelOutputWithPoolingAndCrossAttentions

class transformers.modeling_outputs.BaseModelOutputWithPoolingAndCrossAttentions

BaseModelOutputWithPast

class transformers.modeling_outputs.BaseModelOutputWithPast

BaseModelOutputWithPastAndCrossAttentions

class transformers.modeling_outputs.BaseModelOutputWithPastAndCrossAttentions

Seq2SeqModelOutput

class transformers.modeling_outputs.Seq2SeqModelOutput

CausalLMOutput

class transformers.modeling_outputs.CausalLMOutput

CausalLMOutputWithCrossAttentions

class transformers.modeling_outputs.CausalLMOutputWithCrossAttentions

CausalLMOutputWithPast

class transformers.modeling_outputs.CausalLMOutputWithPast

MaskedLMOutput

class transformers.modeling_outputs.MaskedLMOutput

Seq2SeqLMOutput

class transformers.modeling_outputs.Seq2SeqLMOutput

NextSentencePredictorOutput

class transformers.modeling_outputs.NextSentencePredictorOutput

SequenceClassifierOutput

class transformers.modeling_outputs.SequenceClassifierOutput

Seq2SeqSequenceClassifierOutput

class transformers.modeling_outputs.Seq2SeqSequenceClassifierOutput

MultipleChoiceModelOutput

class transformers.modeling_outputs.MultipleChoiceModelOutput

TokenClassifierOutput

class transformers.modeling_outputs.TokenClassifierOutput

QuestionAnsweringModelOutput

class transformers.modeling_outputs.QuestionAnsweringModelOutput

Seq2SeqQuestionAnsweringModelOutput

class transformers.modeling_outputs.Seq2SeqQuestionAnsweringModelOutput

Seq2SeqSpectrogramOutput

class transformers.modeling_outputs.Seq2SeqSpectrogramOutput

SemanticSegmenterOutput

class transformers.modeling_outputs.SemanticSegmenterOutput

ImageClassifierOutput

class transformers.modeling_outputs.ImageClassifierOutput

ImageClassifierOutputWithNoAttention

class transformers.modeling_outputs.ImageClassifierOutputWithNoAttention

DepthEstimatorOutput

class transformers.modeling_outputs.DepthEstimatorOutput

Wav2Vec2BaseModelOutput

class transformers.modeling_outputs.Wav2Vec2BaseModelOutput

XVectorOutput

class transformers.modeling_outputs.XVectorOutput

Seq2SeqTSModelOutput

class transformers.modeling_outputs.Seq2SeqTSModelOutput

Seq2SeqTSPredictionOutput

class transformers.modeling_outputs.Seq2SeqTSPredictionOutput

SampleTSPredictionOutput

class transformers.modeling_outputs.SampleTSPredictionOutput

TFBaseModelOutput

class transformers.modeling_tf_outputs.TFBaseModelOutput

TFBaseModelOutputWithPooling

class transformers.modeling_tf_outputs.TFBaseModelOutputWithPooling

TFBaseModelOutputWithPoolingAndCrossAttentions

class transformers.modeling_tf_outputs.TFBaseModelOutputWithPoolingAndCrossAttentions

TFBaseModelOutputWithPast

class transformers.modeling_tf_outputs.TFBaseModelOutputWithPast

TFBaseModelOutputWithPastAndCrossAttentions

class transformers.modeling_tf_outputs.TFBaseModelOutputWithPastAndCrossAttentions

TFSeq2SeqModelOutput

class transformers.modeling_tf_outputs.TFSeq2SeqModelOutput

TFCausalLMOutput

class transformers.modeling_tf_outputs.TFCausalLMOutput

TFCausalLMOutputWithCrossAttentions

class transformers.modeling_tf_outputs.TFCausalLMOutputWithCrossAttentions

TFCausalLMOutputWithPast