Source code for panda_guard.role.attacks.gptfuzzer_attack.utils.predict

from transformers import RobertaForSequenceClassification, RobertaTokenizer
import torch


[docs]class Predictor:
    def __init__(self, path):
        self.path = path

[docs]    def predict(self, sequences):
        raise NotImplementedError("Predictor must implement predict method.")


[docs]class RoBERTaPredictor(Predictor):
    def __init__(self, path, device='cuda'):
        super().__init__(path)
        self.device = device
        self.model = RobertaForSequenceClassification.from_pretrained(
            self.path).to(self.device)
        self.tokenizer = RobertaTokenizer.from_pretrained(self.path)

[docs]    def predict(self, sequences):
        inputs = self.tokenizer(sequences, padding=True, truncation=True,
                                max_length=512, return_tensors="pt").to(self.device)
        with torch.no_grad():
            outputs = self.model(**inputs)

        predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
        _, predicted_classes = torch.max(predictions, dim=1)
        predicted_classes = predicted_classes.cpu().tolist()
        return predicted_classes