PyTorch3 Flashcards

Question

Set train vs eval mode

Answer 1

``` model.train() # ... training model.eval() # ... evaluation ```

Answer 2

``` x = torch.tensor([1.0, 2.0], requires_grad=True) ```

Answer 3

``` loss.backward() ```

Answer 4

``` optimizer.zero_grad() loss.backward() optimizer.step() # call zero_grad each step unless intentionally accumulating ``` - backward() computes and stores grads in param.grad - step() reads param.grad and updates param (plus its optimizer state)

Answer 5

``` for p in model.parameters(): if p.grad is not None: print(p.grad.norm()) ```

Answer 6

``` y = x.detach() # or for numpy arr = x.detach().cpu().numpy() ```

Answer 7

``` val = loss.item() ```

Answer 8

``` import torch.nn as nn class M(nn.Module): def __init__(self): super().__init__() self.fc = nn.Linear(10, 3) def forward(self, x): return self.fc(x) model = M() ```

Answer 9

``` import torch.nn as nn fc = nn.Linear(128, 10) conv = nn.Conv2d(3, 16, 3, padding=1) emb = nn.Embedding(5000, 128) ```

Answer 10

``` import torch.nn.functional as F y = F.relu(x) y = F.gelu(x) ```

Answer 11

``` drop = nn.Dropout(p=0.5) y = drop(x) # active only in model.train() ```

Answer 12

``` bn = nn.BatchNorm1d(num_features=128) y = bn(x) ``` - it would be 2D or 3D for image data

Answer 13

``` import torch.nn.functional as F loss = F.cross_entropy(logits, targets) # targets: int64 class indices ```

Answer 14

``` import torch.nn.functional as F loss = F.mse_loss(pred, y) ```

Answer 15

``` import torch.nn.functional as F loss = F.binary_cross_entropy_with_logits(logits, targets.float()) ```

Answer 16

``` import torch.optim as optim opt = optim.Adam(model.parameters(), lr=1e-3) # opt = optim.SGD(model.parameters(), lr=1e-2, momentum=0.9) ```

Answer 17

``` opt.zero_grad() loss.backward() opt.step() ```

Answer 18

``` from torch.optim.lr_scheduler import StepLR sched = StepLR(opt, step_size=10, gamma=0.1) # after each epoch: sched.step() ``` - step_size is how often LR is updated - gamma is by how much it is decreased

Answer 19

``` import torch.nn.utils as U U.clip_grad_norm_(model.parameters(), max_norm=1.0) ```

Answer 20

``` import torch torch.save(model.state_dict(), 'model.pt') ```

Answer 21

``` import torch model.load_state_dict(torch.load('model.pt', map_location='cpu')) model.eval() ```

Answer 22

``` torch.save({'epoch': epoch, 'model': model.state_dict(), 'opt': opt.state_dict()}, 'ckpt.pt') ```

Answer 23

``` ckpt = torch.load('ckpt.pt', map_location='cpu') model.load_state_dict(ckpt['model']) opt.load_state_dict(ckpt['opt']) start_epoch = ckpt['epoch'] + 1 ```

Answer 24

``` from torch.utils.data import Dataset class MyDS(Dataset): def __init__(self, xs, ys): self.xs, self.ys = xs, ys def __len__(self): return len(self.xs) def __getitem__(self, i): return self.xs[i], self.ys[i] ```

Answer 25

``` from torch.utils.data import DataLoader loader = DataLoader(ds, batch_size=32, shuffle=True, num_workers=2) ```

Answer 26

``` xb, yb = xb.to(device), yb.to(device) ```

Answer 27

``` model.train() for xb, yb in loader: xb, yb = xb.to(device), yb.to(device) opt.zero_grad() logits = model(xb) loss = F.cross_entropy(logits, yb) loss.backward() opt.step() ```

Answer 28

``` model.eval() correct = 0 with torch.no_grad(): for xb, yb in loader: logits = model(xb.to(device)) pred = logits.argmax(1).cpu() correct += (pred == yb).sum().item() ```

Answer 29

``` import torch print(torch.cuda.is_available()) if torch.cuda.is_available(): print(torch.cuda.get_device_name(0)) ```

Answer 30

``` import torch torch.cuda.empty_cache() ```

Answer 31

``` for p in model.parameters(): p.requires_grad_(False) ```

Answer 32

``` for p in model.parameters(): p.requires_grad_(True) ```

Answer 33

``` params = list(model.parameters()) num = sum(p.numel() for p in model.parameters()) ```

Answer 34

``` import torch.nn as nn for m in model.modules(): if isinstance(m, nn.Linear): nn.init.xavier_uniform_(m.weight) nn.init.zeros_(m.bias) ```

Answer 35

``` arr = x.detach().cpu().numpy() ```

Answer 36

``` y = torch.nn.functional.one_hot(labels, num_classes=C).float() ```

Answer 37

``` pred = logits.argmax(dim=1) acc = (pred == y).float().mean().item() ```

PyTorch3 Flashcards

(61 cards)