기계는 거짓말하지 않는다

torchvision transforms Resize의 size 매개변수 본문

AI

torchvision transforms Resize의 size 매개변수

KillinTime 2024. 9. 26. 19:40

torchvision.transforms.Resize에서 size 매개변수는 두 가지 사용 방식이 있다.

매개변수는 int와 tuple 형식의 (height, width)을 전달할 수 있다.

transforms.Resize(256)

매개변수에 int 형식을 전달하면 짧은 축을 기준으로 크기를 조정한다.

이는 종횡비가 유지된다.

입력 이미지의 가로 또는 세로 길이 중 짧은 쪽이 256 픽셀이 되도록 이미지의 크기를 조정한다.

긴 쪽은 원래 비율을 유지하면서 비례적으로 조정한다.

원본 이미지가 800 x 600(width x height)인 경우, 짧은 축인 세로 길이가 256 픽셀로 조정된다.

가로 길이는 size * width / height인 341 픽셀이 된다.

transforms.Resize(256, 256)

매개변수에 tuple 형식을 전달하면 이미지를 정확히 지정된 크기로 조정한다.

원본 이미지가 800 x 600(width x height)인 경우, 이미지가 256 x 256으로 변환되며,

이 과정에서 종횡비가 무시되고 이미지가 찌그러지거나 늘어나는 왜곡이 발생할 수 있다.

종횡비를 유지하고 싶다면, 원본 이미지와 대상 크기의 비율(width / height)를 계산하고

padding을 추가하여 조정하면 된다.

 

Resize — Torchvision main documentation (pytorch.org)

 

Resize — Torchvision main documentation

Shortcuts

pytorch.org

 

Comments