본문 바로가기
반응형

image3

[논문리뷰] ViT(Vision Transformer)란? Vision Transformer(ViT)은 이미지 인식에 Transformer 구조를 도입한 모델로, 기존의 CNN(convolutional neural network) 기반 모델과는 다른 방식으로 이미지를 처리합니다.아래는 ViT의 구조와 동작 방식, 장단점에 대한 자세한 설명입니다.🔍 1. 개념 요약Vision Transformer(ViT)는 이미지를 CNN처럼 convolution 연산 없이, Transformer의 self-attention 메커니즘을 기반으로 처리하는 모델입니다.ViT는 2020년 Google의 논문 “An Image is Worth 16x16 Words” 에서 소개되었습니다. https://doi.org/10.48550/arXiv.2010.11929 An Image is W.. 2025. 6. 6.
[Python] image bytes(image.blob)을 numpy.array로 타입 변경 하기 image.blob은 일반적으로 이미지 데이터가 이진(binary) 형태로 저장된 Blob (Binary Large Object) 을 의미합니다. 파이썬에서 image.blob을 numpy.array로 변환하려면, 이진 데이터를 이미지로 디코딩한 다음, 다시 배열로 변환해야 합니다. 가장 일반적인 방법은 Pillow 또는 OpenCV를 사용하는 것입니다. ✅ 방법 1: Pillow + numpy from PIL import Imageimport numpy as npimport io# image.blob 이 있다고 가정img_blob = image.blob # bytes 형태# BytesIO로 감싸서 Pillow 이미지로 변환img = Image.open(io.BytesIO(img_blob))# nu.. 2025. 4. 25.
[Python] 파이썬으로 ppt 읽고 이미지 가져오기 데이터를 분석해야하는 과제를 받았는데 데이터를 ppt로 받았습니다. (?)그래서 간단하게 파이썬으로 ppt를 읽어와서 이미지를 불러와서 저장하는 방법을 알아보도록 하겠습니다. ✅ python-pptx 설치파이썬에서 ppt를 읽기 위해서는 python-pptx 라이브러리를 사용합니다. https://pypi.org/project/python-pptx/ Client ChallengeJavaScript is disabled in your browser. Please enable JavaScript to proceed. A required part of this site couldn’t load. This may be due to a browser extension, network issues, or brow.. 2025. 4. 24.
반응형