IT's 우

생활코딩 머신러닝야학_Tensorflow 102 -이미지 분류(CNN)/ 데이터와 차원 본문

생활코딩/머신러닝(텐서플로우(python))

생활코딩 머신러닝야학_Tensorflow 102 -이미지 분류(CNN)/ 데이터와 차원

디우 2021. 1. 15. 21:38
728x90

 

데이터 차원.pdf
0.58MB

 

데이터 분야에서 차원의 개념,

차원이라는 개념으로 데이터를 이해하기

 

이미지는 컴퓨터에서 숫자들의 집합으로 인식한다.

 

 

 

 

개별 Mnist (28,28)의 모양으로 이루어져 있다.

784(28*28) 개의 숫자로 이루어져 있으며, 2차원 형태이고 748차원의 공간이다.

 이러한 이미지가 60000장이 있는 Mnist 셋은 (60000, 28, 28)이다.

 

 

 

 

 

 

 컬러 이미지로 (32*32) 2차원의 숫자 집합이 빨, 초, 파로 3개 존재한다. 하나의 이미지는 3072(=32*32*3) 개를 가지고 있다. 그러므로 개별 cifar10-(32, 32, 3)으로 이루어져 3차원의 형태이고 이미지는 3072차원의 공간의 한 점으로 이루어져 있다.

 50000장의 컬러 이미지를 가지는 cifar10 셋은 (50000, 32, 32, 3)으로 4차원이다.

 

 

예를 들어 칼라 이미지의 크기가 2448*3264 픽셀이면 2448*3264*3 = 23,970, 816개의 숫자를 가지고 있는 것이다.

 

실습 소스코드

  • MNIST: 손글씨 이미지 셋 (60000, 28, 28)

  • CIFAR10: 10가지 분류 사물 이미지 셋(50000, 32, 32)

###########################
# 라이브러리 사용
import tensorflow as tf

###########################
# 샘플 이미지 셋 불러오기

 

#MNIST

#(독립, 종속),_ = tf.keras.datsets.mnist.lead_data()
(mnist_x, mnist_y), _ = tf.keras.datasets.mnist.load_data()
print(mnist_x.shape, mnist_y.shape)

 

 

이미지 한 장은 28*28 2차원 형태, 정답은 60000개의 숫자를 가지고 있음.

#CIFAR10

#(독립, 종속),_ = tf.keras.datsets.cifar10.lead_data()

(cifar_x, cifar_y), _ = tf.keras.datasets.cifar10.load_data()
print(cifar_x.shape, cifar_y.shape)

 

 

독립변수는 4차원의 배열, 종속변수는 2차원으로 배열로 이루어져 있다.


###########################
# 이미지 출력하기

print(mnist_y[0:10])
import matplotlib.pyplot as plt
plt.imshow(mnist_x[0], cmap='gray')

 

 

print(cifar_y[0:10])
import matplotlib.pyplot as plt
plt.imshow(cifar_x[0])

 

 




###########################
# 차원 확인
d1 = np.array([1, 2, 3, 4, 5])
print(d1.shape)

 

 

->1차원, 5개의 요소를 가짐.
d2 = np.array([d1, d1, d1, d1])
print(d2.shape)

 

 

->2차원
d3 = np.array([d2, d2, d2])
print(d3.shape)

 

 

->3차원
d4 = np.array([d3, d3])
print(d4.shape)

 

 

->4차원

 

###########################
# (5, ), (5, 1), (1, 5) 비교

x1 = np.array([1, 2, 3, 4, 5])
print(x1.shape)
print(mnist_y[0:5])
print(mnist_y[0:5].shape)

 

 


x2 = np.array([[1, 2, 3, 4, 5]])
print(x2.shape)

 

 


x3 = np.array([[1], [2], [3], [4], [5]])
print(x3.shape)

 

 


print(cifar_y[0:5])
print(cifar_y[0:5].shape)

 

 

출처: 생활코딩

728x90
반응형