Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- nodejs
- 연구
- npx
- 파일이름
- 러닝
- Nike
- 키체인
- 2022 AI EXPO
- react
- 단당류
- AI 전시
- ipad
- 딥러닝
- Running
- 런데이
- 국제인공지능대전
- 텐서플로우
- 화학구조
- AI엑스포
- create-react-app
- 달리는사이
- 6일차
- 리액트
- 달리기
- NRC
- 따릉이
- tensorflow
- NPM
- AI 회사
- 키체인초기화
Archives
- Today
- Total
Tomato's BLOG
[딥러닝] 텐서플로우 데이터셋(tensorflow_datasets) 활용 본문
import tensorflow_datasets as tfds
train_dataset = tfds.load('iris', split='train[:80%]')
valid_dataset = tfds.load('iris', split='train[80%:]')
- 'iris': 불러오고자 하는 데이터 셋 이름
- split='train': 'train' set을 가져온다
- 만약 해당 데이터셋에 'test'와 'validation'이 있을 경우 불어올 수 있다.
- 'train[:80%]'는 80%까지 가져오겠다는 말
- 파이썬 문법처럼 음수도 사용가능. (e.g. 'train[-20%:]')
데이터 확인
train_dataset.take(5)
처음 데이터 5개를 리스트(?) 형식으로 반환해준다.
X, y 분리 및 one hot encoding으로 변환 (preprocessing)
dataset 정보는 텐서플로우 데이터셋 공식문서에서 확인(label class 종류, dictionary label 값 등 확인할 수 있음)
def proprocess(data):
x = data['features']
y = data['label']
y = tf.one_hot(y, 3)
return x, y
tf.one_hot: label을 one-hot encoding으로 변환해줌. 3은 label의 개수(공식문서 num_classes에서 확인하면 됨)
'개발 > 머신러닝, 딥러닝' 카테고리의 다른 글
Batch Normalization layer의 위치 및 Normalization 종류 (0) | 2021.07.12 |
---|---|
AutoML 참고 사이트 정리 (0) | 2021.04.22 |
[Pandas] DataFrame 데이터 확인 (0) | 2021.03.11 |
Comments