데이터 표준화, 정규화
일반적으로 표준화와 정규화는 거희 같은 뜻으로 사용된다. 데이터 표준화 Data Standardization 보통 데이터를 수집하면 세계 곳곳에서 자료를 수집하기 때문에 단위 선택, 대소문자 구분, 약칭 활용 등 여러 가지 원인에 의해 다양한 형태로 표현되어 있다. 따라서 동일한 대상을 표현하는 방법을 일관성있게 데이터를 포맷하는 과정을 말한다. 1. 단위 환산 같은 데이터셋 안에서 서로 다른 측정 단위를 사용한다면, 전체 데이터의 일관성 측면에서 문제가 발생한다. 따라서, 측정 단위를 동일하게 맞출 필요가 있다. 흔히, 영미권에서는 주로 마일, 야드, 온스 등을 사용하고 있는데, 한국에서 사용하는 미터 평, 그램 등으로 변환하는 것이 좋다. 2. 자료형 변환 보통 파이썬에서 CVS, 엑셀, JSON, ..
2022. 4. 13.