티스토리 뷰
발생일: 2016.11.10
키워드: 날짜 처리, date feature, 날짜 속성, 날짜 피처
문제:
학습 데이터를 준비할 때 날짜 부분은 어떻게 표현하는 게 좋을까?
선형적인 데이터로 만들려면 숫자로 바꿔야 할 것 같다.
예를 들면, 2016년 1월 데이터는,
2016-01 표시하는 게 좋을까, 아니면 201601, 아니면 타임스탬프로 출력하는 게 나을까?
해결책:
날짜를 계산 가능한 숫자로 바꾸는 게 중요한 게 아니라,
내가 데이터를 어떻게 생각하고 바라보고 있느냐가 중요하다.
그 기준에 따라 그 값이 타임스탬프일 수도 있고, 의미있는 기준값으로부터의 차일 수도 있다.
단순히 절대적인 값보다는 데이터가 의미하는 잘 이해하는 것부터 시작하는 것이 중요하다.
참고:
반응형
댓글
공지사항