요즘 인공지능(AI)과 머신러닝(ML)에 대한 관심이 많다. 하지만 막상 공부를 시작하려고 하면 어디서부터 어떻게 접근해야 할지 막막한 경우가 많다. 그래서 이번엔 머신러닝의 전반적인 흐름과 개념을 정리해본다.1. 데이터 준비의 시작: 머신러닝 파이프라인머신러닝 모델의 성능은 결국 데이터 품질에 크게 좌우된다. 실제로 모델을 설계하는 시간보다 데이터를 준비하는 데 훨씬 많은 시간이 들기도 한다.머신러닝 프로젝트에서 흔히 사용되는 데이터 준비 파이프라인은 다음과 같은 단계로 이루어진다.Data Acquisition (데이터 수집)데이터를 수집하는 단계다. 크롤링, 센서 데이터, 데이터베이스에서 추출 등 다양한 방식으로 데이터를 확보한다.Processing (데이터 전처리)결측치 처리, 이상치 제거, 정규화..