들어가며머신러닝을 배우면서 흔히 접하게 되는 예제 데이터는 고양이 vs 개, 붓꽃(Iris) 분류와 같은 문제입니다. 이런 데이터는 머신러닝의 기초를 배우는 데 적합하지만, 실무 현장에서 접하게 되는 문제와는 다소 거리가 있습니다.현업에서는 의료, 사회 서비스, 제조, 품질 관리 등 다양한 분야에서 2진 분류(Binary Classification)가 사용됩니다. 이 글에서는 유방암 진단, 스팸 메일 분류, 그리고 와인 품질 분류라는 세 가지 데이터를 실습에 활용하여, 2진 분류의 실무적 활용 가능성을 탐구하고자 합니다. 또한, 앞으로의 여정에서 배울 모델에 학습시키키고 평가하기위해 데이터를 불러오고 학습 데이터와 평가데이터로 나누는 코드에 대해 다루겠습니다. 이번 ML pipline 시리즈의 학습코드는..