현실 세계에서 만나게 되는 데이터에 항상 label이 주어지는 것은 아닙니다. 이러한 unlabeled 데이터에 숨겨진 패턴을 찾아내고 구조화하는 머신러닝 기법을 비지도학습(Unsupervised Learning)이라고 합니다. 비지도학습 알고리즘 중 가장 널리 알려진 K-Means 클러스터링 알고리즘에 대해서 알아봅시다.
Read베이즈 정리를 바탕으로 임의의 데이터 포인트가 주어졌을 때 특정 클래스로 예측될 확률을 계산하는 나이브 베이즈 모델에 대해서 알아봅시다
Read생산구성요소를 공정 순서에 따라 연속적으로 배치하는것을 생산 라인이라고 합니다. 이러한 생산 라인에 대한 개념과 생산 라인을 효율적으로 구성하는 절차에 대해서 알아봅시다.
ReadDecision Tree는 overfitting될 가능성이 높다는 약점을 가지고 있습니다. 가지치기를 통해 트리의 최대 높이를 설정해 줄 수 있지만 이로써는 overfitting을 충분히 해결할 수 없습니다. 그러므로 좀더 일반화된 트리를 만드는 방법을 생각해야합니다. 이는 Random Forest(랜덤 포레스트)의 기원이 되는 아이디어입니다. 이번 포스팅에서는 랜덤 포레스트에 대해서 알아봅시다.
Read