numpy 설치(2)
-
2-1. K-Nearest Neighbors
1) 정의이해하기 쉬운 분류기(Classifier) 중 하나인 K-Nearest Neighbors 분류 알고리즘을 살펴보자. KNN알고리즘은 (이름 그대로) 가장 가까운 K개의 데이터를 고른 뒤, 그 중 가장 major한 클래스로 분류한다. 예를 들어 K값이 3이라면, 분류하고자 하는 데이터와 가장 가까운 3개의 데이터를 찾는다. 찾아낸 3개의 데이터의 클래스가 각각 토끼, 토끼, 거북이 라고 하면 우리가 지금 분류하고자 하는 데이터의 클래스는 토끼가 되는 것이다. 위의 예를 수도코드도 간단히 작성하면 다음과 같다. 이미 주어진 샘플 데이터는 X, 우리가 클래스를 정해주고자 하는 데이터를 C라고 하자. X안의 아이템들과 C의 거리를 계산하고그 중 계산된 거리 값이 가장 작은 3개의 아이템을 추려낸 뒤그 ..
2016.11.12 -
1. 기계학습이란, 개발환경구축
*Machine Learning in Action 영문판과 youtube에 있는 공개강의( https://youtu.be/t6S7ekXz3aY?list=PLbhbGI_ppZISMV4tAWHlytBqNq1-lb8bz )를 참고했다. 헷갈리거나 아직 모르겠는 부분은 폰트를 기울여썼다. 1)기계학습이란기계학습(Machine Learning)의 의미를 생각해보자. 기계에게 '학습'은 경험을 통해 스스로의 성능을 높이는 일로, 기계에게 있어 '경험'이라 함은 데이터이다. 기계학습은 공학, 통계학, 수학 등 다양한 분야의 지식으로 만들어진 알고리즘을 통해 수행되며, 학습의 용도와 요구되는 성능, 비용에 따라 선택해서 사용할 수 있는 다양한 알고리즘들이 연구되어있다. 기계학습은 사람이 이미 분류한 샘플 데이터 셋을 ..
2016.10.31