Application Programming/머신러닝(4)
-
[딥러닝] Deep Learning from scratch
개인 프로젝트로 텐서플로js를 사용해보고싶었는데, 친절한 가이드에도 불구하고 이해할 수 없는 내용이 넘나 많았다 ㅜㅡㅜ 책 하나를 정해서 읽고 있는데, 더 궁금한 부분이나 찾아봐야 할 부분이 너무 많아서 일단 이 글에 모아두려고함 SIFT SURF HOG SSE 오차제곱합 SSR SST CEE 교차 엔트로피 오차 미니배치
2021.02.24 -
2-2. k-Nearest Neighbors 응용하기
1)Error rate알고리즘이나 데이터 셋 둘 중 하나라도 다르다면 즉 '모든 조건이 같지 않다'면 분류기의 수행 능력이 달라진다. 각각의 경우에 대해 성능을 수치로 평가하고 싶다면 아주 간단한 방법이 있다. 우리가 이미 답을 알고있는 데이터를 분류기에게는 답을 가린 채 건네준 뒤 예측하게 한다. 분류기가 구해낸 답과 실제 답이 얼마나 다른지를 비율로 계산해 내면 그것이 바로 error rate이며 이 수치로 분류기의 성능을 나타낼 수 있다. error rate = (분류기가 잘못된 값으로 예상해 낸 경우의 수)/(전체 테스트의 개수) 2)텍스트 파일로부터 데이터 파싱하기앞의 kNN 포스팅에 이어서 이번에는 좀 더 큰 데이터에 알고리즘을 적용하려고 한다. 실습용 데이터를 찾는 것은 어렵지 않지만 책에서..
2016.11.18 -
2-1. K-Nearest Neighbors
1) 정의이해하기 쉬운 분류기(Classifier) 중 하나인 K-Nearest Neighbors 분류 알고리즘을 살펴보자. KNN알고리즘은 (이름 그대로) 가장 가까운 K개의 데이터를 고른 뒤, 그 중 가장 major한 클래스로 분류한다. 예를 들어 K값이 3이라면, 분류하고자 하는 데이터와 가장 가까운 3개의 데이터를 찾는다. 찾아낸 3개의 데이터의 클래스가 각각 토끼, 토끼, 거북이 라고 하면 우리가 지금 분류하고자 하는 데이터의 클래스는 토끼가 되는 것이다. 위의 예를 수도코드도 간단히 작성하면 다음과 같다. 이미 주어진 샘플 데이터는 X, 우리가 클래스를 정해주고자 하는 데이터를 C라고 하자. X안의 아이템들과 C의 거리를 계산하고그 중 계산된 거리 값이 가장 작은 3개의 아이템을 추려낸 뒤그 ..
2016.11.12 -
1. 기계학습이란, 개발환경구축
*Machine Learning in Action 영문판과 youtube에 있는 공개강의( https://youtu.be/t6S7ekXz3aY?list=PLbhbGI_ppZISMV4tAWHlytBqNq1-lb8bz )를 참고했다. 헷갈리거나 아직 모르겠는 부분은 폰트를 기울여썼다. 1)기계학습이란기계학습(Machine Learning)의 의미를 생각해보자. 기계에게 '학습'은 경험을 통해 스스로의 성능을 높이는 일로, 기계에게 있어 '경험'이라 함은 데이터이다. 기계학습은 공학, 통계학, 수학 등 다양한 분야의 지식으로 만들어진 알고리즘을 통해 수행되며, 학습의 용도와 요구되는 성능, 비용에 따라 선택해서 사용할 수 있는 다양한 알고리즘들이 연구되어있다. 기계학습은 사람이 이미 분류한 샘플 데이터 셋을 ..
2016.10.31