1. 기계학습이란, 개발환경구축

2016. 10. 31. 22:50Application Programming/머신러닝

*Machine Learning in Action 영문판과 youtube에 있는 공개강의( https://youtu.be/t6S7ekXz3aY?list=PLbhbGI_ppZISMV4tAWHlytBqNq1-lb8bz )를 참고했다.


헷갈리거나 아직 모르겠는 부분은 폰트를 기울여썼다.




1)기계학습이란

기계학습(Machine Learning)의 의미를 생각해보자.


기계에게 '학습'은 경험을 통해 스스로의 성능을 높이는 일로, 기계에게 있어 '경험'이라 함은 데이터이다. 

기계학습은 공학, 통계학, 수학 등 다양한 분야의 지식으로 만들어진 알고리즘을 통해 수행되며, 학습의 용도와 요구되는 성능, 비용에 따라 선택해서 사용할 수 있는 다양한 알고리즘들이 연구되어있다.


기계학습은 사람이 이미 분류한 샘플 데이터 셋을 사전에 주는지 아닌지로 구분되며 전자는 지도학습(Supervised Learning), 후자는 비지도학습(Unsupervised Learning)이라 부른다.


지도학습의 경우      주어진 데이터에 이산적인(Discrete) 클래스를 정해주는 분류(Classification) 문제나

    연속적인 수치를 정해주는 회귀(Regression) 문제로 나누어 생각할 수 있다.


비지도학습의 경우   데이터 간의 거리를 판별해서 몇 개의 군집으로 정리해주는 군집화(Clustering) 문제와

    데이터의 분포추정, 노이즈 제거 등이 있다. 


인강에서는 지도학습, 비지도학습 외에 강화학습도 말씀하셨는데 책에 없는 내용이라 생략했다.




2)이론, 기법 및 알고리즘

책과 강의에 나온 이론, 기법 혹은 알고리즘은 다음과 같다. (추가예정)


 Rule-based Classifier 

 강의

 Decision trees

 강의, 책

 K-Nearest Neighbors

 책

 Linear Regression

 강의

 Naive Bayes Classifier

 강의, 책

 Logistic Regression

 강의, 책

 Support Vector Machine 

 강의, 책 

 Meta-algorithm

 강의, 책

 Tree-based Regression

 책

 k-means clustering

 강의, 책

 apriori algorithm

 책 



3)예제 실습환경-배포판 파이썬

R과 파이썬 사이에서 고민했으나 지난 파이썬 공부의 연장으로 생각하기로 했다.


책에 있는 예제를 실행하려면 Numpy와 matplotlib를 임포트해야한다. 데이터의 표현과 도식화를 도와주는 친구들이다. 찾아보니 하나씩 따로 받는 것도 가능하지만 에러가 날 수 있어 번거롭고, Anaconda 같은 배포판 파이썬(파이썬과 유용한 파이썬 패키지를 포함하고 있다)을 받으면 된다고 한다.


* 다운로드 링크*

아나콘다 : https://www.continuum.io/downloads

파이참 : http://www.jetbrains.com/pycharm/download/


아나콘다의 다운로드가 완료되면 폴더 내의 idle를 이용해 기존 파이썬에서 사용하던 것과 같은 셸을 이용할 수 있다.



4)예제 실습환경-Numpy, Matplotlib 각각 설치하기


배포판 파이썬을 설치하지 않아도 Numpy와 Matplotlib를 각각 설치할 수 있다. 

필요한 라이브러리를 따로 받으려면 번거롭다고 해서 anaconda를 받았었는데, 다른 컴퓨터에 새로 설치하려고 찾아보니 그다지 어렵지 않았다.


Numpy는 파이썬에서 기계학습 코드를 구현하기 위해 필수적인 과학 연산에 특화된 라이브러리다.

설치방법은 다음과 같다.


1.

http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy 에서 파이썬 버전과 비트를 확인해서 맞는 버전을 받는다.

본인이 사용하던 파이썬 콘솔창의 맨위에 보면 Python 3.5 (64-bit)와 같이 버전과 비트수가 나와있을 것이다.

* 컴퓨터 비트수와 파이썬 비트수가 다를 수도 있으니 파이썬에 맞추어야 한다.


내가 설치한 파이썬은 3.5버전 64비트 이므로 나는 



2.

윈도우에서 cmd 창을 실행 한 뒤, 다음과 같이 입력한다.

python -m pip install C:\numpy-1.11.2+mkl-cp35-cp35-win_amd64.whl 


버전과 비트가 맞지 않으면 에러메시지가 뜰 것이다.

성공하면 Successfully installed numpy-1.11.2+mkl 이라는 메시지와 함께 설치가 종료된다.





matplotlib는 데이터의 분포를 그래프로 확인할 수 있게 해주는 파이썬용 그래픽 라이브러리이다. 설치법은 앞서 받았던 numpy와 유사하다.


1. http://sourceforge.net/projects/matplotlib/files/matplotlib/에서 본인 파이썬 버전에 맞는 matplotlib를 찾는다. 나는 python 3.5.2 64bit 여서 matplotlib-1.5.0-cp35-none-win_amd64.whl를 받았다. 빨간 부분이 버전, 파란 부분이 비트 수 이므로 잘 확인하고 받자.


2. cmd창을 열어 다음과 같이 입력한다.

python -m pip install (본인이 whl파일을 설치한 경로)\matplotlib-1.5.0-cp35-none-win_amd64.whl

버전을 제대로 받았다면 Successfully installed라는 메시지와 함께 설치가 완료된다.





'Application Programming > 머신러닝' 카테고리의 다른 글

[딥러닝] Deep Learning from scratch  (0) 2021.02.24
2-2. k-Nearest Neighbors 응용하기  (0) 2016.11.18
2-1. K-Nearest Neighbors  (0) 2016.11.12