전체 글(55)
-
+) 네트워크 계층 (OSI 7 Layer, TCP/IP)
1) OSI 7계층통신에서 사용되는 다양한 모듈을 기능별로 정리한 것으로, 각 계층의 예시와 기능은 아래와 같다. 이름예시 기능 Application HTTP, IMAP, DNS ... 파일 전송 등을 위한 프로토콜 Presentation 데이터 변환, 문자코드 번역, 압축, 암호화 Session 인증, 허가, 전송 방향 및 절차 확인 Transport TCP, UDP, RTP ... 통신망의 상태 감시, 오류복구 Network IP, ICMP, IGMP ... 라우팅, 패킷 포워딩 (경로설정) Data link 매체접근제어, 흐름제어, 오류검사 Physical 전선, 전파, 광섬유, 동축케이블... 전송을 위한 물리 매체 2) TCP/IP인터넷에서 각 호스트 간에 데이터를 주고 받기 위해 사용하는 통신..
2016.11.29 -
+) pip
pip은 파이썬에서 비표준(써드파티) 패키지를 설치하기 위해서 가장 많이 쓰이는 패키지이다. 파이썬에서 많이 쓰이는 유용한 패키지들을 PyPI라는 이름으로 묶어놓았고, pip을 이용하면 여기에 포함된 패키지들을 명령어 하나로 손쉽게 다운로드 받을 수 있다. 1)pip설치공식 매뉴얼에 따르면 2.7.9 이상 또는 3.4 이상의 python 버전은 파이썬 설치 시 pip을 포함하고 있다고 한다!(파이썬 설치경로)\Scripts에 pip이 들어가 있는 것을 확인 할 수 있다. cmd창으로 pip을 사용할 수 있는데, 어떤 경로에서 든지 자유롭게 사용할 수 있도록 환경변수 PATH에 python과 pip의 경로를 포함시켜주자. 환경변수는 제어판>시스템 및 보안>시스템>고급 시스템 설정>고급의 '환경변수' 버튼을..
2016.11.22 -
9. 파일 입출력
1)입력 c나 c++에서 파일을 불러오고 내보낼 때 생성했던 stream의 개념을 이해하고 있다면 파이썬에서의 파일 입출력도 무리 없이 받아들일 수 있을 것이다. 파일에 데이터를 쓰고자 할 때는 다음과 같이 코드를 작성해야 한다.1234f=open("test.txt","w") #사용하고자 하는 파일을 연다. 이때 첫번째 인자는 파일명, 두번째 인자는 모드이다.f.write("Hello world!\n^^!") #수정모드는 쓰기의 w, 읽기의 r, 이어쓰기의 a가 있다.#12 #write함수를 사용하면 입력한 문자열의 바이트수를 반환한다. f.close() #파일을 다 이용하면 반드시 close해야한다.Colored by Color Scriptercs write함수는 인자로 문자열을 받지만, 문자열 대신 ..
2016.11.18 -
2-2. k-Nearest Neighbors 응용하기
1)Error rate알고리즘이나 데이터 셋 둘 중 하나라도 다르다면 즉 '모든 조건이 같지 않다'면 분류기의 수행 능력이 달라진다. 각각의 경우에 대해 성능을 수치로 평가하고 싶다면 아주 간단한 방법이 있다. 우리가 이미 답을 알고있는 데이터를 분류기에게는 답을 가린 채 건네준 뒤 예측하게 한다. 분류기가 구해낸 답과 실제 답이 얼마나 다른지를 비율로 계산해 내면 그것이 바로 error rate이며 이 수치로 분류기의 성능을 나타낼 수 있다. error rate = (분류기가 잘못된 값으로 예상해 낸 경우의 수)/(전체 테스트의 개수) 2)텍스트 파일로부터 데이터 파싱하기앞의 kNN 포스팅에 이어서 이번에는 좀 더 큰 데이터에 알고리즘을 적용하려고 한다. 실습용 데이터를 찾는 것은 어렵지 않지만 책에서..
2016.11.18 -
2-1. K-Nearest Neighbors
1) 정의이해하기 쉬운 분류기(Classifier) 중 하나인 K-Nearest Neighbors 분류 알고리즘을 살펴보자. KNN알고리즘은 (이름 그대로) 가장 가까운 K개의 데이터를 고른 뒤, 그 중 가장 major한 클래스로 분류한다. 예를 들어 K값이 3이라면, 분류하고자 하는 데이터와 가장 가까운 3개의 데이터를 찾는다. 찾아낸 3개의 데이터의 클래스가 각각 토끼, 토끼, 거북이 라고 하면 우리가 지금 분류하고자 하는 데이터의 클래스는 토끼가 되는 것이다. 위의 예를 수도코드도 간단히 작성하면 다음과 같다. 이미 주어진 샘플 데이터는 X, 우리가 클래스를 정해주고자 하는 데이터를 C라고 하자. X안의 아이템들과 C의 거리를 계산하고그 중 계산된 거리 값이 가장 작은 3개의 아이템을 추려낸 뒤그 ..
2016.11.12 -
1. 기계학습이란, 개발환경구축
*Machine Learning in Action 영문판과 youtube에 있는 공개강의( https://youtu.be/t6S7ekXz3aY?list=PLbhbGI_ppZISMV4tAWHlytBqNq1-lb8bz )를 참고했다. 헷갈리거나 아직 모르겠는 부분은 폰트를 기울여썼다. 1)기계학습이란기계학습(Machine Learning)의 의미를 생각해보자. 기계에게 '학습'은 경험을 통해 스스로의 성능을 높이는 일로, 기계에게 있어 '경험'이라 함은 데이터이다. 기계학습은 공학, 통계학, 수학 등 다양한 분야의 지식으로 만들어진 알고리즘을 통해 수행되며, 학습의 용도와 요구되는 성능, 비용에 따라 선택해서 사용할 수 있는 다양한 알고리즘들이 연구되어있다. 기계학습은 사람이 이미 분류한 샘플 데이터 셋을 ..
2016.10.31