본문 바로가기

기계학습

'딥러닝 첫걸음' 라는 책이 출간 되었습니다. "모두의 연구소" 김성필 연구원님께서 작년 말에 출간하신 책인데요, "머신러닝에서 컨벌루션 신경망까지" 라는 부재로 나왔습니다.번역서만 가득한 딥러닝 분야에 단비같은 책이라 할 수 있습니다. :-)김승일 연구소장님의 깨알같은 추천사가 눈에 들어옵니다. “딥러닝은 우리 연구소 스터디 중 가장 인기 있는 주제입니다. 하지만 초보자와 전문가 사이에는 여전히 상당한 격차가 존재하는 것도 사실입니다. 이 책은 딥러닝을 대략적으로 이해한 초보자들이 더 깊게, 하지만 너무 힘들지 않게 한 단계 올라서는 데 좋은 길잡이가 되어줄 것입니다. 특히 컨벌루션 신경망의 설명은 압권입니다.” - 김승일 모두의 연구소 소장 작년부터 "머신 러닝" 스터디를 "모두연"에서 하고 있는데, 여전히 어렵네요.. 아무튼 머신러닝을 빠싹하게.. 더보기
BMLS w/ Python 2장 - 실제 예제 분류하기 Building Machine Learning System with Python 한국어판https://github.com/luispedro/BuildingMachineLearningSystemsWithPython #!/usr/bin/env python# -*- coding:utf-8 -*-%matplotlib inline from matplotlib import pyplot as pltimport numpy as np# sklearn의 load_iris로 데이터를 로드한다.from sklearn.datasets import load_irisdata = load_iris()# load_iris는 몇 개의 필드를 객체를 반환한다.features = data.datafeatures_names = data.fe.. 더보기
맥에서 Octave 설치하기 Install xquartzhttp://www.xquartz.org/http://www.cyberciti.biz/faq/apple-osx-mountain-lion-mavericks-install-xquartz-server/Setup Port forwardhttp://www.cyberciti.biz/faq/x11-connection-rejected-because-of-wrong-authentication/Setup sshd & ssh/etc/ssh/sshd_configX11Forwarding yesssh_configHost *ForwardX11 yesOpen port 22http://stackoverflow.com/questions/6313929/how-do-i-open-port-22-in-os-x-10-.. 더보기
Hilary Mason: An Introduction to Machine Learning with Web Data 인트로에서는 큰 내용은 없고 Clustering, Classification and Recommendation 위주로 진행할 거다. 다만, 기계학습의 단계를 아래 5개로 구분하는데, 당연히 그렇겠거니 했는데... 실제로 현업에서 이런 단계를 거치면서 일을 했나 하는 생각이 들어 적어본다. Obtain > Scrub > Explore > Model > iNterpret O, N 단계는 명확히 구분되지만 중간 단계인 SEM의 경우는 개발자 혹은 분석가의 몫이기도 하고, Iterative Process 이므로 하나의 작업처럼 보일 때가 많다. 다만, 각 단계의 구분과 결과물이 명확해져야만 좋은 결과를 얻을 수 있다. Related Skills & Source: python, NLTK, Numpy, pyclus.. 더보기
Hadoop MapReduce를 이용하여 신경망 학습이 가능할까? 아파치 프로젝트로 진행중인 Mahout라는 프로젝트가 있는데, 이것은 Hadoop MapReduce를 통하여 Machine Learning을 하기 위한 프레임워크다. 하지만 Hadoop만큼이나 인기리에 진행되고 있지는 않는것 같다. 어쨌거나, 클릭로그 정보를 이용하여 문서와 입력된 키워드와의 관계를 neural network를 통하여 학습하고, 검색시에 랭킹에 반영하는 것을 실험해보고 있다. 자세한 내용은 집단지성 프로그래밍 (원서: Programming Collective Intelligence) 4장을 참고. 가장 힘든 부분은 feedforward 단계와 backpropagate 단계에서 node의 weight값과 link 의 weight값을 global하게 사용한다는 점에 있는데, 이를 분산환경에서.. 더보기
WEKA를 이용하여 데이터마이닝을 해보자 http://www.cs.waikato.ac.nz/ml/weka/ : WEKA Home http://www.amazon.com : Data Mining Practical Machine Learning Tools and Technieques http://sourceforge.net/projects/weka/ : 소스 및 실행파일 다운로드 데이터마이닝 이라고 하면, 너무 어렵고 뭘 해야 할지도 모르겠고, 그래서 일단 제일 만만한 툴킷을 찾아보던 중, 그나마 괜찮은 도구가 있는 것 같아 한번 시작해 보기로 했습니다. WEKA, for Waikato Environment for Knowledge Analysis 뉴질랜드의 와이카토 대학에서의 기계학습 기법을 이용한 데이터마이닝 프로젝트라고 간략히 설명되어 있구요.. 더보기