본문 바로가기

삶/일기

2011년 6월 23일, 목 * 12뽀모도로, 3인터럽트 - 어제 보다 조금씩 나아지고 있음. 원래 페이스를 찾기에는 시간이 좀 더 걸리겠지? * Hive 팀 내 교육자료 작성 - 페이스북은 M/R 직접코딩은 극히 드물고 8~90%가 Hive를 통해 시스템이 운영. - 개발자 없이 시스템 운영이 가능한 수준까지 끌어올리는 것이 목표 * 단문 텍스트에 대한 검색 프로토타입 - 트위터, 댓글 등의 짧고 의미를 찾기 힘든 경우가 많은 검색은 형태소분석기 비추 - 정규식 지원하는 Inverted Index 검색엔진이 만들어지면 정말 짱인데... * "위험한 상견례" 감상 - 그냥 아무 생각없이 맥주 한 잔 마시면서 보기에는 좋은 듯 - 이시영의 새로운 모습 발견, 내가 부산 사람인 관계로 초큼 닭살돋음... 더보기
2011년 6월 22일, 수 * 9뽀모도로, 4인터럽트 - 요즘 너무 집중력도 떨어지고 뽀모도로 규칙을 너무 안 지키는 듯 집중 집중 * Hive BucketedTable을 활용한 Sampling Query - 왠 종일 쳐다봐서 겨우 이해했음 ;ㅁ; Hive에서는 대용량 자료를 레코드 단위로 샘플링해서 볼 수 있는 기능을 제공 랜덤함수를 사용하는 것과 버킷테이블을 사용하는 두 가지 방법이 존재 * 랜덤함수는 풀스캔을 하므로 샘플링이 자주 발생하는 경우는 비추 * 버킷테이블 방식은 한번 인덱스 테이블을 만들어 두기 때문에 성능이 뛰어남 * 중학교 이후로 그림에 손 뗐다가 SK컴즈의 '정진호' 차장님의 '행복화실 - 그림그리며 행복찾기' 교육자료를 유튜브에 올려주셔서 감사히 보고 있습니다. - 이제는 취미생활로 그림을 그릴 수 있게 되.. 더보기