본문 바로가기

하둡

[하둡 프로그래밍] 시작하세요. 하둡 프로그래밍. - 정재화 작년에 하둡완벽가이드에 이어서 올해 구매를 하여 읽은 책입니다.작년에 읽었던 책은 단순히 하둡에 대해서 알기위해서 구매하였던 것이라면이 책은 실제로 올해 M/R을 활용해보기 위해 구매한 책입니다. 표지가 굉장히 라이트한 느낌인데요.. 접근하기 쉬운 느낌이죠?그래서인지 내용도 하둡을 모르는 초보자도 하나하나 따라가면 손쉽게 하둡과 M/R에 대해서 알 수 있다는 것이 가장 큰 장점입니다. 국내서이기 때문에 번역서보다 문맥이 자연스럽다는 것도 장점이겠구요. 그리고 저자분께서 블로그나 커뮤니티등에서 활동을 많이 하시고 계시고 (http://blrunner.com/)질문등에 대해서도 적극적으로 답변을 해주시기 때문에 그것도 이 책이 가지는 큰! 장점이라고 하겠습니다. 아무튼, 하둡을 공부하고 M/R 프로그래밍을 .. 더보기
[Hadoop] 설치 및 StandAlone 실행 참고 : http://blog.softwaregeeks.org/archives/category/develop/hadoop 하둡을 써보자. 하둡에 대한 책을 읽고 있긴한데 이게 태어난 목적이 분산파일 시스템으로서 더 큰 용량의 파일들을 저장하기 위함인지 그러한 데이터들을 빠르게 분석하기 위함인지 잘 모르겠다. Standalone 모드에서의 예제가 map reduce가 딱 실행되는걸로 봐서는 후자인 것 같기도하고.. 어쩌면 둘 다겠지.. hadoop이 기본적으로 수정되지 않는 파일만 저장이 된다고 하니 분석에 대한 목적이 더 클지도 모르겠다.. 아무튼 더 공부를 해봐야 할 것 같고... 우선 Hadoop 라이브러리를 다운 받는다. (http://hadoop.apache.org/) 나는 0.20 버전을 사용했.. 더보기