(http://www.yes24.com/24/goods/21667835?scode=032&OzSrank=1)
빅데이터를 활용한 데이터 분석 도구인 스파크에 대한 책입니다.
두께도 적당하고 번역도 잘 되어있어서 읽기가 상당히 편합니다.
스파크에대한 기본적인 내용부터 RDD, 데이터 파티셔닝, 클러스터 매니저등 스파크를 공부하고 싶은 분들에게 필요한 내용을 폭 넓게 담고 있습니다.
스칼라와 자바로된 짤막한 예제들이 사용되고 있는데요 예제가 너무 길지 않아서 보고 이해하기도 쉬웠습니다.
저의 경우로 비추어 보자면 자바 개발자로써 일하다가
한창 하둡이니 마하웃이니 하면서 머신 러닝이 크게 유행 할 때
이쪽에 관심을 가지고 공부를 시작했던적이 있습니다.
그땐 물론 스파크보다는 하둡에 포커스가 많이 되었었죠.
초창기에는 하둡에 데이터를 넣는 것부터가 실무에 적용하는데
고민거리였고, 넣은 데이터를 빼서 활용하는 것도 고민거리였습니다.
M&R도 마찬가지구요...
이번에 이 책을 보면서 느낀점이
잠깐 손을 놓고 있었던 그 사이에 또 많은 부분들이 달라졌고 바뀌었구나 하는 것입니다.
개인적으로 항상 느끼는 부분은 새로운 기술이 나오고
그 기술이 발전해가면 갈수록 인터페이스가 추상화 되면서 오히려 처음 접근하는 사람들에게는
더 좋은 기회가 된다는 것 입니다.
그런면에서 볼 때 스파크는 그런 추상화 레벨을 어느정도 가지고 있다고 봅니다.
연장선상에서 저 같은 경우 몇년전에 하둡을 공부한게 유일한 지식인데요 그럼에도 불구하고 읽기가 좋았습니다.
스파크를 공부해보고 싶은 개발자분들에게 좋은 선택이 될 수 있는 책이라고 생각합니다.