구글 빅 테이블

구글 앱 엔진(App Engine)을 뒤져보다가, 원래의 고민지점이었던 mysql 을 대신할만한 무언가, 로 돌아가서 다시한번 뒤져 봤다.

최종적으로는 “구글 빅테이블이 발표되길 기다려보자.” 는 것으로 끝냈지만, 거기까지 가는 과정도 적어둘만 하다.

아파치의 카우치는 아예 데이터베이스에서 REST를 지원해버리자는, 게다가 리턴하는 데이터도 JSON으로 해버리자는 프로젝트. AJAX를 쓰는 사이트라면 눈이 돌아가겠다.

카우치에서부터 시작한 탐색은 이리저리 흘러가다가, 아마존 EC2, S3 쪽으로도 갔었다.

  • EC2 는 자기네가 가진 몇 천대의 컴퓨터를 돈받고 빌려주는 서비스
  • S3 는 자기네가 가진 하드디스크를 돈받고 빌려주는 서비스

전에도 들어본 적은 있었지만, 내가 쓸일이 있을까 하는 마음에 그냥 지나쳤던 녀석들. 이제와 주목하게된 이유는 SmugMug라는 사진공유 사이트가 발표한 것 때문인데…

2006년 4월부터 S3를 사용했고, 스토리지를 안사고 S3 쓴 덕분에 2006년 11월기준으로 연간 50만 달러를 아낄 수 있었다. 2007년 3월까지 총 100만 달러를 아낄 수 있었다.

고 한다. 더 뒤져보니, S3로 MySQL을 백업할 수 있는 툴도 있다. 괜찮네 !

아마존이 이런 종류의 서비스를 할 수 있었던 것은 Hadoop이라는 플랫폼이 있었기 때문이다. 아파치 프로젝트중 하나로써 공짜다. 야후에서도 이 녀석을 쓰고 있다. 그리고, 플랫폼은 구글이 발표한 논문에서 많은 영향을 받았다고 한다.

마지막으로 빅테이블. 구글 내부에서 쓰고 있는 대용량 데이터베이스 시스템이다. (페타바이트수준이란다. 암튼) 이 녀석도 외부에서 접근해서 사용할 수 있도록 할 것이라고 한다. 즉, MySQL 대신에 쓸 수 있는 딱 좋은 서비스가 바로 이 녀석 !

앱 엔진에 들어있는 파이선 예제를 보니까, 아무때나 생각나면 필드하나 추가하고, 타입도 지정하고, Blob으로 이미지도 넣을 수 있고. SQL 비슷하게 (GQL ^^) 쿼리도 날릴 수 있고…그런 녀석일 것 같다.

생각해봐. 이미지도 디비에 넣버리고, 쿼리옵티마이징 따위는 잊어버리고, 쿼리를 날리는 거. 호호.

앱 엔진은 가입 신청했더니, 허용하기로 한 10000명을 넘어섰나보다. 대기자로 올리라고 해서 올려놨다. 빅테이블도 곧 열릴 것 같은데, 24시간 모니터링해야 하나?

P.S. 카우치와 아마존 EC2, S3 모두 김석준님이 소개해주심. 무료 컨설팅 고마워요~ ^^

P.S. 빅테이블. 구글 발표 논문


댓글

dankoon : Cloud computing에 관심을 가지게 되셨군요. MS도 올해 2월인가???에 SQL Data Service라는 이름으로 Cloud computing 환경을 지원하는 서비스를 발표했습니다. 저도 관심있게 지켜보는 중이에요. (2008-04-10 19:38:58)

박제권 : 클라우드보다는 document oriented db를 보는 중이예요. 그냥.. 쓸라고.. rdb로는 따라가기 힘든 요구사항들이 있네요.. (2008-04-11 06:04:20)

Serendipitous : (Trackback from http://thinkr.egloos.com/1835774) CouchDB 는 문서-지향(document-oriented) 데이터베이스다. 굳이 문서지향이라고 말하는 이유는 아마도 RDBMS가 아니라는 것을 강조하기 위해서일 것이다. Apache 재단에서 인큐베이팅 중인 이 오픈소스 (2008-04-09 02:09:43)