트위터, 실시간 트래픽 처리 기술 오픈소스로 공개
트위터가 자사 실시간 검색 처리 기술을 오픈소스로 공개했다. 트위터는 9월3일(미국 현지시간) 블로그를 통해 “스톰과 하둡을 결합한 스트리밍 맵리듀스 시스템, ‘서밍버드’를 오픈소스로 기증하겠다”라고 밝혔다.
서밍버드는 배치시스템과 스트리밍을 모두 요구하는 애플리케이션을 실행할 수 있게 도와준다. 서밍버드를 이용하면 배치와 스트리밍 작업을 한 시스템 안에서 처리할 수 있다. 한정된 컴퓨팅 자원을 가지고 더 많은 데이터를 처리할 수 있단 얘기다. 스톰과 하둡의 장점을 본따 개발된 덕분이다.
트위터는 세계에서 가장 많은 트래픽이 실시간으로 오가는 서비스 중 하나다. 트위터 검색엔진은 하루에도 10억건이 넘는 검색어를 처리한다. 겉보기엔 쉬워 보이지만, 실제로 ‘실시간 검색’을 구현하기란 만만찮다. 트위터 검색엔진팀은 장애없이 수많은 사람들이 트윗을 날릴 수 있도록 검색서비스 가용성을 개선하기 위해 부지런히 검색엔진을 매만진다.
하둡과 스톰도 여기에 적용한 기술 중 일부였다. 스톰은 지난 2010년 트위터가 백타입이라는 회사를 인수하면서 오픈소스로 내놓은 기술로, 실시간 분산 데이터 처리를 돕는다. 하둡은 일정 기간 데이터를 저장하고 분석하는 배치 방식이다. 지금까지 트위터는 스톰과 하둡을 적절히 활용해 대용량 데이터를 관리했다.
곧 문제가 생겼다. 쌓이는 데이터 속도가 급증하면서 실시간으로 처리해야 하는 데이터가 늘었다. 트위터는 대용량 데이터를 실시간으로 다룰 수 있는 기술의 필요성을 느꼈고, 그 결과물이 서밍버드다.
트위터 검색엔진팀은 “서밍보드를 활용하면 수 초 안에 사람들의 검색의도를 파악해 의도에 맞는 검색 결과를 제시할 수 있다”라며 “하둡과 스톰의 단점을 서밍버드가 해결해 줄 것으로 기대한다”라고 말했다. 서밍버드 소스코드는 깃허브에서 볼 수 있다.
'ICT와 AI 정보' 카테고리의 다른 글
스마트폰과 다른 하드웨어 기기들과의 연결 기술 (0) | 2013.09.17 |
---|---|
하반기 스미싱 악성코드... 작년 대비 84배 급증 (0) | 2013.09.13 |
단축 URL 서비스를 이용한 악성 URL 배포 사례 증가 (0) | 2013.09.13 |
모든 표면을 터치스크린으로 만드는 기술 (0) | 2013.09.13 |
카카오톡 메신저, 10배 빨라졌다는데... 마리아DB-퓨전IO 도입 (0) | 2013.09.13 |
아파치재단, NoSQL '카산드라 2.0' 공개 (0) | 2013.09.12 |
구글, 새로운 크롬 앱으로 클라우드와 데스크톱 연결 시도 (0) | 2013.09.12 |
브라우저 안정성 테스트 결과, “크롬 · 파이어폭스가 IE보다 높아” (0) | 2013.09.12 |