빅데이터란?

Home > 빅데이터란?

근 화두가 되고 있는 기술 중 하나로 ‘빅데이터’, ‘빅데이터 분석’과 같은 말들을 많이 들어보았을 것이다. 빅데이터란, 이름의 뜻 그대로 기존 방식으로 저장·관리·분석하기 어려울 정도로 큰 규모의 데이터를 의미한다.(디지에코 보고서, 2015)

빅데이터의 크기를 보기 위해서는 데이터의 크기를 표시하는 단위로 짐작할 수 있다. 우리가 일반적으로 알고 있는 것은 GB(기가바이트)이며, 이는 대부분의 PC 컴퓨터나 휴대폰 기기의 저장소 크기이다. 다음이 바로 TB(테라바이트)이며 1024TB는 1PB(페타바이트)가 된다. 일반적으로 빅데이터란 현재 페타바이트 단위를 의미한다.

그렇다면, 기존에도 인터넷의 발전과 함께 많은 큰 데이터들이 존재하였는데 왜 새로운 빅데이터란 이름이 나오게 된 것일까?

먼저, 기술의 발전과 함께 우리가 함께 쓰는 데이터의 양도 무섭도록 증가하고 있다. 유튜브(Youtube), 페이스북(Facebook), 카카오톡과 같이 우리가 일상 속에서 사용하는 것들은 모두 데이터이다. 유튜브를 통해 동영상을 시청하고, 페이스북을 통해 친구의 근황을 알고 실시간으로 카카오톡을 통해 친구와 대화를 하는 것 모두 데이터를 통해서 이루어지며 데이터로 저장된다.유튜브의 경우 전세계 10억명의 사용자가 매일 4억개의 동영상을 시청한다. 데이터가 없다면 우리는 위와 같은 세상의 변화를 체감할 수 없을 것이다. 하지만 기업은 데이터를 관리하기 위해 알래스카에 데이터센터를 지으면서까지 데이터를 저장한다.

스마트폰의 혁신과 함께 변화한 세상은 더 많은 데이터를 내놓기 시작했고, 학자들은 과연 쌓여 있는 데이터들을 통해서 얻을 수 있는 게 있지 않을까라고 생각한다.

그것이 바로 빅데이터 분석이다. 현재 우리가 사용하고 있는 여러 분야에서 빅데이터가 활용되고 있는데 실제로 체감할 수는 없지만 빅데이터의 활용으로 우리는 조금 더 편리한 생활을 하고 있는 것이다. 이런 예로, 서울시 야간버스 노선도, 카드사의 고객맞춤 상품 출시 등이 있다.

우리 주변의 빅데이터 활용사례는?

1) 서울시 심야버스 노선도

주변을 둘러보면 빅데이터는 이미 우리의 일상 속 많은 분야에서 응용되고 있다. 대표적인 사례는 2013년 개통한 서울시 심야버스 노선이다. 심야버스의 노선도는 직관적으로 만들어진 것이 아니라 빅데이터를 통한 철저한 분석에 의해 도출된 것이다. 어떤 식으로 사용 되었는가를 간단히 살펴보면 다음과 같다.

우선 심야시간대의 통화량 등을 이용하여 서울시 각 지역의 유동인구 밀집도를 수집하고 이를 분석한다. 그리고 결과에 따른 최적의 노선을 도출한다. 이렇게 도출된 노선을 기준으로 다시 한 번 유동인구 빅데이터를 이용하여 배차 간격을 조절한다. 이러한 과정을 거쳐 탄생한 심야버스는 하루 평균 1000명 이상의 승객이 이용하고 있다. 즉, 빅데이터를 통한 분석과 의사결정이 사람들에게 좀 더 편안함을 준 사례이자 아주 모범적인 빅데이터의 활용 사례라고 할 수 있다.

2) 신용평가모델

빅데이터는 일상생활뿐만 아니라 금융에서도 널리 이용되고 있다. 최근의 신용평가 모델은 기존의 복잡한 과정과 인터뷰 등을 거치지 않고 온라인상으로 제공하는 서비스가 등장하고 있다. 이는 빅데이터 기반의 핀테크 서비스 중 하나로 대두되고 있다. 기존의 신용평가는 여러 종류의 서류와 인터뷰 등을 통해 이루어졌다. 심사 대상자는 신용평가 등급을 받기 위해서는 복잡하고 귀찮은 준비 과정을 거쳐야만 했다.그러나 빅데이터를 기반으로 한 새로운 신용평가 모델은 이러한 준비가 전혀 필요치 않다. 최소한의 신청자 정보만을 가지고 해당 신청자의 소셜네트워크 활동 데이터를 수집하여 이를 기준으로 평가하는 방식이다. 예를 들면, 신청자가 소셜네트워크상에서 “부정적인 단어의 사용이 많다”라는 것이 빅데이터 수집, 분석을 통해 도출되었다면 신청자의 신용도에 대해서 다시 한 번 고려해 볼 만한 사항이 될 수 있을 것이다.또한 택배 이용률도 신용평가의 기준이 될 수 있다. 만약 A라는 사람이 꾸준히 택배를 이용하는 사람이라면 A는 일정한 소득이 있을 것이라고 유추할 수 있고 이것을 신용도를 평가하는 요소로 활용할 수 있을 것이다. 즉 빅데이터는 기존의 정형적인 데이터를 넘어서 비정형적인 데이터에서도 의미를 찾을 수 있도록 해 주었다고 할 수 있다.

3) 금융 신상품 개발

또한 빅데이터는 금융 기업들의 마케팅 및 상품 개발에서도 이용되고 있는데 대표적으로 신한카드를 예로 들 수 있다. 신한카드는 위성호 신한카드 사장이 취임하면서 ‘빅데이터 경영’을 선언하였다. 이는 신한카드가 보유하고 있는 고객들의 카드 사용 실적을 토대로 빅데이터를 구성하고 이를 분석하여 소비패턴, 선호 트렌드를 도출한 뒤 각각의 성별, 연령대에 맞춤 형태의 상품을 개발하여 제공하고 있다. 사용자들은 자신에게 가장 적합한 서비스를 제공받을 수 있고 기업의 입장에서는 훨씬 효율적으로 고객유치를 할 수 있으므로 1석 2조의 효과를 가지고 있다고 볼 수 있다.

이러한 여러 사례들을 통해서도 볼 수 있듯이 빅데이터는 우리에게 정보를 보는 새로운 관점과 단순한 숫자나 문자의 나열에 불과했던 과거의 데이터들과는 다르게 의미있는 정보를 제공해준다.

[월간조선 2017년 4월호 / 글=박수용 서강대 컴퓨터공학과 교수]

By | 2017-07-12T06:41:43+00:00 2017.6.6|재미있는 과학이야기|빅데이터란?에 댓글 닫힘