지난 한 달간 데일리시큐는 최일훈 소만사 부사장의 <유해사이트 차단 기술이 필요한 이유>에 대해 5회에 걸쳐 칼럼을 연재한 바 있다.
이번에는 <유해사이트차단 솔루션의 두뇌-웹 데이터베이스>를 주제로 연재를 진행한다.
유해사이트를 통해 발생하는 각종 보안사고를 미연에 방지하기 위해 꼭 필요한 내용들이다. -편집자 주-
[연재순서]
1. 어제 생겨난 도박사이트,우리 회사는 어떻게 알고 차단한 거야?
2. 가치사슬의 맨 앞단에<수집>이 있다.
3. <프로슈머>로부터 수집한다
4. 우리는 웹에 있어서 가장 특별한 나라에 살고 있다
5. 한국웹을 외국회사가 DB화 한다는 것이 가능한 일인가
6. 고객사 리스크에 기반하여 분류한다
우린 현장에 있고 그들은 현장에 없다. 우린 실체를 알고 그들은 실체를 모른다. 정확히는 알고자 하지도 않는다. 한국은 우리에게는 100%이고 그들에게는 1%의 시장이기 때문이다.
웹 DB화는 판단과 선택의 연속 웹을 데이터베이스화하는 것은 것은 거대한 도서관을 짓거나, 백과사전 전집을 편찬하는 수준의 작업이야. 끝없이 판단과 선택이 이어지지. 옳은 판단과 선택을 하기 위해서는 뭐가 필요할까? 그 분야의 지식과 경험 그리고 무엇보다 애정이 있어야 해. 웹을 DB화하는 것은 바로 여기 존재하는 모든 분야에 대한 지식, 경험, 애정이 있어야 하는 일이야.
한국웹을 외국회사가 DB화한다는 것이 가능한 일인가
한국에서 미국웹을 DB화했는데 www.Apple.com이나 www.Amazon.com이 빠져있다면 어떨까?
혹은 DB에 있긴 한데 www.Apple.com을 과수원으로, www.Amazon.com을 브라질여행사이트로 분류한다면 미국에서는 얼마나 황당하겠어?
그럼 반대로 한국웹을 외국회사에서 DB화한다면 어떤 일이 생길까?
물론 한국시장을 위해서 한국인을 단기계약직으로 쓰겠지?
그러나 그 분류결과를 누가 감수할까? 분류자를 뽑고 교육하고 심층감수하는 인프라를 구축할까?
투자와 집중 없이 형식적으로 웹을 수집하고 분류하는 것은 마치 텔레비전 보면서 타이핑하는 것과 마찬가지야.
결과물에는 중요한 내용들이 무더기로 빠져있고 오타와 실수로 가득차있겠지. 현장에서는 쓸모가 없어.
한국기업은 한국시장에 100%를 쏟고, 미국기업은 1% 미만을 쏟아
한국시장은 글로벌 IT시장의 1% 미만이야. 시장은 1%인데 복잡도와 변칙성은 세계 1위야.
외산회사들이 한국시장만을 위해 과연 투자할까?
(외산회사들에게 한국시장은 수익은 1%인데 리소스는 10%를 잡아먹는 블랙컨슈머 같은 존재라고 할 수 있지).
피터드러커가 말했지. 누군가의 프론트야드(Front Yard, 앞마당)는 누군가의 백야드(Back Yard, 뒷마당)이라고.
웹은 겉과 속이 다른 경우가 많아서 일일히 들어가서 내용을 분석해야 하는 경우가 많아.
예를 들어<moviejoa.net>을 외국회사는 겉만 보고 문화예술로 분류하고 한국에서는 일일히 들어가보고 P2P로 분류해.
왜냐? 한국시장은 한국기업에게는 프론트야드이고 미국기업에게는 백야드이기 때문이야.
<꿀단지점넷>을 한국에서는 P2P로 파악하고 주소와 IP를 페이스오프해도 계속 추적해.
한국시장에서는 P2P가 매우 중요하기 때문이야.
외국회사라면 어떨까? 아예 수집이 안되어서 존재조차 모를 가능성이 제일 크고 기껏 분류해도 쇼핑몰일지도 몰라.
한국시장은 한국기업에게는 프론트야드이고 미국기업에게는 백야드이기 때문이지.
실제 외산제품의 한국웹 DB는 어떨까
-한국 P2P분야 상위 100개 중 40개를 모르고 있는 외산 VS 다 막는 한국솔루션
랭키닷컴이라고 있어. 한국인이 많이 접속하는 사이트 랭킹을 매긴 사이트야.
외산솔루션을 설치하고 랭키닷컴 P2P분야 상위 100개에 접속해보았어. 40개를 막지 못해.
너무나 당연히 국내 제품은 백프로 차단하지. 한국에서 P2P는 음란물, 저작권, 네트워크자원소모, 불법성의 종합세트 같은 거야.
외산제품은 아예 이 P2P들을 수집하지 못했거나 아니면 제대로 분류하지 못했어.
-카카오 수십개 서비스를 1개 카테고리로 분류한 외산 VS 수십개로 분류한 한국 솔루션
카카오에는 카톡뿐 아니라 금융, 네비게이션, 컨텐츠, 음악 등 수십개의 서비스가 있어.
외산은 카톡만 알아. 그래서 카카오가 들어가는 도메인을 모두 인터넷커뮤니케이션 하나로 분류해버렸어.
우리는 카카오쇼핑은 쇼핑으로 카카오네비게이션은 생활정보로 카카오페이와 뱅크는 금융으로 각각의 카테고리로 분류했지.
외산제품은 카카오 안에 그렇게 많은 서비스가 있다는 사실을 아예 몰랐거나 아니면 알았어도 일일히 들어가보고 분류할만큼 애정이 없었겠지.
웹데이터베이스. 무게와 갯수로 판단한 것인가? 가치로 판단할 것인가? 유치원생에게 만원짜리 한장과 천원짜리 세장 중에 고르라고 하면 천원짜리 세장을 골라. 개수로 판단하기 때문이지. 아무도 안 입는 옷일수록 개별적 존재없이 한데 묶어서 무게로 팔아. 판단기준은 가치일까? 무게와 갯수일까? 열명 중 다섯 명이 하루에 열번씩 접속하는 신규사이트는 못 막고, 만명 중 한명이 1년에 한번 접속하는 오래된 사이트는 막아서 뭐할 것야? 그 두 사이트를 똑같이 한 개로 셀 수 있어? 악성코드가 한시간 단위로 치고 빠지는 사이트를 생각해봐. 어떤 솔루션은 하루에 10회 이상 이 사이트를 분석해서 위험할 때는 차단하고 안전해지면 허용해. 1년이면 3,600번 보안업데이트되는 이 사이트도 개수로 세면 그저 1개일 뿐이야. (네가 머무르는 공간의 가치는 네가 얻는 편익이야? 아니면 그 방에 있는 물건 갯수야? 너는 꼭 필요한 물건만 최상급으로 골라서, 쓰는 순서대로 정리된 방에서 살고 싶어? 뭔지도 모르고 쓸 일도 없는 것들로 꽉 찬 방에서 살고 싶어?)
웹데이터베이스. 다른 나라를 기준으로 판단한 것인가? 지금 여기 기준으로 판단할 것인가?
한국마트에서는 달러를 받지 않아. 한국 마트라는 현장에서, 달러로는 지금 이 순간의 배고픔을 해결할 수 없어. 마찬가지로 한국 웹이라는 현장에서 다른 나라 기준의 웹데이터베이스로는 유해사이트접속이라는 문제를 해결할 수 없어. 판단기준은 지금 여기일까? 아니면 머나먼 다른 곳일까? 세상에서 가장 쉬운 일이 가치없는 것을 무조건 많이 모으는 거야. 쓰레기 쌓이는 속도를 생각해봐. 말이 심하다고? 시시각각 변화하는 웹에서 지금 이 곳의 문제를 해결하지 못하는 웹데이터베이스는 아무리 많아도, 아무리 비싸도 의미가 없어.
필자. 최일훈 소만사 부사장 / acechoi@somansa.com
★정보보안 대표 미디어 데일리시큐!★