2013년 10월 31일 목요일

[기사] 이메일 거버넌스 적용후 e-Discovery 위한 검색방안

출처 : 보안뉴스

 이번에는 이메일 아카이빙을 한 후 어떻게 검색을 해야하는지에 대한 내용으로 현재 e-Discovery 에서도 많이 사용하는 기법중심으로 설명하였습니다.
최근에 국내에서도 이메일 아카이빙 후 리스크 관리차원에서 이메일에 대한 검색기능을 많이 이용하고 있고, 많은 도움이 되고 있는 사례들이 있습니다. 특정 PC나 사용자를 대상으로 하는 것이 아닌, 전사적인 검색이나 추적관리시 필요한 기능이라 생각합니다.

------------------------------------------------
수많은 문서·이메일의 신속정확한 검색...e-Discovery에서 가장 중요

이번 연재는 지난 5~6월에 걸쳐 7회로 진행된 유정호 기업보안담당자의 e-Discovery 관련 연재 기고와 연결될 수 있는 ‘이메일 거버넌스(e-mail Governance)’에 대한 펜타시스템테크놀러지 조재영 수석컨설턴트의 연재 기고입니다. 이번 연재를 통해 실제로 e-Discovery를 위해서 기업에서 무엇을 준비해야 하는지에 대한 Practice 관점에서의 실천편으로 이메일 거버넌스를 적용한 준비방법과 실제로 e-discovery에서 필요한 검색방법 등에 대해서 살펴보도록 하겠습니다. [편집자 주]

연재순서------------------------------------------
1. e-Discovery의 시작 - 이메일 거버넌스의 이해와 필요성
2. 이메일 거버넌스의 Structure와 Practice
3. 이메일 거버넌스 적용후 e-Discovery 위한 검색방안
--------------------------------------------------

[보안뉴스=조재영 펜타시스템테크놀러지 수석컨설턴트] 1~2회에서는 이메일 거버넌스의 전반적인 개념과 이해 측면에서 소개했다면, 이번 회에서는 이메일 거버넌스를 적용한 후에 실제로 변호사나 업무담당자가 효과적으로 검색할 수 있는 방법에 대해 간단하게 설명하고자 한다.

이메일 거버넌스를 적용하여 업무에 관련한 이메일만 정보저장소인 리포지터리(repository)나 이메일 아카이빙 시스템을 통해 잘 관리되고 있다면 검색시 검색시간을 줄이고 필요한 이메일을 더 정확하게 검색할 수 있다.

e-Discovery에서 말하는 정확하다는 개념은 일반적인 통합검색에서 이야기하는 ‘정확’과는 약간의 차이가 있다. 일번적인 포털 시스템이나 사용 검색엔진에서 제공하는 검색방법은 내가 필요로 하는 정보를 얻기 위해서 빠르게 정보를 찾는데 초점이 맞춰져 있다면, e-Discovery에서 필요한 정보를 한 건씩 찾는 것보다 검색어를 포함한 모든 정보를 찾는 게 중요하다.

예를 들어 ‘담합’이라는 단어가 첨부파일에 들어있는 모든 이메일을 검색했을때 10건이든 1,000,000건이든 모든 이메일을 검색하여 해당하는 검색어를 포함한 모든 이메일 리스트를 제공하는 게 중요하다는 얘기다. 만약에 중요한 이메일이 검색되지 않고 리스트에 빠져있다면 그 소송에서 패할 것이라는 사실은 자명한 이치이기 때문이다.
일반적으로 이메일 검색을 위하여 EDRM(Electronic Discovery Reference Model)에서 제시하는 것은 다음과 같다.1)

-키워드검색(Keyword Search)
-블리안검색(Boolean Search),
-그룹핑(Grouping),
-유의어 검색(Synonym Search),
-관련어 검색(Related Words Search),
-개념 검색(Concept Search)
-발생횟수 이용(Occurrence Count)
-파라미터 검색(Searching for Parameters)

위와 같은 검색방법과 관련해 EDRM에서는 무결성과 정확성을 위하여 다음과 같은 검색 프레임워크(Framework)을 이용하라고 안내하고 있다. 일반적인 검색방법하고는 다르게 실증·확인 단계에서 반복적으로 원하는 결과의 정확성을 높이는 데 차이가 있다. 검색을 한 이후에 결과를 확인하고 다시 반복적으로 구조화 -> 검색-> 실증`확인 작업을 진행하게 된다. 이후에 검색에 대한 정확한 결과를 얻었다고 판단되면 리포팅을 통해서 리뷰작업이 진행된다.

이렇게 하는 근본적인 이유는 회사 내에서 소송에 관련하여 검토하는 문서는 이메일 외에도 오피스 문서, 스캔 문서 등 다양한 문서가 경우에 따라서는 상상도 할 수 없을 만큼 많은 양이 존재하기 때문이다.

업무에서 바로 활용할 수 있는 방법 중에 e-Discovery 전문 컨설팅기업에서 많이 사용하는 방법을 몇 가지 소개하고자 한다.

1. 구간검색
인접 검색방법이랑 비슷한 방법이다. 예를 들어서 많은 회사에서 두려워하는 ‘담합’이라는 검색어의 경우 기존 문서에도 많이 있고, 일반 문서나 이메일에도 단순히 사용하는 경우가 많다. 이럴 경우 키워드 검색(Keyword Search)을 이용하여 검색하면 수많은 문서나 이메일이 나타나고 원하는 문서를 찾을 수가 없다. 이 때는 ‘담합’과 인근의 특정회사명이나 계약명으로 검색하거나, 몇 단어 사이에 두 검색어가 있는 문서를 검색하면 더 정확하게 검색할 수 있다.

2. 검색제외
한글의 경우에는 접두사에 따라 의미가 달라지는 경우가 있다. 예를 들어, ‘협의’를 검색하고자 하는데 검색엔진이나 솔루션에 따라서는 ‘비협의’가 검색되는 경우가 있다. 이럴 경우에는 ‘비협의’는 검색에서 제외한다면 원하는 문서를 찾을 수 있다.

3. 특정 숫자나 단어 지정(?)
검색시 출원번호나 소송번호 등을 검색할 경우에는 ‘특허1997-00074??’와 같이 형식이 정의된 경우들이 있고, 이런 정보들이 문서나 이메일에 작성되어 있는 경우가 많다. 이 때는 검색엔진에서 제공하는 “?”, “*”를 이용하여 검색할 수 있다. 예를 들어, ‘특허1997-??????’ 와 같은 방법으로 검색하면 해당 조건에 맞는 문서를 쉽게 찾을 수 있다.

4. 특정단어 사전정의 검색(말뭉치)
업계별로 사용하는 특정 용어나 전문용어가 있고, 그 용어들 사이에 관련성이 존재하게 된다. 이 경우에는 특정 용어에 대한 말뭉치를 이용하여 유사어, 대체어 등을 사전에 블리안검색(Boolean Search) 방식으로 검색한다면 실수로 검색 못하는 문서를 줄일 수 있다. 이러한 말뭉치는 공동 작업과 회사 노하우를 이용하여 잘 관리한다면 다른 회사보다 경쟁우위를 점할 수 있게 된다.

추가적으로 구글의 검색가이드2) 나 구글링 방법3)도 Search Framework을 구성하거나 원하는 문서나 이메일을 찾을 때 도움이 될 수 있다.

이메일 거버넌스에서 출발하여 실제로 e-Discovery에서 검색하는 환경과 노하우까지 살펴봤다. 앞에서도 언급했지만, e-Discovery에서 가장 중요한 것은 수천만 건 많게는 수억 건의 회사 문서에서 소송에 관련한 문서 및 이메일을 빠르고 정확하게 검색, 리뷰하여 제출 및 이용하는 것이다. 이를 위해서는 평소에 이메일 및 문서를 회사 자산·정보라고 인식하고 소송 등에 대비해 효율적으로 관리해야 한다. 특히, 내외부와 소통이 가장 많은 이메일을 거버넌스 차원에서 관리한다면 비용 절감은 물론 불확실한 미래에 확실히 대비하는 가장 강력한 방법이 될 것으로 본다.
[글_조 재 영 펜타시스템테크놀러지 수석컨설턴트(dalma37@gmail.com)]

필자는--------------------------------------------
조 재 영 수석컨설턴트
현재 회사에서 지식경영과 문서 및 이메일 아카이빙 업무를 수행하고 있다. 기업 내 산재되어 있는 각종 정보를 지식으로 재활용할 수 있는 분야에 관심이 있고, 향후 e-Discovery 대비하여 사내의 각종 문서와 이메일을 통합하여 관리할 수 있는 환경을 준비 중에 있다.
--------------------------------------------------

1) http://www.edrm.net - 6. Search Methodologies
2) 구글 검색 가이드 : https://support.google.com/mail/answer/7190?hl=ko

3) 구글링 잘하는 방법 : http://blog.daum.net/96skdms/574504

댓글 없음:

댓글 쓰기