AI시대, 우리가 대비해야하는 것

2023. 3. 17. 13:17

1. 안전한 데이터 사용 

 

안녕하세요. 이전에 챗GPT 관련 글을 작성했습니다. 

'챗GPT'는 요즘 핫한 이슈 중 하나라고 할 수 있습니다. 이 '챗GPT'가 점차 우리 일상에 자리 잡으며 인공지능(AI)에 대한 관심 또한 커지고 있습니다. 앞으로 사용처가 더욱 넓어지며 데이터 경제 시대 보완하고 대비해야 하는 분야 또한 새롭게 생겨날 것입니다. 

이에 좋은 정보를 담고 있는 양질의 데이터를 얼마나 잘 확보하는지, 또한 얼마나 안전하게 데이터를 활용하는지가 중요한 논점이 될 것입니다. 고학수 개인정보위원회 위원장은 "데이터 신경제의 엔진을 정상 가동하기 위해서는 데이터를 수집하고 설계, 가공하기까지의 데이터 라이프사이클 전 과정을 국민이 신뢰할 수 있도록 해야 한다."고 말했습니다. 

 

데이터 라이프사이클(Data life cycle)은 데이터의 가용 수명에 걸친 일련의 단계로 구성됩니다. 우리가 삶의 생애주기를 작성하는 것과 같은 개념입니다. 데이터는 인식되는 매 순간 항상 완전함을 유지해야 합니다. 여기서 완전하다는 것은 정확히, 거짓없이, 모든 내용을, 사용할 수 있도록, 유지한다는 개념입니다. 우리는 시스템 간 데이터가 이동하고 다른 조직, 3의 회사로 이동하더라도 이에대해 기록해야한다는 것입니다. 데이터가 이동하거나 생산되다보면 불완전한 데이터가 만들어질 수 있습니다. 이러한 위험을 감소시키기 위해 적절한 절차와 적절한 시스템이 필요합니다. 

 

이때 가장 중요한 요소는 동시성(Comptemporaneous)과 귀속성(Attributable)입니다. 데이터는 비밀 없이 그 자취를 우리에게 모두 전달할 수 있어야 합니다. 정말 중요한 사항이지만 가장 지켜지기 어려운 부분이기도 합니다.  

 

AI는 4차 산업혁명의 핵심이며 이를 가속화하는 빅데이터와 적절하게 이뤄지는 조합은 그동안 우리가 해결하지 못한 문제를 다각도로 분석해 해결하며 큰 인기를 얻고 있습니다. 빅테이터 저장소는 무수히 많은 데이터를 담고 있으며 무한한 바다와도 같습니다. 이에 따라 빅데이터를 효율적으로 사용하기가 점차 어려운 과제로 자리 잡고 있습니다. 

 

2. 데이터의 숙명, 개인정보

 

또한 다양한 데이터를 처리하는 데 있어 개인정보도 중요한 이슈로 떠오르고 있습니다. 개인정보위원회에서는 국가 개인정보 컨트롤 타워로 국민이 신뢰하는 데이터 생태계를 조성하기위해 많이 고민하고 있습니다. 개인정보를 어떤 방식으로 가명 처리할지 등 기존 법 제도에 규정되어 있지만 활용도가 떨어지는 영역에 대해 새롭게 들여다보고 개선할 점이 있는지를 살피고 있습니다. 

 

현재 AI 생태계는 굉장히 빠른 속도로 발전하고 있습니다. 변화의 속도가 빨라지며 이에 대비하기 위한 다양한 제도들도 발 빠르게 준비되어야 할 것입니다. 이러한 변화가 가능하게 된 것에는 접근성, 잘 마련되어 있는 오픈소스와 서드파티 생태계가 한몫했다고 볼 수 있습니다. 챗GPT가 AI를 공개하지 않았다면, 업스테이지가 자체 기술을 더하지 않았다면 새로운 서비스는 나타나지 못했을 것입니다. 이제 각각의 기업이 서로 협력하며 발전하는 협력의 시대가 도래했다고 볼 수 있습니다. 

 

서드파티 생태계는 점점 더 활발해지고 견고해질 것으로 예상됩니다. 이에 대비하여 개인정보보호정책이 필요할 것으로 보입니다. 실제로 최근 개인정보와 관련하여 많은 이슈가 발생하고 있습니다. 최근 '본디' 서비스의 경우에도 개인정보 유출 논란과 관련하여 화제가 되었으며 많은 사용자층을 잃게 되었습니다. AI 학습을 위해 활용되는 비정형 데이터의 경우에 데이터 속 개인정보를 처리하기가 까다롭다는 문제가 발생합니다. 그렇기에 이를 해결하도록 여러 방면에서 발전이 이뤄져야 할 것입니다. 

 

아직은 개인정보와 관련하여 명확한 가이드라인이 없는 상황에서 이를 명확하게 할 수 있는 정책이 마련되어야 할 것입니다.