[홍준기의 맛있는 IT 칼럼] #16 추천 알고리즘에 대한 생각이 필요한 이유

알고리즘과 확증편향 그리고 가짜뉴스

 

유튜브를 좋아하는 독자라면 유튜브 댓글 중에서 "알고리즘이 오늘도 나를 이곳으로"라거나 "알고리즘의 선택을 받은"이라는 내용을 본 적이 있을 것이다. 여기서 사용되는 알고리즘은 본래의 뜻보다는 좁은 의미인 '추천 알고리즘'을 의미한다. 유튜브는 사용자의 구독 정보나 자주 보는 영상을 판단하여 추천 영상을 제공하는 추천 알고리즘을 운영 중에 있다. 그런데 가끔 옛날 영상이라거나 그동안 유명하지 않은, 조회 수가 적었던 영상을 추천 영상에 띄워 많은 조회 수를 낼 수 있도록 하는 이른바 '알고리즘의 선택'이라는 현상이 자주 일어나자 일종의 유행어로 통하기 시작한 것이다. 이러한 알고리즘의 선택은 사용자가 더 편하게 서비스를 이용할 수 있도록 함에 목적이 있다. 나는 예능을 좋아하는데 유튜브 리스트에 다큐멘터리만 가득하다면 예능을 검색하는 데 지쳐 유튜브를 종료하고 말 것이다. 이런 일을 미연에 방지하고자 사용자가 좋아할 법한, 예전에 봤던 영상을 추천해주어 사용자가 더욱 편리하고 오랫동안 서비스에 머물도록 하는 거다.

 

편리함 속 빠져드는 추천 알고리즘

 

위와 같은 추천 알고리즘은 사용자의 입장에선 무척이나 편리한 서비스이다. 본인이 좋아하는 내용에 집중할 수 있다 보니 집중력이 분산된다는 느낌도 들지 않을 테고 관련된 정보를 빨리 얻을 수 있기 때문이다. 그래서 앞에서 언급한 유튜브 외에도 많은 플랫폼에서 이러한 추천 알고리즘을 제공 중이다. 유명 포털의 뉴스 서비스에선 사용자가 그간 읽었던 뉴스의 주제나 언론사를 기준으로 성향 등을 판단해 뉴스를 편집하여 제공하고 쇼핑몰에선 사용자가 봤던 거나 장바구니에 담았던 것을 추후 광고에 띄워 구매할 수 있도록 한다. 사용자의 입장에선 굳이 찾지 않아도 알려주니 좋고, 플랫폼의 입장에선 수익이나 조회 수가 증가이니 이득이다.

 

득이 있다면 실이 있는 법

 

하지만 명이 있는 곳에는 암이 있다는 말처럼 추천 알고리즘의 득이 있다면 실도 있는 법이다. 추천 알고리즘으로 인한 실은 무엇일까? 실을 본격적으로 알아보기 전에 이해를 도우고자 한 가지 상황을 가정해보겠다. 여러분들이 좋아하는 유튜브의 추천 알고리즘이 없다고 생각해보자. 이 기사를 쓰고 있는 필자로서도 끔찍한 소리지만 일단 한번 생각해보자. 여러분들의 피드에는 여러분들이 좋아하는 영상도 있겠지만 싫어하거나 잘 모르는 영상도 가득하다. 이럴 때 당신은 어떻게 할 것인가? 여러분들이 좋아하는 영상을 보기 위해 검색할 것인가 포기하고 피드를 둘러볼 것인가? 필자라면 후자를 택할 것이다. 침대에 누워 유튜브를 킨 상태에서 내가 뭘 볼까 고민하고 검색할 시간에 차라리 피드를 둘러보는 게 더 효율적이라 생각되기 때문이다. 아마 여러분들도 비슷하리라 생각한다.

 

이 상황을 제대로 이해했다면 실도 잘 이해할 수 있다. 위 상황에서 알고리즘이 없었을 때와 달라진 점은 무엇일까? 바로 내가 원치 않는 것도 일단은 접했다는 점이다. 싫어하는 것도 스쳐 갔더라 할지언 썸네일이라도 본 상태라는 말이다. 그게 무슨 차이냐고 할 사람을 위해 한 가지 예시를 더 들어보겠다. 여러분들은 천동설과 지동설 중 무엇이 맞는지 모르는 사람이다. 그런데 여러분의 유튜브 피드에 천동설을 주장하는 영상이 떴다. 해당 영상이 주장하는 내용과 근거가 너무나도 논리적이다고 생각한 여러분은 천동설을 믿는 몇 안 되는 사람이 되었다. 주변에선 계속해서 지동설이 바르다고 주장하지만, 여러분은 계속해서 새로운 근거를 가져와 천동설을 주장한다. 근거가 어디서 나왔나고? 바로 여러분의 유튜브 피드에서 왔다. 당신이 바르다고 생각하고 좋아하는 천동설 영상을 계속해서 추천해주는 알고리즘에 의해 지동설에 대한 설명을 들을 기회조차 박탈당한 당신은 계속해서 천동설을 믿게 될 것이다. 물론 앞에서처럼 당신이 싫어하는 것도 스쳐 갈 수 있는 상황이었더라면 적어도 한 번은 지동설에 관한 주장을 봤을지도 모를 일인데도 말이다.

 

알고리즘과 확증편향

 

앞에서 생각해본 사례는 확증편향에 해당하는 사례이다. 객관적인 증거나 자료와는 상관없이 본인이 처음 가진 생각을 계속해서 주장하고, 이러한 주장을 위한 유리한 증거만 수집하는, 반대되는 주장과 관련된 불리한 증거를 거들떠도 보지 않는 것을 확증편향이라 한다. 이 과정에서 알고리즘은 증거 수집을 도와준다. 의도했건 안 했건 한 사람이 하나의 주장에만 매몰되어 결국 빠져나오지 못하는 지경까지 만든 데는 알고리즘의 책임이 없다고는 할 수 없다.

 

필자가 우려하는 점은 바로 윗부분이다. 추천 알고리즘은 여러분을 위의 예시와 같은 사람을 만들지도 모른다. 아니, 이미 만들고 있다. 여러분의 주변에서도 예시를 어렵지 않게 찾아볼 수 있다. 몇몇 단체에서 주장한 내용 대부분이 관계 부처나 언론에 의해 반박되었음에도 단체에 속한 사람들은 맞다고 주장한다. 왜일까? 그것은 그 사람들이 멍청해서거나 잘못된 신념을 가지고 있어서가 아니다. 단순히 본인이 그동안 접한 정보의 대다수는 해당 내용이 맞다고 설명하기 때문이다. 해당 내용이 맞다고 주장하는 유튜브 채널을 자주 보다 보니 이 채널과 비슷한 주장을 하는 영상만 접하게 되고 결국 이를 틀렸다고 주장하는 반대 측의 의견을 듣지 못해 잘못된 판단을 하게 되는 것이다.

 

알고리즘은 유지하되 사용자가 문제점을 인식해야

 

여기까지 읽은 사람이라면 이런 주장을 할 수도 있다. "그럼 추천 알고리즘을 없애야 한다는 말인가?" 필자는 아니라고 답하고 싶다. 필자가 말하고 싶은 건 알고리즘이 잘못되었다는 것이 아니라, 알고리즘의 문제점을 알아야 한다는 것이다.  칼을 잘못 사용했을 땐 소중한 생명을 잃을 수 있다는 점을 알고 조심히 사용하면 그 어떤 도구보다 뛰어난 조리 도구가 될 수 있는 것처럼 알고리즘 또한 본인이 보고 있는 정보가 편향될 수 있단 걸 유념한 채 다른 주장도 한 번쯤은 보는 습관을 지닌다면 그 어떤 비서보다도 당신의 취향을 잘 아는 비서가 될 거라 생각한다. 이 세상 모든 사람이 추천 알고리즘이라는 똑똑한 비서를 둔 상태로 바뀌길 바라면서 이 글을 마치겠다.

 

이 기사 친구들에게 공유하기