티스토리 뷰

반응형

컴퓨터 사이언스와 같은 기술적인 분야를 이야기할떄 우리는 복잡한 단어들을 많이 사용하는 경향이 있습니다. 기술적인 단어들은 다른 유사한 용어들과 구별하여 명확한 개념을 전달하는데 도움을 주는 이유도 있습니다.   

 

그러나 많은 경우 그 분야의 용어의 개념도 잘 모르는 초보자들에게는 단순한 생각을 복잡하고 어렵게 만들기도 합니다. 복잡한 단어들을 사용하지 않고 쉽게 이해하는데 도움이 되었으면 합니다.

 

 

머신러닝

image from @bing image creator

 

 

일상생활에서의 머신러닝


우리 주변에는 많은 컴퓨터가 있습니다. 로봇청소기에서 핸드폰, 태블릿 및 노트북에 이르기까지 모두 다른 형태의 컴퓨터입니다. 오늘날의 우리가 유용하게 사용하고 있는 이러한 장치들은 사람들이 시키는 제한된 일들이나 미리 정해놓은 일들만 할 수 있는 기계입니다. 애완견처럼 시키는일에 잘 복종합니다. 시리 하면 시리가 대답하고, 네이버 아이콘을 클릭하면 네이버 열릴 것입니다. 스스로 아무것도 생각할 수 없는 존재입니다.

하지만 사람들은 컴퓨터가 많은 것들을 하도록 만들었습니다. 말할 수 있는 기능을 추가하고, 각종 센서를 달아 사람들의 움직임을 인식하게 하는 것에서 부터 바둑에서 최상의 바둑기사를 물리치는 것까지. 하지만 이러한 각각의 일들을 할 수 있게, 누군가는 컴퓨터에게 무엇을 해야 하는지, 어떻게 해야 하는지를 가르쳐야 했습니다.

그래서 컴퓨터가 사람들을 위해 할 수 있는 것들은 제한적이었습니다. 컴퓨터는 미리 정해 놓은 것들만 할 수 있었습니다. 누군가가 무언가를 하는 방법을 가르쳐주지 않고서는 아무것도 할 수 없었습니다. 이것은 최근까지 사실이었습니다. 하지만 과학자들이 컴퓨터가 스스로 학습할 수 있도록 가르치는 방법을 발견했습니다.

 

선생님이 없는 초등학교 교실에 있다고 상상해보세요. 그곳에서 모든 반 학생들이 선생님 없이 스스로 배운다는게 가능할까요? 하지만 컴퓨터는 스스로 학습하는 데 매우 능숙할 뿐 아니라 심지어 사람들이 가르칠 수 없는 복잡한 것들도 배울 수 있습니다.

 



컴퓨터는 '스스로 학습한다'?  


우리가 컴퓨터를 가르치는 방법은 질문과 대답의 많은 예를 보여주는 것이다. 전문가들은 전체 예시 세트를 데이터 세트라고 부릅니다. 이 예제에는 질문과 대답이 포함되어 있습니다. 예를 들어 '고양이 그림'과 '고양이'라는 대답, '강아지 그림'과 '강아지'라는 대답이 포함되어 있다는 의미입니다.

 

이것은 학교에서 시험공부를 학생들과 비슷합니다. 시험 전에 기출문제를 많이 풀어보면서 시험준비하는 데 시험에서 기출문제와 같은 문제가 나오지 않을수도 있지만, 비슷한 유형의 문제를 준비하는 데 도움이 됩니다.

컴퓨터는 질문과 대답의 예를 보면서 정답을 맞히는 방법을 찾으려고 노력합니다. 우리가 보여준 예(데이터 세트)에서 이 특정 질문을 보지 못했더라도 추측하는 법을 배웁니다. 컴퓨터는 이전에 본 적이 있는 유사한 질문을 찾고 추측하기 위해 이전에 본 정답을 사용합니다. 컴퓨터가 하는 일은 그것뿐 입니다. 이전에 본 예를 바탕으로 추측하는 것 입니다.

 

 

결론 

머신러닝은 인공지능(AI)의 포함되는 개념입니다. 학습하고 보다 나은 발전을 위해 개선하기 위해 미리 정해놓은 방식이 아닌, 컴퓨터가 데이터를 통해 학습하고 경험을 통해 개선하도록 훈련하도록 하는 것입니다.

 

컴퓨터가 제대로 학습하기 위해선 많은양의 데이터 세트에서 패턴과 상관관계를 찾아 올바른 예측을 할 수 있도록 학습하면서 더욱 정확해 질 것입니다.