티스토리 뷰

평소에 온오프믹스를 애용한다.

온오프믹스를 찬양하는 것 까지는 아니지만 어떤 가치를 공유하는 새로운 사람과 만나는 것은 늘 기분 좋은 일인 것 같다. 그런 기회를 온오프믹스가 아주 편하게 제공하고 있다.


R기반 데이터 시각화툴을 활용한 빅데이터 분석(심화) 라는 제목의 교육 세미나에 신청하였다. 

세종대 율곡관에서 진행하였기에 조금 일찍 학교에서 출발하였다.

세종대 학식이 유명하다고 해서, 학교 식당에서 가장 인기있는 '소금구이 덮밥'을 먹어보았다.

역시 큰 기대는 큰 실망을 낳는법. 항상 기대를 하지 않도록 조심하자! 라는 교훈


교육 프로그램이었다. 데이터 관련 교육을 쭉 진행해오신 강사님이 쭉 이끌어주는 식의 강의였다.

기초 - 심화 - 실무의 3단계 과정 중 심화과정이었다.

R을 이전에 배우려는 생각은 있었지만, R에 대한 공개 슬라이드를 봤을 뿐 실제 어떻게 사용할 수 있을지 실습을 안해보아서 감이 없는 상태였다.

하지만, 강사님이 너무도 친절하게 기초적인 부분까지 쭉 짚어주시기도 하고 질문에 대한 답변도 너무 잘해주셔서 듣기에 어려운 부분이 없었다.

컴퓨터 공학이 주전공이 아닌 학생, 일반인도 상당 수 있었는데 문제없이 잘 따라오는 것 같았다.


<공공데이터 csv파일 - 관계 분석_boxplot+jitter>

강의 중에 가장 마음에 들었던 것은, 강사님이 단순히 R을 다루는 법만을 알려주시는 것이 아니라 실제로 R을 어떻게 활용할 것인지 / 주어진 데이터에서 어떤 인사이트를 뽑아낼 수 있을지 모델링하는 것이 더 중요한 것이라고 하셨다.

즉, 결과값을 어떻게 사용할 수 있을지, 포장할 수 있을지에 대한 직관력이 강조되었다.

특히 전문적인 분석을 요하는 대형 프로젝트의 경우 기업에서는 전문 분석 기업에 의뢰를 하는 편이기 때문에, R을 배워서 아주 훌륭한 통계 분석을 하겠다! 라고 하는 것은 사실 어렵다고 하셨다.

하지만, 예를 들어서 어떤 팀 또는 기업에서 간단한 통계적 인사이트(분석 및 예측)를 요하는 경우 R을 사용해서 원하는 결과를 얻을 수 있다면 매우 효율적일 것이다라고 하셨다.


따라서, R을 배우려는 이유가 통계를 알기 위해서라면 통계학 강의를 듣는 것이 바람직하며, 데이터에 대한 인사이트를 잘 얻고 싶다면 그런 기초를 쌓은 후 많은 분석을 직접 해보는 것이 큰 도움이 될 것이라는 것이었다.

최근 '데이터 전문가'라는 말에 혹하여 어떻게 하면 데이터 전문가, 빅데이터 전문가가 될 수 있는가 혹은 불릴 수 있는가 찾아보았지만, 코세라(www.coursera.org) 에서 데이터 전문가 과정을 듣는 것 이외에 쉽게 그 해결책을 찾지 못하고 있었는데 이 강의가 현실적인 도움이 되었던 것 같다.


특히 데이터 모델링이라는 부분은 요즘 알파고를 통해서 AI(Artificial Intelligence) 이야기가 많이 나오고 있는데, 기계가 자신들의 왕국을 건설하는 사태가 벌어지지 않는 한 이러한 가치에 대한 모델링은 결국 인간이 할 수 밖에 없는 일이 아닐까 생각한다.

인간을 위한 기계라면, 결국 인간에게 편의성을 제공해야되고 그 편의성이라는 것은 기계가 판단할 수 있는 기준이 아니기 때문이다.



이제 마지막 한 차례 남았는데, 잘 마무리하고 이런 기본기를 바탕으로 데이터 분석을 직접 해볼 수 있도록 통계학에 대한 기초와 R 활용 능력을 키워볼 생각이다.

'공부 > 데이터 과학' 카테고리의 다른 글

데이터 과학을 공부하자  (0) 2016.07.17
댓글