본문 바로가기

빅데이터3

16번째 이야기 - 데이터, dataframe, 데이터의 다양성 ● 데이터가 크다는 말은 무엇을 의미하는 것일까요? 데이터는 보통 표의 형태로 표현이 되며, 표는 행(row)과 열(column)로 구성이 됩니다. ● 데이터는 파이썬이라고 하는 언어 속, pandas 라이브러리의 DataFrame 즉, 표의 관점으로 보았을 때 행이 많다는 의미도 되고, 열이 많다는 의미도 될 수 있을 겁니다. ● 그런데 말입니다?! 데이터 분석을 한다고 했을 때, 행이 많은 것과 열이 많은 것 중 어느 쪽이 더 중요하다 할 수 있을까요? ● 김영우(2022)에 의하면 열이 많은 것이 더 중요하다 합니다. 100명의 데이터를 분석하다가 데이터가 늘어나 100100만 명의 데이터를 분석하게 되었을 때, 데이터 분석가는 어떤 문제에 맞닥뜨리게 될까요? ● 일단 컴퓨터가 힘들어합니다. 연산의.. 2022. 11. 4.
4번째 이야기 - Learning about AI와 Learning with AI ● 보신분도 계시겠지만 새정부 국정과제와 정책 문서 중 SW,AI교육과 관련된 부분입니다. ● Learning about AI와 Learning with AI ● 공교육 정책에서는 학생들의 학습격차를 줄여주고, 맞춤형 학습을 지원하는 Learning with AI에 대한 관심이 더 커보입니다. ● Learning about AI가 가능하려면 본질이나 원리를 잘알고 이를 학생수준에 맞게 잘 씹어서 전달할수 있어야합니다. ● AI는 문제해결을 위한 종합적이고 융합적인 학문입니다. ● 즉, AI+X인 것이죠. ● AI가 우리에게 도메인이 되어줄수는 없어도, AI가 자신의 도메인에 날개를 달아줄 순 있습니다. ● 인공지능, 머신러닝, 딥러닝이란 단어가 많이 들립니다. ● 요샌 인공지능한다하면 딥러닝한다라는 말로.. 2022. 8. 4.
2번째 이야기 - 빅데이터, 창의 융합형 인재 ● 서류나 문서에 기반해 일을 하다 보면 실체가 없는 해괴한 존재를 만들어내기도 합니다. ● 여기보시는 참치처럼요. ● 빅데이터 얘기를 많이 합니다. 그런데 인공지능이 이런 빅데이터를 학습해서 만들어진다면 어떨까요? ● Garbage In, Garbage Out ● 무턱대고 많다고 좋은 건 아닙니다. 데이터에도 Value가 뒷받침되어야 합니다. ● 그래서 그런지 몰라도 현 교육과정이 추구하는 인재상은 '창의 융합형 인재' 입니다. 인문학과 과학적 소양을 동시에 갖춘 그런 인재겠죠. ● 그런 의미에서 문과, 이과의 구분이 사라진 것은 천만다행이라고 생각합니다. ● 데이터와 팩트가 결여된 상상은 그저 공상에 불과합니다. 상상 없는 데이터와 팩트는 숨겨진 보물인 가치와 인사이트는 고사하고, 그저 사실의 나열만.. 2022. 8. 4.