POSTECH 데이터사이언스를 위한 통계학입문 1(1-4주차 요약)
데이터사이언스 - 데이터 - 데이터분석(anaylsis): 빅데이터다루기(data curation), 데이터추출/변환(SQL, R, Python), 데이터시각화(data visualzation, ggplot), 통계모형, 인공지능(t-검정, 회귀분석, 머신러닝) - 인사이트 창출 (analytics>>discovery>>insight) 공유데이터 - 이용성 및 접근성, 재사용 및 재배포포가 자유롭고 보편적으로 참여할 수 있는 데이터 - Machine learning Repository in UC Irvine (머신러닝기법분석에 활용가능한 데이터 저장소) - 우리나라 공공데이터: 통계청, 공공데이터포털, 서울열린데이터광장, 네이버데이터랩 - 오픈소스 프로그램: R, Python, Hadoop, Spark,..