AI Study/데이터 분석 이론
-
데이터 분석을 위한 통계 수학 기초 - 엑셀 수식 활용AI Study/데이터 분석 이론 2020. 6. 2. 12:37
1. 평균 : 주어진 값들의 합을 데이터 개수로 나눈 산술 평균을 의미 엑셀 수식 : =average(데이터 범위) 2. 중앙값 : 데이터를 크기 순으로 정렬했을 때 가운데 위치하는 값 (n은 데이터 개수) 엑셀 수식 : =median(데이터 범위) 3. 최빈값 : 주어진 데이터에서 가장 많이 나오는 값 엑셀 수식 : =mode(데이터 범위) 4. 최댓값, 최솟값, 범위 최댓값 엑셀 수식 : =max(데이터 범위) 최솟값 엑셀 수식 : =min(데이터 범위) 범위 엑셀 수식 : = max(데이터 범위) - min(데이터 범위) 데이터의 특성을 파악하는 가장 좋은 방법은 그래프를 그려보는 것이다. 기초 데이터의 추세나 히스토그램 등을 그린 후에 데이터의 분포, 이상점등을 파악한 후 어떠한 데이터 분석을 할..
-
데이터 분석 알고리즘의 특징과 종류AI Study/데이터 분석 이론 2020. 6. 2. 12:00
데이터 분석 알고리즘은 통계적 방법과 인공지능 방법으로 나눌 수 있다. 통계적 방법 : 수집된 데이터에 대해서 어떤 규칙을 가지고 있는지 분석을 하고, 발견된 규칙을 알고리즘과 같이 만들어서 활용하는 방법 인공지능 방법 : 대량의 데이터로부터 데이터에 대한 규첵을 알고리즘이 찾아내게 만든는 방법 찾은 규칙은 사람이 해석할 수 있는 화이트박스 알고리즘과 해석할 수 없는 알고리즘인 블랙박스 알고리즘으로 나눌 수 있다. 화이트박스 알고리즘 : 결정 크리(decision tree)가 있어, 트리 구조를 그래프로 그려 보면 알고리즘이 어떤 규칙을 만들어 냈는지 이해할 수 있다. 블랙박스 알고리즘 : 딥러닝의 기본구조인 신경망은 사람이 해석하기에 무리가 있다. 데이터 분석에는 변수라는 용어가 많이 사용된다. 종속변..
-
데이터 분석 프로세스AI Study/데이터 분석 이론 2020. 6. 2. 11:37
1. 문제정의 데이터 분석의 목적은 무엇이며 목표는 무엇인가를 명확하게 정의해야 한다. 예시) 데이터 분석 목적 데이터 분석 목표 내년에 은퇴하는 우리 팀 타격왕 자리를 메울 선수 영입 비슷한 성향과 성적을 가진 타자 조사 아이스크림 회사의 매출 예측 가게의 입지조건으로 일 평균 손님 수 예측 신체품의 공정 개발 기간 단축 DOE를 통한 공정 파라미터 요인 분석 및 품질 향상 조건 도출 2. 데이터 수집 데이터 수집에서 가장 중요한 것은 생각할 수 있는 모든 관련 데이터에 대해서 모두 정의하고 조사하는 것이다. 피시본 다이어그램을 이용하면 누락없이 조사할 수 있다. 3. 데이터 분석 (1) 데이터 전처리 과정 : 데이터의 결측값, 이상치, 중복값등을 처리해 품질이 좋은 데이터로 통합 결측값 처리는 결측값..