분류 전체보기
-
데이터 분석 알고리즘의 특징과 종류AI Study/데이터 분석 이론 2020. 6. 2. 12:00
데이터 분석 알고리즘은 통계적 방법과 인공지능 방법으로 나눌 수 있다. 통계적 방법 : 수집된 데이터에 대해서 어떤 규칙을 가지고 있는지 분석을 하고, 발견된 규칙을 알고리즘과 같이 만들어서 활용하는 방법 인공지능 방법 : 대량의 데이터로부터 데이터에 대한 규첵을 알고리즘이 찾아내게 만든는 방법 찾은 규칙은 사람이 해석할 수 있는 화이트박스 알고리즘과 해석할 수 없는 알고리즘인 블랙박스 알고리즘으로 나눌 수 있다. 화이트박스 알고리즘 : 결정 크리(decision tree)가 있어, 트리 구조를 그래프로 그려 보면 알고리즘이 어떤 규칙을 만들어 냈는지 이해할 수 있다. 블랙박스 알고리즘 : 딥러닝의 기본구조인 신경망은 사람이 해석하기에 무리가 있다. 데이터 분석에는 변수라는 용어가 많이 사용된다. 종속변..
-
데이터 분석 프로세스AI Study/데이터 분석 이론 2020. 6. 2. 11:37
1. 문제정의 데이터 분석의 목적은 무엇이며 목표는 무엇인가를 명확하게 정의해야 한다. 예시) 데이터 분석 목적 데이터 분석 목표 내년에 은퇴하는 우리 팀 타격왕 자리를 메울 선수 영입 비슷한 성향과 성적을 가진 타자 조사 아이스크림 회사의 매출 예측 가게의 입지조건으로 일 평균 손님 수 예측 신체품의 공정 개발 기간 단축 DOE를 통한 공정 파라미터 요인 분석 및 품질 향상 조건 도출 2. 데이터 수집 데이터 수집에서 가장 중요한 것은 생각할 수 있는 모든 관련 데이터에 대해서 모두 정의하고 조사하는 것이다. 피시본 다이어그램을 이용하면 누락없이 조사할 수 있다. 3. 데이터 분석 (1) 데이터 전처리 과정 : 데이터의 결측값, 이상치, 중복값등을 처리해 품질이 좋은 데이터로 통합 결측값 처리는 결측값..