개발 기록/DATA SCIENCE

개발 기록/DATA SCIENCE

[학교_데이터과학] 데이터의 흩어짐 측정, 산포도, 범위, 사분간위 범위, 분산, 표준편차

산점도 그리기 from google.colab import files uploaded=files.upload() csv_file='2019_03_Daegu_Average_Temperature.csv' import pandas as pd import matplotlib.pyplot as plt # df=pd.read_csv(csv_file) UnicodeDecodeError df=pd.read_csv(csv_file, encoding='cp949') print(df) plt.scatter(range(1,32), df['평균기온(°C)']) plt.show() 범위, 사분위간 범위 나타내기 # 최대, 최소 평균기온 범위 print('범위:', max(df['평균기온(°C)']) - min(df['평균기온(°..

개발 기록/DATA SCIENCE

[학교_데이터과학] 대푯값과 중앙값, 최빈값 파이썬으로 구하기

중앙값, 최빈값 중앙값 구하는 함수 : quantile(), median() 최반값 구하는 함수 : mode() (quantile은 사분면을 기반으로 하는데, median보다 더 정확한 계산을 할 때 쓰인다.) google colab에 csv 파일 올리는 방법 1. files.upload() 이용 from google.colab import files files.upload() csv_file='2019_03_Daegu_Average_Temperature.csv' import pandas as pd df=pd.read_csv(csv_file, encoding='cp949') # 한글 인코딩 해주어야 함 print(df.head()) # df = data frame 2. 구글 드라이브에 직접 접근하여 cs..

개발 기록/DATA SCIENCE

[학교_데이터과학] 대푯값과 평균 파이썬으로 구하기

대푯값 구하기 데이터가 아주 많다면 이것을 대표하는 값으로 표현해볼 수 있다. 즉, 전체 데이터의 특징이나 경향을 대표할 수 있는 몇 가지 기본적인 통계적 수치를 알아볼 것이다. 보통 데이터의 양 끝단, 최대값, 최소값보다는 데이터의 중심이 그 데이터를 설명하는 데 더 유용할 것이다. 평균 한국의 남자 키를 누군가가 물었다면 대답할 때 약 2500만명의 남자 키를 모두 말하기는 어렵다. 이때 평균 키를 말하면 대략적인 남자 키를 말했다고 할 수 있을 것이다. data=[1, 2, 3, 4, 5] print(sum(data)) print(len(data)) 수학과 통계에서 산술 평균(算術平均, arithmetic mean)은 주어진 수의 합을 수의 개수로 나눈 값이다. data=[1, 2, 3, 4, 5]..

우준성
'개발 기록/DATA SCIENCE' 카테고리의 글 목록