개발 기록/DATA SCIENCE

[학교_데이터과학] 데이터의 흩어짐 측정, 산포도, 범위, 사분간위 범위, 분산, 표준편차

우준성 2021. 11. 24. 10:28

산점도 그리기

from google.colab import files
uploaded=files.upload()
csv_file='2019_03_Daegu_Average_Temperature.csv'
import pandas as pd
import matplotlib.pyplot as plt
# df=pd.read_csv(csv_file) UnicodeDecodeError
df=pd.read_csv(csv_file, encoding='cp949')
print(df)
plt.scatter(range(1,32), df['평균기온(°C)'])
plt.show()

 

 

 

 

범위, 사분위간 범위 나타내기

# 최대, 최소 평균기온 범위
print('범위:', max(df['평균기온(°C)']) - min(df['평균기온(°C)']))
print('사분위간 범위:', df['평균기온(°C)'].quantile(0.75)- df['평균기온(°C)'].quantile(0.25))

 

 

 

 

분산, 표준편차 나타내기

print('분산:', df['평균기온(°C)'].var())
print('표준편차', df['평균기온(°C)'].std())

표준편차는 편차의 제곱의 평균에 루트를 씌운 값이다.

 

 

 

 

날짜별 평균 기온을 막대그래프로 표현하기

from google.colab import files
files.upload()
csv_file='2019_03_Daegu_Average_Temperature.csv'
import pandas as pd
import matplotlib.pyplot as plt
df=pd.read_csv(csv_file, encoding='cp949')
plt.bar(range(1,32), df['평균기온(°C)'])
plt.show()

 

 

 

 

축 레이블 표시

import matplotlib.pyplot as plt

plt.plot([1, 2, 3, 4], [1, 4, 9, 16])
plt.xlabel('X-Label')
plt.ylabel('Y-Label')
plt.show()

 

반응형