개발 기록/DATA SCIENCE
[학교_데이터과학] 데이터의 흩어짐 측정, 산포도, 범위, 사분간위 범위, 분산, 표준편차
우준성
2021. 11. 24. 10:28
산점도 그리기
from google.colab import files
uploaded=files.upload()
csv_file='2019_03_Daegu_Average_Temperature.csv'
import pandas as pd
import matplotlib.pyplot as plt
# df=pd.read_csv(csv_file) UnicodeDecodeError
df=pd.read_csv(csv_file, encoding='cp949')
print(df)
plt.scatter(range(1,32), df['평균기온(°C)'])
plt.show()
범위, 사분위간 범위 나타내기
# 최대, 최소 평균기온 범위
print('범위:', max(df['평균기온(°C)']) - min(df['평균기온(°C)']))
print('사분위간 범위:', df['평균기온(°C)'].quantile(0.75)- df['평균기온(°C)'].quantile(0.25))
분산, 표준편차 나타내기
print('분산:', df['평균기온(°C)'].var())
print('표준편차', df['평균기온(°C)'].std())
표준편차는 편차의 제곱의 평균에 루트를 씌운 값이다.
날짜별 평균 기온을 막대그래프로 표현하기
from google.colab import files
files.upload()
csv_file='2019_03_Daegu_Average_Temperature.csv'
import pandas as pd
import matplotlib.pyplot as plt
df=pd.read_csv(csv_file, encoding='cp949')
plt.bar(range(1,32), df['평균기온(°C)'])
plt.show()
축 레이블 표시
import matplotlib.pyplot as plt
plt.plot([1, 2, 3, 4], [1, 4, 9, 16])
plt.xlabel('X-Label')
plt.ylabel('Y-Label')
plt.show()
반응형