프로젝트

용도별 전기 사용량 데이터 전처리

멈머이 2023. 12. 8. 04:19
728x90

프로젝트에서 사용할 데이터를 전처리 해보겠다.

 

https://bigdata.kepco.co.kr/cmsmain.do?scode=S01&pcode=000166&pstate=L&redirect=Y

 

전력데이터 개방 포털시스템

꺾은선그래프 라벨관련 js --> 월별 데이터 다운로드 다운로드 (단위: 호, kWh, 원, 원/kWh) caption 지역구분 계약구분 고객호수(호) 사용량(kWh) 전기요금(원) 평균판매단가(원/kWh) caption 그래프 선택 원

bigdata.kepco.co.kr

사용할 데이터 : 업종별 전력사용량 => 엑셀파일 다운로드

 

 

1. 판다스 라이브러리 정의

import pandas as pd

 

 

2. 데이터 불러오기

file_path="./용도별 전기 사용량 1년 통합.xlsx"
df = pd.read_excel(file_path, usecols="A:D", skipfooter=28)
#pd.set_option('display.precision',2)
df

 

 

엑셀파일을 다운로드할 때 최대 6개월까지 한 번에 

다운로드할 수 있다.

나는 엑셀파일에서 어느 정도 데이터를 정리 한 뒤 

불러왔다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. 사용할 예정인 데이터 만들기

  - 분석을 할 때 고객호수1당 전력 사용량이 궁금해서 뽑아보겠다.

df_per = df["사용량(kWh)"]/df["고객호수(호)"]
df_per = df_per.round(2)
df_per

 

 

소수점 자리는 2쨰 자리까지.

 

 

 

 

 

 

 

 

 

 

 

4. 컬럼 추가하기

df["호수1당 사용량"] = df_per
df

 

 

 

컬럼명 호수 1당 사용량으로 컬럼을

추가했다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5. 가공데이터 저장

save_path = "./고객1호당 사용량.csv"
df.to_csv(save_path, index=False)
728x90