프로젝트
용도별 전기 사용량 데이터 전처리
멈머이
2023. 12. 8. 04:19
728x90
프로젝트에서 사용할 데이터를 전처리 해보겠다.
https://bigdata.kepco.co.kr/cmsmain.do?scode=S01&pcode=000166&pstate=L&redirect=Y
전력데이터 개방 포털시스템
꺾은선그래프 라벨관련 js --> 월별 데이터 다운로드 다운로드 (단위: 호, kWh, 원, 원/kWh) caption 지역구분 계약구분 고객호수(호) 사용량(kWh) 전기요금(원) 평균판매단가(원/kWh) caption 그래프 선택 원
bigdata.kepco.co.kr
사용할 데이터 : 업종별 전력사용량 => 엑셀파일 다운로드
1. 판다스 라이브러리 정의
import pandas as pd
2. 데이터 불러오기
file_path="./용도별 전기 사용량 1년 통합.xlsx"
df = pd.read_excel(file_path, usecols="A:D", skipfooter=28)
#pd.set_option('display.precision',2)
df
엑셀파일을 다운로드할 때 최대 6개월까지 한 번에
다운로드할 수 있다.
나는 엑셀파일에서 어느 정도 데이터를 정리 한 뒤
불러왔다.
3. 사용할 예정인 데이터 만들기
- 분석을 할 때 고객호수1당 전력 사용량이 궁금해서 뽑아보겠다.
df_per = df["사용량(kWh)"]/df["고객호수(호)"]
df_per = df_per.round(2)
df_per
소수점 자리는 2쨰 자리까지.
4. 컬럼 추가하기
df["호수1당 사용량"] = df_per
df
컬럼명 호수 1당 사용량으로 컬럼을
추가했다.
5. 가공데이터 저장
save_path = "./고객1호당 사용량.csv"
df.to_csv(save_path, index=False)
728x90