스크립트가 작동하지 않으면 사이트 일부 기능을 사용할 수 없습니다.

본문바로가기

에너지경제연구원

메인메뉴

  • 검색
    • 통합검색
    • 소장자료
    • 메타검색
    • 신착자료
    • 정기간행물
  • 전자자료
    • e-Journals A to Z
    • Core Journals
    • e-Books
    • 학술DB
    • 통계DB
    • 전문정보DB
    • 최신 e-리포트
  • KEEI발간물
    • KEEI연구보고서
    • 정기간행물
    • 발간물회원
  • 참고웹사이트
    • 국제기구
    • 통계기관
    • 국가별에너지관련부처
    • 국내외유관기관
    • 경제인문사회연구기관
    • 에너지 전문지
  • My Library
    • 개인정보수정
    • 대출/연장/예약
    • 희망도서신청
    • 입수알림신청
    • 원문신청
    • 내보관함
    • 검색이력조회
  • 도서관서비스
    • Mission&Goals
    • 전자도서관이용안내
    • 도서관 이용안내
    • RefWorks 이용안내
    • 공지사항
    • 웹진

전체메뉴

  • 검색
    • 통합검색
    • 소장자료
    • 메타검색
    • 신착자료
    • 정기간행물
  • 전자자료
    • e-Journals A to Z
    • Core Journals
    • eBooks
    • 학술 DB
    • 통계 DB
    • 전문정보 DB
    • 최신 e-리포트
  • KEEI 발간물
    • 연구보고서
    • 정기간행물
    • 발간물회원
  • 참고웹사이트
    • 국제기구
    • 통계기관
    • 국가별 에너지관련부처
    • 국내외 유관기관
    • 경제인문사회연구기관
    • 에너지전문지
  • My Library
    • 개인정보수정
    • 대출/연장/예약
    • 희망도서신청
    • 입수알림신청
    • 원문신청
    • 내보관함
    • 검색이력조회
  • 도서관서비스
    • Mission&Goals
    • 전자도서관이용안내
    • 도서관이용안내
    • RefWorks 이용안내
    • 공지사항
    • 웹진

닫기

검색

홈아이콘 > 검색 > 상세보기

상세보기

표지이미지
자료유형 : 단행본
서명 / 저자 : 파이썬 데이터 클리닝 쿡북 : 파이썬과 판다스를 활용한 데이터 전처리 / 마이클 워커 지음 ; 최용 옮김
원서명 : Python data cleaning cookbook : modern techniques and Python tools to detect and remove dirty data and extract key insights
개인저자 : Walker, Michael | 최용 |
발행사항 : 파주 : 위키북스, 2021
형태사항 : xii, 366 p. : 천연색삽화, 도표 ; 24 cm
총서사항 : 데이터 사이언스 시리즈 ; 074
서지주기 : 색인 수록
주제명 : Programming languages --Python.
ISBN : 9791158392789
청구기호 : QA76.73.P98 워874ㅍ
QR Code 정보
 

태그

입력된 태그 정보가 없습니다. 태그추가

소장자료

부가정보

▣ 01장: 표 데이터를 판다스로 가져올 때의 데이터 정제
1.1 CSV 파일 가져오기
1.2 엑셀 파일 가져오기
1.3 SQL 데이터베이스의 데이터를 가져오기
1.4 SPSS, Stata, SAS 데이터 가져오기
1.5 R 데이터 가져오기
1.6 표 데이터 저장

▣ 02장: HTML과 JSON을 판다스로 가져올 때의 데이터 정제
2.1 단순한 JSON 데이터 가져오기
2.2 API를 통해 복잡한 JSON 데이터 가져오기
2.3 웹페이지의 데이터 가져오기
2.4 JSON 데이터 저장

▣ 03장: 데이터 측정
3.1 처음 데이터를 훑어보기
3.2 열을 선택하고 정돈하기
3.3 행을 선택하기
3.4 범주형변수의 빈도를 생성하기
3.5 연속변수의 요약통계 생성하기

▣ 04장: 데이터의 부분집합에서 누락값과 이상값 식별
4.1 누락값 찾기
4.2 변수가 1개인 이상값 식별하기
4.3 이변량 관계의 이상값과 예상치 못한 값 식별하기
4.4 부분집합을 이용해 변수 간의 논리적 불일치를 찾기
4.5 선형 회귀를 활용해 유의한 영향을
4.6 k-최근접 이웃을 활용해 이상값을 찾기
4.7 아이솔레이션 포레스트를 활용한 이상 탐지

▣ 05장: 시각화를 활용해 예상치 못한 값을 식별하기
5.1 히스토그램을 활용해 연속변수의 분포를 조사하기
5.2 박스플롯을 활용해 연속변수의 이상값을 식별하기
5.3 그룹별 박스플롯으로 특정 그룹에서 예상치 못한 값을 드러내기
5.4 바이올린 플롯으로 분포 형태와 이상값을 조사하기
5.5 산점도를 활용해 이변량 관계를 보기
5.6 라인 플롯으로 연속변수의 추세를 조사하기
5.7 상관행렬을 기반으로 히트맵을 작성하기

▣ 06장: 데이터 정제, 탐색 및 시리즈 연산
6.1 판다스 시리즈에서 값을 얻기
6.2 판다스 시리즈에 대한 요약통계 표시
6.3 시리즈 값 변경
6.4 조건에 따라 시리즈 값을 변경
6.5 문자열 시리즈 데이터 평가와 정제
6.6 날짜 다루기
6.7 누락 데이터 식별과 정제
6.8 k-최근접 이웃으로 누락값 대치

▣ 07장: 집계 시 지저분한 데이터 다루기
7.1 itertuples을 활용한 데이터 순회(안티 패턴)
7.2 넘파이 배열의 그룹별 요약을 계산
7.3 groupby를 사용해 데이터를 그룹별로 조직화하기
7.4 좀 더 복잡한 집계 함수를 groupby와 함께 사용하기
7.5 사용자 정의 함수 및 apply와 groupby
7.6 groupby를 사용해 데이터프레임의 분석 단위를 바꾸기

▣ 08장: 데이터프레임들을 결합할 때의 데이터 문제 해결
8.1 데이터프레임을 수직으로 결합하기
8.2 일대일 병합
8.3 병합 기준 열을 여러 개 사용하기
8.4 일대다 병합
8.5 다대다 병합
8.6 병합 루틴 개발

▣ 09장: 데이터 타이딩과 리셰이핑
9.1 중복 행 제거하기
9.2 다대다 관계 수정하기
9.3 stack과 melt로 넓은 데이터를 긴 포맷으로 리셰이핑
9.4 열 그룹을 녹이기
9.5 unstack과 pivot을

▣ 10장: 사용자 정의 함수와 클래스로 데이터 정제를 자동화
10.1 데이터를 처음 살펴보는 함수
10.2 요약통계와 빈도를 표시하는 함수
10.3 이상치와 예상치 못한 값을 식별하는 함수
10.4 데이터 집계와 결합을 위한 함수
10.5 시리즈 값을 업데이트하는 로직을 담은 클래스
10.6 표 형태가 아닌 데이터 구조를 다루는 클래스

서평

등록된 서평이 없습니다. 첫 서평의 주인공이 되어 보세요.