You are currently viewing 나도 하는 파이썬 데이터 분석 리뷰

나도 하는 파이썬 데이터 분석 리뷰

“한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.”

나도 하는 파이썬 데이터 분석 – 한빛미디어

1. Intro

바야흐로 데이터 분석의 시대다.

데이터를 단순히 DB나 엑셀로 저장해두기만 한다면 큰 효용이 없을것이다.

그러나 단순 저장되어있는 데이터를 꺼내와서 분석하고, 의미있는 결과를 도출한다면, 이는 큰 이득을 가져다 줄것이다.

이러한 데이터 분석활용의 사례는 공공분석 데이터 분석활용 우수 사례집, 2021 빅데이터 플랫폼 활용 사례등 많이 찾아 볼 수 있다.

그렇다면 데이터 분석을 어떻게 시작할 수 있을까? 이 지점에서 많은 답안으로 나오는게 파이썬을 활용한 데이터 분석이다. 다른 코딩 언어에 비해서 파이썬은 문법이 간단하고, numpy,pandas와 같은 빅데이터 분석 / 인공지능 예측등과 같은 라이브러리가 잘 구성되어있다는 장점이 있다.

본 책은, 이러한 파이썬과 데이터분석을 쉽고 간단하게 알려준다.


2. 책 구성

본 책은 크게 2파트로 나뉘어져있다.

파트1은 자료형/조건문,반복문/함수,클래스 등과 같은 파이썬 기초 문법을 설명한다

파트2는 정형,비정형 데이터 분석/크롤링/상관관계,회귀,시계열 분석들을 다룬다.

이 책의 제목인 ‘나도 하는 파이썬 데이터 분석’임을 미루어 보았을때, 전반부는 파이썬을 잘 모르거나 친숙하지 않은 일반 독자를 대상으로 간략히 기초 문법을 소개하고, 후반부부터 관련 데이터와 라이브러리를 활용한 데이터 분석을 수행한다.

PART 1 생활 데이터로 배우는 파이썬 기초 문법

1장 4차 산업혁명과 빅데이터
_1.1 4차 산업혁명과 기술의 변화
_1.2 빅데이터란?

2장 연필 없이 복잡한 수학 문제를 풀어보자_연산자, 변수, 자료형
_2.1 1 더하기 1은?
_2.2 a 더하기 b는?
_2.3 1+1=2는 True or False?
Google Colab on Smartphone

3장 갖고 싶은 위시 리스트 아이템 있어?_튜플, 리스트, 딕셔너리
_3.1 내가 갖고 싶은 물건은 확실하다!
_3.2 내가 갖고 싶은 물건은 변할 수 있다!
_3.3 내가 갖고 싶은 물건이 얼만지 알고 싶어?
Google Colab on Smartphone

4장 철수야, 맨날 학원 가고 독서실만 가니?_조건문, 반복문
_4.1 파이썬 도서, 다 읽었어?
_4.2 오늘은? 내일은? 모레는?
Google Colab on Smartphone

5장 업무는 효율이 핵심이야!_함수, 클래스
_5.1 작년에 용돈 얼마 썼어?
_5.2 요리는 내가 직접 한다
_5.3 냉장고를 정리하자
Google Colab on Smartphone

PART 2 데이터 수집 및 분석하기

6장 코로나 시기에 한적한 곳으로 여행 가고 싶다면?_정형 데이터 분석
_6.1 정형 데이터 수집하기
_6.2 지역별/연령별 방문객 순위는?
_6.3 지도 위에 표현해보자
_6.4 코로나 확진자 수 통계 분석하기
Google Colab on Smartphone

7장 우표 수집하니? 난 데이터 수집한다!_비정형 데이터 분석, 크롤링
_7.1 웹 기반의 비정형 데이터 수집하기
_7.2 애국가에서 ‘대한’은 몇 번 등장할까?
_7.3 나만의 빅데이터 저장소를 만들자
Google Colab on Smartphone

8장 너와 나의 연결고리_상관관계 분석
_8.1 M세대와 Z세대의 취업률 상관계수는?
_8.2 대출 이율이 오르면 우리 집값은?
_8.3 집이 비어 있을 땐 허수아비라도 설치해야 할까?
Google Colab on Smartphone

9장 아니 땐 굴뚝에 연기 날까_회귀 분석
_9.1 모든 일에는 다 이유가 있다
_9.2 집 앞에 어린이집이 생기면 집값에 어떤 영향을 미칠까?
_9.3 내일은 비가 올까요?
_9.4 회귀 분석과 인공지능 예측 차이
Google Colab on Smartphone

10장 앞만 보는 것이 아니라 뒤도 살펴봐야 한다_시계열 분석
_10.1 과거는 미래에 영향을 줄까?
_10.2 ARIMA와 인공지능 기반 시계열 예측의 차이
_10.3 이 아파트를 지금 팔아야 할까? 보유해야 할까?
Google Colab on Smartphone


3. 인상적인 부분

3.1. Google Colab 기반의 실습 환경

실습이 포함된 강의/교재의 경우, 강의자의 환경과 실습자의 환경이 달라서 실습에 어려움을 겪는 사례가 종종있다. 사용자의 OS가 Windows/MacOS 인지, 사용중인 프로그램의 버전은 무엇인지가 그것이다.

이를 위해, 이 책에서는 실습을 클라우드 기반의 파이썬 개발 툴 Google Colab에서 진행한다. 작업환경을 구축하는 시간을 줄이고, 교재의 내용을 쉽고 간단하게 따라해 볼 수 있다.

3.2. 실제 데이터를 사용한 가공

Part2에 들어서, 데이터 수집 및 분석으로 들어가면 실제 데이터 기반의 예시들이 제시된다.

실제로 책을 읽어보기전에는, 단순히 테스트만을 위한 테스트 데이터를 제시하고, 그에 기반한 분석을 보여주지않을까, 실무에 적용할 수 있을까라는 우려가 있었다.

공공데이터 포탈의 경기도 수원시_어린이보호구역 내 일평균 유동인구 데이터, 교육통계서비스의 년도별 대학 졸업자 수와 같이, 실제로 접근/사용가능한 데이터에 기반한 실습이 이루어진다.

8.3 집이 비어 있을 땐 허수아비라도 설치해야 할까? 중 일부 내용

4. Outro

설명과 실습에 사용된 모든 소스 코드실습 데이터는 별도의 Git Repository를 통해 제공된다.

쉽게 준비할 수 있는 구글 콜랩 환경에서, 여러 시나리오를 상정한 데이터 분석 실습을 통해 기본기를 익히기에는 충분할 듯 하다.

다만 기초 파이썬 문법부터 실제 라이브러리 활용까지 이 한권으로 익히기에는 조금 어려움이 따를 수 있을 듯하다.

본 책을 통해 기본적인 개념과 흐름을 파악한 뒤, 조금 더 심화 영역에 관심이 생기면 해당 부분에 대한 공부를 이어가는것이 적절할 듯 하다.

Leave a Reply