ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 11일차(345 ~ 392)
    책/파이썬 라이브러리를 활용한 데이터 분석 2019. 4. 2. 23:34
    반응형

     

    351쪽에 아주 유용한 방법이 소개되어 있습니다.

    그동안 저희가 데이터를 골라낼 때의 방법은 iloc, loc, ix를 사용해 index, columns만을 이용해서 데이터를 뽑아냈는데, 아래와 같이 dict(list(df.groupby('key1')))를 사용하면 key1에 있는 요소를 골라서 추출 할 수 있게 된다고 합니다.

    큰 데이터를 다룰 때 굉장히 유용할 것 같습니다.

    ['data1']로 하면 결과를 Series형식으로 볼 수 있고, [['data1']]로 하면 결과를 DataFrame형식으로 볼 수 있다고 하네요.

    ['data1']로 적고나서  DataFrame()명령어를 가지고 해당 내용을 감싸는 구조로 만들어도 상관은 없습니다.

     

     

    355쪽 가운데 코드에 나온 one, two가 무엇을 기준으로 정해진 것인지 찾아보았는데 이런 기준으로 one, two가 결정되었던거네요

    357쪽입니다.

    agg는 함수를 이용한 GroupBy집계를 보여주는 명령어라고 합니다. agg나 aggregate는 같은 명령어입니다.

    필요로 하는 명령어(sum,mean 같은 것)가 없으면 agg를 이용해서 원하는 데이터를 추출 할 수 있다고 합니다.

     

     

    359쪽입니다.

    제가 쓰는 tips.csv를 확인해보면 성별이 나와있지 않습니다.

    확인해보니 책 쓴 분이 개정판에서 성별을 삭제하였습니다.

    가끔가다 열 순서가 이상한 자료가 있었는데, 그동안 개정판 데이터를 써서 그랬군요

    혹시 저처럼 개정판 데이터를 쓰고 있다면 https://github.com/wesm/pydata-book/tree/1st-edition 여기에 들어가셔서 다시 다운하면 됩니다.

     

    as_index는 그룹을 인덱스로 설정할지 말지 결정하는 인자입니다.(p.362)

    group_keys는 그룹 키를 계층적 인덱스로 사용할지 말지 정하는 인자입니다.(p.368)

     

    p.374

    -가중평균이란? https://m.blog.naver.com/gggg0714/221014608547

    pct_change는 퍼센트 변화율을 계산하는 명령어입니다.

     

    params는 매계변수라는 뜻이라고 합니다.

     

    377쪽에 처음 코드를 입력하고 실행시 오류가 나옵니다.

    rows index로 바뀌었고, cols columns로 바뀌었습니다.

     

    pivot_table에 있는 margins 인자는 모든 데이터를 분석한 결과를 오른쪽 열과 맨 아래 행에 넣을지 결정하는 역할을 합니다. 기본 값은 False, 평균을 구하는 것으로 되어있으며 aggfunc를 이용하여 분석 결과를 선택할 수 있습니다.

     

    crosstab은 교차표를 만들어주는 명령어입니다.

    자세한 내용은 https://rfriend.tistory.com/280 여기를 참고하시면 됩니다.

     

     

     

    =======================================================================

    점점 아는 것들이 많이 나오니 쓸 내용이 줄어들고 있습니다.

    처음에는 아무것도 모르고 무작정 외웠는데 코드가 점점 읽히기 시작하네요.

    반응형

    ' > 파이썬 라이브러리를 활용한 데이터 분석' 카테고리의 다른 글

    13-1일차(425 ~ 444)  (0) 2019.04.04
    12일차(393 ~ 424)  (0) 2019.04.03
    10일차(305 ~ 344)  (0) 2019.04.01
    9일차(272 ~ 304)  (0) 2019.03.29
    8일차(249 ~ 271)  (0) 2019.03.28

    댓글

Designed by Tistory.