ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 14일차(477 ~ 516)
    책/파이썬 라이브러리를 활용한 데이터 분석 2019. 4. 5. 17:19
    반응형

    드디어 마지막 챕터입니다.

     

    stride란 하나의 원소에서 다음 원소까지의 너비를 표현한 정수를 담고 있는 값을 튜플형으로 보여주는 명령어라고 합니다.

    파이썬,C언어 이런 기초책들을 보면 int형은 4바이트, float형은 8바이트등등 이런 내용이 나와있습니다.

    그 내용을 가지고 다음 원소까지 가려면 몇 바이트를 건너 뛰어야 하는지 그 값을 튜플 형으로 내놓는 것이라 생각하시면 됩니다.

     

    예시를 들어보자면 다음과 같이 np.ones((10,5),dtype=np.int32)라는 배열이 있다고 가정합시다.

    int32형 하나의 값은 4바이트 이므로 배열 내에서 한 칸을 건너 뛰는데는 4바이트, 다음 배열로 넘어가기 위해서는 20바이트가 필요하다는 것입니다.

     

    위 사진도 같습니다. float64형 하나의 값은 8바이트니까 배열 내에서 한 칸을 건너 뛰는데는 8바이트이고,

    2차원 배열내에서 1차원 배열 -> 1차원 배열로 이동하려면 24바이트를 건너뛰어야하고,

    2차원 배열에서 2차원 배열로 이동하는데 48바이트를 건너뛰어야 한다는 것입니다. 쉽죠?

     

     

    issubdtype(X, Y) 는 X와 Y의 자료형이 서로 같은지 bool형으로 보여주는 명령어입니다.

    mro는 dtype의 부모 클래스 목록을 보여주는 명령어입니다.

     

    ravel은 다차원 배열을 1차원으로 변환시키는 명령어입니다.

    flatten은 ravel과 유사하게 동작하지만 항상 데이터의 복사본을 반환한다고 합니다.

    이게 무슨 차이냐면 ravel은 가능하면 원래의 배열을 보여주려고 합니다. 그래서 ravel이 반환한 배열을 수정하면, 원본 배열도 수정될 가능성이 있다고 하네요.

    a의 값만 바꿨는데 arr의 값도 바뀌었습니다.

     

    np.newaxis에 대해 더 알고 싶으면 https://stackoverflow.com/questions/29241056/how-does-numpy-newaxis-work-and-when-to-use-it 여기에서 보시면 됩니다.

     

    lexsort는 argsort와 유사하지만 다중 키 배열에 대해 간접 사전 순으로 정렬을 한다고 합니다.

    간접 사전 순으로 정렬한다는 것이 무슨 뜻인지 정확히 모르겠지만 아마 사전순으로 정렬하는 것과 비슷한 역할을 하는 것 같습니다.(p505)

    lexsort는 뒤에 받은 인자로 먼저 정렬하기 때문에 이 부분을 주의하시면 됩니다.

    자세한 예시는 https://docs.scipy.org/doc/numpy/reference/generated/numpy.lexsort.html 여기에서 확인하시면 됩니다.

     

    p.512 맨위에 나온 코드중 'w+'라는 것은 읽기,쓰기를 위해 파일을 작성하거나 겹쳐쓰는 모드입니다.

     

     

     

     

    ========================================================================

    드디어 책이 끝났습니다.

    2회독때는 어떻게 더 효율적으로 공부 할 수 있을지 고민 좀 해봐야겠네요.

    지금 생각나는 것은 명령어를 덜 외웠다는 것이고, axis와 level에 대한 개념이 부족하다고 느낍니다.

    2회독하기 전에 axis, level에 대한 것들 좀 공부하고 와야겠습니다.

    반응형

    ' > 파이썬 라이브러리를 활용한 데이터 분석' 카테고리의 다른 글

    13-2일차(445 ~ 475)  (0) 2019.04.05
    13-1일차(425 ~ 444)  (0) 2019.04.04
    12일차(393 ~ 424)  (0) 2019.04.03
    11일차(345 ~ 392)  (0) 2019.04.02
    10일차(305 ~ 344)  (0) 2019.04.01

    댓글

Designed by Tistory.