03_DataFrame 메소드

DataFrame Method

  • DataFrame에는 200여개 넘는 Attribute와 Method(메소드)이 존재함
  • Attribute와 Method의 간단한 차이를 말하자면 Method는 round brackets인 ()로 표시되고 ,Attribute는 round brackets 로 표시되지 않는다. 앞으로 Attribute도 메소드라 지칭한다.
  • DataFrame 관련 Pandas Docs를 보면 200여개 넘는 메소들이 나열 되어있음
  • 대표적인 메소드을 살펴 보면

    • shape: 2차원 행렬의 크기를 반환
    • T: index와 columns의 위치를 서로 교환
    • Values:Numpy형으로 변환
    • head():상위 로우를 반환
    • Tail():하위 로우를 반환
    • descibe():기술 통계량을 요약해서 보여줌
    • rank():axis에 따른 순위를 반환

Continue reading 03_DataFrame 메소드

02_Create DataFrame

Create DataFrame

  • Pandas에서는 DataBase의 테이블과 비슷한 자료구조를 DataFrame라고 함
  • DataFrame은 data, index, columns_index로 구성되어 있음
    • data는 2차원 데이터 구조로 numpy의 ndarrary나 python의 dict, list 형태로 숫자나 문자로 구성되어 있음
    • columns은 DataBase의 컬럼 처럼 자료 구조 형이 있음. 컬럼에는 문자나 숫자 같은 유형을 가질 수 있음
    • index는 생략할때가 많고 생략되어진다면 기본적으로 np.arange(n)로 표현됨(즉, 0에서 row 데이터수 -1 까지의 값을 가짐)
  • DataFrame을 만드는 방법에는 DataFrame(), read_csv(), read_excel() 등 다수의 방법이 있음.
  • index, columns이라는 명칭보다는 rows_index, columns_index라는 명칭이 좀 더 의미를 파악하는데 도움이 됨

Continue reading 02_Create DataFrame

01_Series

Series 개념

  • Series는 정수형, 문자형,NaN의 데이터를 모두 담을 수 있는 라벨이 있는 1차원 배열이다.(One-dimensional ndarray with axis labels)
  • 라벨을 Index(색인)이라 한다.
  • 즉, series는 기본적으로 data와 Index로 구성된다.

  • sereis에서 Index의 개념이 중요한데 Series docs를 보면

    • data의 길이와 Index 길이는 같아야 하고
    • 만약 Index를 생략하면 data의 길이만큼 index가 지정이 된다.
    • Index인 라벨은 유니크할 필요없지만 hashable type해야 한다(Series가 아니고 Series 안의 index속성의 의미함)
    • Index는 key와 value(label)로 구성된다.(value는 사용자가 부여하고 key는 시스템이 부여함)

Continue reading 01_Series

Pagination


© 2017. All rights reserved.

Powered by ZooFighter v0.12