03_DataFrame 메소드

DataFrame Method

  • DataFrame에는 200여개 넘는 Attribute와 Method(메소드)이 존재함
  • Attribute와 Method의 간단한 차이를 말하자면 Method는 round brackets인 ()로 표시되고 ,Attribute는 round brackets 로 표시되지 않는다. 앞으로 Attribute도 메소드라 지칭한다.
  • DataFrame 관련 Pandas Docs를 보면 200여개 넘는 메소들이 나열 되어있음
  • 대표적인 메소드을 살펴 보면

    • shape: 2차원 행렬의 크기를 반환
    • T: index와 columns의 위치를 서로 교환
    • Values:Numpy형으로 변환
    • head():상위 로우를 반환
    • Tail():하위 로우를 반환
    • descibe():기술 통계량을 요약해서 보여줌
    • rank():axis에 따른 순위를 반환
In [1]:
import pandas as pd
import numpy as np
#data  = np.arange(32).reshape((8, 4))
data = np.random.randn(32).reshape((8, 4))
columns = ['Arizona','Boston', 'Chicago','Detroit']
df = pd.DataFrame(data = data, columns = columns)
df
Out[1]:
ArizonaBostonChicagoDetroit
0-2.494833-1.397416-2.573239-1.441484
10.475692-0.9482311.4023440.854873
20.8693240.5922190.076431-0.487947
30.108055-0.967561-0.295529-0.112509
4-0.749410-0.780110-0.209262-0.116538
5-0.9477830.1486261.3731581.640924
6-0.239441-1.8902170.6826071.641995
7-0.488624-0.1319041.684033-0.920702
In [2]:
#2차원 행렬의 크기를 반환
df.shape
Out[2]:
(8, 4)
In [3]:
#컬럼과 인덱스의 위치가 교환됨
df.T
Out[3]:
01234567
Arizona-2.4948330.4756920.8693240.108055-0.749410-0.947783-0.239441-0.488624
Boston-1.397416-0.9482310.592219-0.967561-0.7801100.148626-1.890217-0.131904
Chicago-2.5732391.4023440.076431-0.295529-0.2092621.3731580.6826071.684033
Detroit-1.4414840.854873-0.487947-0.112509-0.1165381.6409241.641995-0.920702
In [4]:
#numpy 형 array로 반환
df.values
Out[4]:
array([[-2.49483318, -1.39741573, -2.57323916, -1.44148414],
       [ 0.47569211, -0.94823096,  1.40234424,  0.85487322],
       [ 0.86932388,  0.59221938,  0.07643134, -0.48794711],
       [ 0.10805456, -0.96756072, -0.29552902, -0.11250886],
       [-0.74941002, -0.78011002, -0.20926155, -0.11653832],
       [-0.94778329,  0.14862561,  1.37315768,  1.64092446],
       [-0.23944107, -1.89021668,  0.68260669,  1.64199494],
       [-0.48862351, -0.13190406,  1.68403309, -0.92070157]])
In [5]:
#상위 3 줄 반환
df.head(3)
Out[5]:
ArizonaBostonChicagoDetroit
0-2.494833-1.397416-2.573239-1.441484
10.475692-0.9482311.4023440.854873
20.8693240.5922190.076431-0.487947
In [6]:
#하위 3줄을 반환
df.tail(3)
Out[6]:
ArizonaBostonChicagoDetroit
5-0.9477830.1486261.3731581.640924
6-0.239441-1.8902170.6826071.641995
7-0.488624-0.1319041.684033-0.920702
In [7]:
#요약 통계량을 보여줌
df.describe()
Out[7]:
ArizonaBostonChicagoDetroit
count8.0000008.0000008.0000008.000000
mean-0.433378-0.6718240.2675680.132327
std1.0331190.8236681.3804681.144515
min-2.494833-1.890217-2.573239-1.441484
25%-0.799003-1.075024-0.230828-0.596136
50%-0.364032-0.8641700.379519-0.114524
75%0.199964-0.0617721.3804541.051386
max0.8693240.5922191.6840331.641995
In [8]:
#세로 축으로 순위를 반환
df.rank()
Out[8]:
ArizonaBostonChicagoDetroit
01.02.01.01.0
17.04.07.06.0
28.08.04.03.0
36.03.02.05.0
43.05.03.04.0
52.07.06.07.0
65.01.05.08.0
74.06.08.02.0
In [9]:
#가로 축으로 순위를 반한
df.rank(axis= 1)
Out[9]:
ArizonaBostonChicagoDetroit
02.04.01.03.0
12.01.04.03.0
24.03.02.01.0
34.01.02.03.0
42.01.03.04.0
51.02.03.04.0
62.01.03.04.0
72.03.04.01.0


© 2017. All rights reserved.

Powered by ZooFighter v0.12