블로그 이미지
shadowchaser
이곳 저곳 이것 저것

calendar

1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28

Notice

2017. 10. 6. 02:40 Python/01_Pandas

Pandas는 정말 많이 사용된다.  주식과 같은 Financial Chart를 자동화하여 만들때 기초중의 기초이다. 이에 따라서 Pandas를 활용하는 법을 연재하려한다.

오늘도 jupyter notebook을 통해서 공부해보자.


Data Frame 사용방법


위와 같이 5,4에 랜덤한 숫자로서 테이블을 채워보자

type을 보면 df['W']는 Series지만 전체 df를 선택하면 DataFrame의 속성임을 알 수 있다.

df.drop('E') 명령어를 통해 row을 삭제할 수도 있다.

보다시피 df.shape는 Data Frame의 크기를 안내하는 것이고,

loc에서 ['A']나 [0]이나 의미하는 것은 동일하다.

내가 특정내용만 원하서 보여주길 원한다면 다름과 같이 입력해주면 되겠다.


자 이번엔 좀더 복잡하게 만들어보자


numpy.random에서 random seed값을 통해 동일한 랜덤값을 추출할 수 있음을 잊지 말자.

df>0 은 0이상이 내용들에 대해 True/False로 나눠보라는 이야기다. 

조금더 복잡하게는 다음과 같이 응용될 수 있겠지.


Data Frame에서 Index 사용하기

조금더 Index를 고급지게 사용할 수 있다. excel을 쓰면 왠지 병합한 것처럼 표기할 수 있는 것인데. 일단 예제를 보자.

느낌이 왔는지 모르겠다. 일단 outside와 inside에 있는 값을 각 합쳐주고, list(zip)~구문을 통해서 G1/1~3, G2/1~3으로 만들어준 것이다.


data frame의 index.name을 통해서 각 Column 명을 변경할 수 있으며, 특정 cell의 값을 조회할 수 도 있다.




'Python > 01_Pandas' 카테고리의 다른 글

5. Input & Output (파일 읽고 쓰기)  (0) 2017.10.06
4. Join, Merge, Concatenating  (0) 2017.10.06
3. Groupby 기능  (0) 2017.10.06
2. Missing Data 사용방법(dropna, fillna)  (0) 2017.10.06
posted by shadowchaser