2017. 10. 6. 03:14
Python/01_Pandas
Input & Output 강좌이다.
pandas는 정말 다양한 방법으로 엑셀은 물론, html, json파일,sql파일, csv형식등을 지원한다. 그렇기에 pandas가 대중적으로 많이 쓰이는 것이겠지.
금번엔 어떻게 읽고 쓰는지에 대해 간략히 설명해 보도록 하겠다.
들어가기 전에...
아래와 같이 일단 타이핑해보자.
pd.까지 작성한뒤, shift+tab을 클릭하면 다양한 함수들을 확인할 수 있을 것이다.
위와 같이 준비한다. 또한, example 파일이 정상적으로 준비되었다면, jupyter notebook에서 read_csv('e 까지 누르고 tab버튼을 눌렀을 때, 자동완성이 될 것이다.
read_csv함수, to_csv함수
말그대로 csv 파일을 읽고 쓰는 기능을
read_excel함수, to_excel함수
excel함수를 읽고 쓰는 함수이다. 아쉽게도 read함수를 통해 공식등이나 엑셀에서 갖고 있는 기능함수등은 사용할 수 없다. (플러그인은 별도로 있긴하지만 비추) sheet_name을 통해서 sheet를 설정해줄 수도 있다.
read_html함수
가장 유용하게 쓰는 함수다. 웹에서 데이터들을 크롤링해와서 나만의 데이터를 만들때, 바로 read_html함수부터 시작이 되니까 말이다.
sqlalchemy를 를 통한 sql 활용
설명할까 말까 고민했는데, 성능을 향상시키기 위해서 데이터를 읽은뒤, 메모리에 올려두고 연산을 수행할 수 있다.
아래 스크립트를 숙지하도록 하자.
'Python > 01_Pandas' 카테고리의 다른 글
4. Join, Merge, Concatenating (0) | 2017.10.06 |
---|---|
3. Groupby 기능 (0) | 2017.10.06 |
2. Missing Data 사용방법(dropna, fillna) (0) | 2017.10.06 |
1. Data Frame 사용방법 (0) | 2017.10.06 |