pandas3 Pandas 의 연산 2023/08/16 ** Pandas 의 연산 1. 그룹화 데이터를 어떤 기준에 따라서 여러 그룹으로 나누어서 관찰하는 것 그룹화 한 후 집계, 변환, 필터링 그룹화를 할 때는 groupby 를 이용하고 변환에는 apply를 이용 groupby 는 DataFrame의 함수 집계 함수 count : 누락 값을 제외한 데이터의 개수 size : 누락 값을 포함한 데이터의 개수 mean : 평균 std : 표준편차 min : 최소 max : 최대 quatile(q=값) : 백분위 수로 값은 0.0 ~ 1.0 sum : 합 var : 분산 sem : 평균의 표준편차 describe : 데이터의 간단한 집계 first : 첫 행 last : 마지막 행 nth : n 번째 행 집계를 수행하고 난 후 DataFram.. 2023. 8. 16. Python 탐색적 시각화 1. matplotlib 1.1) 히스토그램 빈도 분석을 위해서 그리는 차트 변수가 하나인 단변수 데이터의 빈도 수를 표현 Series가 value_counts() 라는 메서드를 호출하면 빈도 수를 리턴 hist()를 호출해서 히스토그램을 그릴 수 있는데 bins 옵션이 있어서 구간의 개수를 설정하는 것이 가능 1.2) scatter(산포도, 산점도) 자료의 분포를 표시할 때 이용하는 그래프는 서로 다른 두 변수 사이의 관계를 표현 각 변수는 연속적인 값이어야 함. scatter()를 이용해서 출력 1.3) Pie 차트 전체에 대한 기여도 확인 가능 pie 함수를 이용해서 출력을 하는데 explode 옵션을 이용해서 중앙에서 떨어지는 비율을 설정할 수 있고 autopct를 이용해서 값의 비율을 출력할 수.. 2023. 8. 11. Python 데이터 분석 Pandas 2 이전글 루트 입니다! 2023.08.07 - [LG 헬로비전 DX DATA SCHOOL/Python] - 데이터 분석 Python (with numpy & pandas) 데이터 분석 Python (with numpy & pandas) 2023/08/07 **numpy 1. numpy 고성능의 과학적 계산을 수행하기 위한 패키지(선형 대수를 위한 C 또는 Fortan 패키지 - CPython 에서만 가능) 파이썬 머신러닝 스택의 기초 pypi : python 으로 만든 python, 일반 응 dxdata.tistory.com 오늘의 실습 코드! https://colab.research.google.com/drive/1iiFU9y16Yu4TmZjNqnQ7TOq9zK84JI21?usp=sharing Untit.. 2023. 8. 9. 이전 1 다음