전체 글
-
Chapter.02-3~02-4 기초적인 통계 계산하기, 그래프 그리기Do it! 판다스 입문 2022. 6. 12. 14:57
지금까지는 데이터를 추출하는 방법에 대해 알아보았습니다. 이번에는 추출한 데이터를 가지고 몇 가지 기초적인 통계 계산을 해보겠습니다. 다음은 갭마인더 데이터 집합에서 0~9번째 데이터를 추출하여 출력한 것입니다. print(df.head(n=10)) country continent year lifeExp pop gdpPercap 0 Afghanistan Asia 1952 28.801 8425333 779.445314 1 Afghanistan Asia 1957 30.332 9240934 820.853030 2 Afghanistan Asia 1965 31.997 10267083 853.100710 3 Afghanistan Asia 1967 34.020 11537966 836.197138 4 Afghanist..
-
Chapter.02-2 데이터 추출하기Do it! 판다스 입문 2022. 6. 12. 14:09
지금까지 데이터프레임의 크기와 자료형을 살펴보는 방법에 대해 알아보았습니다. 앞에서 head 메서드를 이용해 데이터프레임에서 가장 앞에 있는 5개의 데이터를 추출하여 출력했던 것을 기억하나요? 이번에는 데이터프레임에서 데이터를 열 단위로 추출하는 방법과 행 단위로 추출하는 방법을 알아보겠습니다. 먼저 열 단위로 데이터를 추출하는 방법을 알아보겠습니다. 열 단위 데이터 추출하기 데이터프레임에서 데이터를 열 단위로 추출하려면 대괄호와 열 이름을 사용해야 합니다. 이때 열 이름은 꼭 작은따옴표를 사용해서 지정해야 하고 추출한 열은 변수에 저장해서 사용할 수도 있습니다. 이때 1개의 열만 추출하면 시리즈를 얻을 수 있고 2개 이상의 열을 추출하면 데이터프레임을 얻을 수 있습니다. 열 단위로 데이터 추출하기 1...
-
Chapter 02-1 데이터 집합 불러오기Do it! 판다스 입문 2022. 6. 11. 23:17
데이터 분석의 시작은 데이터 불러오기부터 데이터 분석을 위해 가장 먼저 해야 할 일은 무엇일까요? 바로 테이터를 불러오는 것입니다. 이때 불러오는 데이터를 '데이터 집합'이라고 합니다. 그러면 데이터 집합을 불러오는 방법과 데이터를 간단히 살펴보는 방법에 대해 알아보겠습니다. 우리가 처음 불러올 데이터 집합은 갭마인더(Gapminder)입니다. '02_practice'를 주피터 노트북으로 열어 실습을 시작해 볼까요? 갭마인더 데이터 집합 불러오기 1. 판다스의 여러 기능을 사용하려면 판다스 라이브러리를 불러와야 합니다. 다음과 같이 입력하여 판다스 라이브러리를 불러 오세요. import pandas 2.갭마인더 데이터 집합을 불러오려면 read_csv 메서드를 사용해야 합니다. read_csv 메서드는 ..
-
주피터 노트북 마크다운(Markdown) 사용하기Anaconda & Jupyter 2022. 6. 11. 18:05
마크 다운(Markdown)이란 일반 텍스트 기반의 경량 마크업 언어로 문법이 매우 쉽고 간단하여 주피터 노트북에서 유용하게 사용됩니다. 마크다운 실행하기 위와 같이 툴바에서 Code -> Markdown을 눌러서 실행하거나 명령모드(Esc) 상태에서 단축키 m을 눌러 실행할 수 있습니다. 제목 글자 크기 조절하기 제목 글자 앞에 #의 갯수에 따라 글자의 크기가 조절됩니다. 최대 6개까지 사용할 수 있으며 #의 갯수가 늘어날수록 글자의 크기는 줄어듭니다. 글자 굵게 또는 기울이기 굵은 글씨 : **TEXT** 또는 __TEXT__ 기울임 글씨 : *TEXT* 또는 _TEXT_ 줄 바꾸기 마크다운에서는 띄어쓰기2번 + Enter로 쉽게 줄을 바꿀 수 있습니다. 또는 을 이용해 줄을 바꿀 수 있습니다. 인용..
-
윈도우에 아나콘다(Anaconda) 설치 및 주피터 실행하기Anaconda & Jupyter 2022. 6. 10. 19:38
만약 컴퓨터에 파이썬이 설치되어 있다면 파이썬을 제거하고 아나콘다 설치를 진행해 주세요! 아나콘다를 설치하면 아나콘다에 포함된 데이터 분석 라이브러리와 가장 잘 호환되는 버전의 파이썬도 함께 설치되기 때문에 파이썬이 중복 설치되면 프로그램 실행 도중 오류가 발생할 수 있습니다. https://www.anaconda.com/ Anaconda | The World's Most Popular Data Science Platform Anaconda is the birthplace of Python data science. We are a movement of data scientists, data-driven enterprises, and open source communities. www.anaconda.co..
-
Chapter 07-3 강력한 정규 표현식의 세계로_2Do it! 점프 투 파이썬 2022. 6. 9. 20:23
전방 탐색 정규식에 막 입문한 사람들이 가장 어려워하는 것이 바로 전방 탐색(Lookahead Assertions)확장 구문이다. 정규식 안에 이 확장 구문을 사용하면 순식간에 암호문처럼 알아보기 어렵게 바뀌기 때문이다. 하지만 이 전방 탐색이 꼭 필요한 경우가 있으며 매우 유용한 경우도 많으니 꼭 알아 두자. 다음 예를 보자. >>> p = re.compile(".+:") >>> m = p.search("http://google.com") >>> print(m.group( )) http: 정규식 ".+:"과 일치하는 문자열로 http:를 돌려주었다. 만약 http:라는 검색 결과에서 :을 제외하고 출력하려면 어떻게 해야 할까? 위 예는 그나마 간단하지만 훨씬 복잡한 정규식이어서 그루핑은 추가로 할 수 ..
-
Chapter 07-3 강력한 정규 표현식의 세계로_1Do it! 점프 투 파이썬 2022. 6. 9. 19:40
이제 07-2에서 배우지 않은 몇몇 메타 문자의 의미를 살펴보고 그룹(Group)을 만드는 법, 전방 탐색 등 더욱 강력한 정규 표현식에 대해서 살펴보자. 메타 문자 아직 살펴보지 않은 메타 문자에 대해서 모두 살펴보자. 여기에서 다룰 메타 문자는 앞에서 살펴본 메타 문자와 성격이 조금 다르다. 앞에서 살펴본 +, *, [], {} 등의 메타문자는 매치가 진행될 때 현재 매치되고 있는 문자열의 위치가 변경된다.(보통 소비된다고 표현한다). 하지만 이와 달리 문자열을 소비시키지 않는 메타 문자도 있다. 이번에는 이런 문자열 소비가 없는 (zero-width assertions) 메타 문자에 대해 살펴 보자. | | 메타 문자는 or과 동일한 의미로 사용된다. A|B라는 정규식이 있다면 A 또는 B라는 의미..
-
Chapter 07-2 정규 표현식 시작하기_3Do it! 점프 투 파이썬 2022. 6. 9. 18:55
컴파일 옵션 정규식을 컴파일할 때 다음 옵션을 사용할 수 있다. 옵션 이름 약어 설명 DOTALL S dot 문자(.)가 줄바꿈 문자를 포함하여 모든 문자와 매치한다. IGNORECASE I 대.소문자에 관계 없이 매치한다. MULTILINE M 여러 줄과 매치한다. (^, $ 메타 문자의 사용과 관계가 있는 옵션이다.) VERBOSE X verbose 모드를 사용한다. (정규식을 보기 편하게 만들 수도 있고 주석 등을 사용할 수도 있다.) 옵션을 사용할 때는 re.DOTALL처럼 전체 옵션 이름을 써도 되고 re.S처럼 약어를 써도 된다. DOTALL, S . 메타 문자는 줄바꿈 문자(\N)를 제외한 모든 문자와 매치되는 규칙이 있다. 만약 \n 문자도 포함하여 매치하고 싶다면 re.DOTALL 또는 ..