Language/Python

    파이썬 python 3.8.2 설치

    파이썬을 설치하기위해서 www.python.org 에서 다운로드메뉴>> python 3.8.2 를 눌러주세요 저는 이제부터 파이선 3.8버전으로 사용할예정인데 Python 3.x 대까지는 문법이 비슷하지만, 맨 앞자리가 2로 시작되는Python 2.x (Python 2.7 등) 버전같은겅우는 많이 다를수 있으니 되도록 3.x대 버전으로 깔아주세요 이때 Add python 3.8 to PATH 를 절대 빼먹지 말고 선택해주세요 그래야 나중에 파이썬을 사용하기 훨씬 쉬워집니다. 이부분을 체크해야 파이썬을 컴퓨터가 현재 cmd.exe의 어느 디렛토리에 있다 하더라도 파이썬을 실행시킬 수 있도록 해주는 것 입니다. (다시말해 환경변수 : 시스템 전체에서 쉽게 참조할수 있도록 만들어놓은 변수, 를 설정하는 작업입..

    Python을 활용한 특정 키워드를 포함하는 신문기사 웹 크롤링

    1. 개념 동일한 키워드를 가지는 신문 기사를 논조가 다른 신문사에서 가져와 사용된 단어를 워드 클라우드로 시각화하여 분석합니다. 키워드는 '사드'를 사용하고, 신문사는 동아일보, 한겨레신문 두 신문사에서 각각 150개씩 기사를 사용합니다. [결과] 키워드가 '사드'인 만큼, 워드 클라우드 모양을 미사일로 만들어 보았으며, 워드 클라우드를 살펴보면 '중국'과 '미국'을 가장 많이 사용했음을 알 수 있다. 분석환경은 파이썬 3.6.2버전을 사용하였으며 사용된 소스 코드는 다음과 같다. 1) [output_cleand.txt] 2) [output.txt] 3) [result_acticls1.txt] 4) [result_acticles.txt] 5) [words_rsult.txt] 6) [words_rsult..

    파이썬을 활용한 웹 크롤링_기본편

    웹 브라우저는 패킷을 만들고, 보내고, 돌아온 데이터를 해석해 사진, 소리, 비디오, 텍스트 등으로 표현하는 매우 유용한 애플리케이션이다. 웹 브라우저는 코드이기 때문에 코드는 떼어내서 기본 구성 요소를 나누고, 다시 만들고, 재사용하고, 원하는 어떤 것으로든 바꿀 수 있다. 웹 크롤링은 웹 브라우저로부터 사용자가 가공하고 싶은 데이터를 가져오는 과정이다. 여기에서는 가져오는 과정과 저장하는 과정, 다시 불러오는 과정 등이 포함되어 있다. urllib 라이브러리는 파이썬의 표준 라이브러리로 웹을 통해 데이터를 요청하는 함수, 쿠키를 처리하는 함수, 심지어 헤더나 유저 에이전트 같은 메타 데이터를 바꾸는 함수도 있다. urllib 라이브러리의 함수 중에서 urlopen은 네트워크를 통해 원격 객체를 읽는다..

    Python에서 Excel 사용

    1. 파이썬에서 엑셀 사용하기 파이썬에서 엑셀 데이터를 핸들링하기 위해서는 openpyxl, xlrd, xlrw 등의 외부 패키지를 설치해서 사용하며, openpyxl 패키지를 다음과 같이 설치하여 사용한다. pip3 install openpyxl 2. 엑셀 데이터 읽고 쓰기 엑셀을 다루는 가장 기초적인 부분은 데이터를 읽고 쓰는 동작이므로, 먼저 엑셀 파일을 열고 그 안의 데이터를 읽고 몇 개의 데이터를 쓰는 동작을 활용한 다. 다음 예제는 국영수 점수를 담은 엑셀 파일을 읽어 각 학생별 국영수 합계를 구 하여 다시 저장하는 예이다. 엑셀 입력 파일은 다음과 같다고 가정하고 합계 부분은 추가해야 하는 부분이다. import openpyxl # 엑셀파일 열기 wb = openpyxl.load_workbo..

    파이썬 - 함수와 모듈

    어느 정도 규모의 프로그램을 개발하다 보면 중복으로 사용되는 코드가 생기는데, 이럴 때 보통 프로그래밍 경험이 많지 않은 초보자들은 이전에 작성된 코드를 단순히 복사한 후 붙여넣어서 프로그램을 작성하곤 한다. 그러나 이런 식으로 프로그램을 작성하게 되면 점점 코드의 유지 보수가 어려워진다. 예를 들어, 어느 날 이전에 작성한 코드에 문제가 있다는 사실을 알게 되어 해당 문제를 수정한다고 하더라도 이미 해당 코드는 프로그램의 여러 곳에서 복사되어 사용되고 있을 수 있다. 이 경우 해당 코드를 하나도 빠짐없이 찾아서 제대로 수정해야 하는데, 생각만 해도 끔찍한 일이다. 이러한 문제를 막고자 중복 코드를 재사용하고 싶을 때는 단순히 코드를 복사해서 붙여넣는 식으로 프로그램을 작성하는 것이 아니라 함수(func..

    파이썬 -제어문

    어떤 조건을 보고 코드를 수행하는 것을 분기문이라고 하고, 어떤 조건 하에서 반복적으로 코드를 수행하는 것을 반복문이라고 부른다. 일반적으로 프로그램은 명령어가 기술된 순서대로 순차 수행되는데 분기문과 반복문은 순차 수행의 흐름을 변화시키기 때문에 제어문이라고도 부른다. 파이썬에는 if, for, while, range 함수 등 몇 가지 제어 흐름을 제공한다. 1. Boolean 지난 1일차에서는 파이썬의 기본 자료형인 정수형, 실수형, 문자열을 배웠는데, 이 세 가지 자료형이 파이썬에서 주로 사용되긴 하지만 Boolean(불리언)도 알게 모르게 자주 사용되는 기본 자료형이다. 다만 Boolean은 다른 자료형과 달리 True 또는 False라는 값만 바인딩할 수 있다. 다음 코드에서 a와 b라는 변수는..