본문 바로가기

놀기/Python3

map function 안에서 문자열 strip 및 replace 하기 file을 읽어 tuple 형식으로 만들려고 하는데 문자열에 따옴표(")도 있고 공란도 있고 개행 문자도 있고 할 때 한 번에 바꾸는 방법은??? Source Code #!/usr/bin/env python2 # -*- coding: UTF-8 -*- #kate: syntax Python ; def main(): with open('go.list') as f: mylist = [tuple(map(lambda str:str.replace('\"', '').strip(), i.split(','))) for i in f] print mylist if __name__ == "__main__": main() 간략히 설명하면 1. 파일(go.list)을 읽고(f) 2. 한 행 씩 읽어(i) 3. 문자열(str)을 .. 2021. 7. 26.
Beautiful Soup으로 오늘의 판(네이트) 게시물 목록 긁어오기 Beautiful Soup을 사용하여 네이트의 오늘의 판의 게시물 목록을 긁어오기를 해보자. https://pann.nate.com/today/view/20210718 관심 있는 부분은 div tag의 class가 bridge_talk 부분이다. 이에 해당하는 부분이 '오늘의 톡'과 '오늘의 엔터'인데 그냥 다 긁어 오자. 나눌 필요가 있으신 부분 알아서 ㅎ 각 게시물의 링크와 제목은 아래와 같다. a tag이며 href 형식이 "/talk/"로 시작하며 뒷부분은 숫자로 되어 있다. 그럼 시작하자. 1) 아래와 같이 '오늘의 판' 주소를 request하여 결과를 받는다. import re import requests from bs4 import BeautifulSoup url = 'https://pann.. 2021. 7. 19.
Beautiful Soup 설치 및 기본 사용법 (Ubuntu 20.04 기준) Beautiful Soup은 HTML과 XML로부터 데이터를 추출하기 위한 파이썬 라이브러리이다. 쉽게 말해 웹페이지의 HTML (또는 XML) 수준에서 필요로 하는 데이터를 뽑아내는 도구이다. 개발자 모드(F12)를 열어 찾을 필요도 없고 무식하게 소스보기를 해서 찾을 필요도 없다. 물론, 페이지의 기본적은 구조는 알아야 하니 처음에는 F12의 도움을 받아야 한다. 이런 것을 사용할 때 먼저 확인해야 하는 것은 버전 정보다. 일단, "Beautiful Soup 3"은 더 이상 지원하지 않은 것 같으니 거르고 문서에 맞는 "4.9.3"버전을 사용한다. (또는 해당 시점은 마지막 버전...) Python 버전은 2.7과 3.8 둘 다 사용 가능하다고 하니 땡큐. 1. 설치하기 "python -V" 명령어를.. 2021. 7. 19.