저번 시간에는 웹페이지에서 헤드라인 기사을 가져와서 텍스트만 나오게 하는 방법을 배워봤습니다.
복습 한 번 하고 진도 나가볼까요?^^
네이버 증권 사이트로 가보겠습니다. 그냥 맨 위에 있는 "부산주공"을 클릭해 봤습니다. (종목 추천 아닙니다^^;;)
자, 그런데 진도를 더 나가기 전에 하나 짚어보겠습니다.
여기서 requests, get, text, BeautifulSoup, select, for 같은 경우에는 변수가 아니라 명령어입니다. 그러니까 이런 것은 연산자와 같은 겁니다. 더하기, 빼기, 나누기, 곱셈 같은 연산자. 이런 기호를 잘못 쓰면 당연히 계산이 안 되겠죠?
그런데 나머지들, 그러니까 response, html, soup, title 같은 것들은 다 변수입니다. 변수라고 하면 한글로 써도 말이 된다고 했죠? 그래서 제가 다 순서대로 철수, 길동, 영희, 순이 로 바꿔보겠습니다. 그래도 제대로 결과값이 나오는지 보시겠습니까?
명령어 갖다 붙여 봅니다.
기똥차게 같은 결과 값이 나옵니다.
변수들을 우리말로 바꿔보니, 웹크롤링의 핵심이 뭔지, 즉 절대 틀려서는 안 되는 명령어가 뭔지 한 눈에 보이지 않나요?
근데, 이건 조심해야 합니다.
제가
영희 = BeautifulSoup(길동, 'html.parser')
여기를
영희 = BeautifulSoup(길동, '길동.parser')
이렇게 고쳤습니다. 즉, html.parser 부분은 변수가 아니라 명령어입니다. 일단 외웁시다. 너무 따지고 들어도 진도가 더딥니다!
무튼 다시 부산주공으로 가보겠습니다. 사이트 주소입니다.
파이썬 창에 이렇게 입력합니다.
그런데 신기하네요. 결과값이 오류는 없고 (명령어에 문제가 없다는 뜻입니다), None이 나옵니다.
이상하네요. 다음 시간에 다움 증권에 접속해서 한번 더 시도를 해보겠습니다.
명령어에는 오류가 없으니 다들 한번 연습해 보시기 바라겠습니다.
'파이썬 배우기' 카테고리의 다른 글
파이썬으로 엑셀 다루기 1편 (0) | 2022.06.28 |
---|---|
파이썬으로 웹크롤링 해 보기!!! 5편 (ft. 네이버 증권 정보 가져오기) (0) | 2022.05.29 |
파이썬으로 웹크롤링 해 보기!!! 3편 (0) | 2022.05.23 |
파이썬으로 웹크롤링 해 보기!!! 2편 (ft. 다움 브런치 기사 가져오기) (0) | 2022.05.22 |
파이썬으로 웹크롤링 해 보기!!! (ft. pip 업그레이드? python -m pip install --upgrade pip? 조치방법) (0) | 2022.05.22 |
댓글