본문 바로가기

복수전공(소프트웨어공학)/크롤링4

네이버 금융 시가총액 크롤링 대상 시가총액 : 네이버 금융 관심종목의 실시간 주가를 가장 빠르게 확인하는 곳 finance.naver.com 결과(9/18 기준 미완성) 문제 1) F12 창에서는 내가 적용한 항목의 값이 맞게 보이는데, 초기항목의 값이 저장됨 2) 1페이지에 있는 종목만 저장됨 계획 1) 영업이익/당기순이익 대비 시가총액 계산값을 새로운 열에 저장 후 내림차순 정렬 2) 반복문 써서 맨마지막 페이지 데이터까지 모두 저장 참고 문자열에서 숫자 추출 리스트를 데이터프레임으로 1차원 리스트와 2차원 리스트를 데이터프레임으로 변환할 때 차이점 2021. 9. 18.
크롤링 모듈 import requests from bs4 import BeautifulSoup print(dir(BeautifulSoup))#모듈의 클래스 목록 출력함 변수=requests.get(): 원하는 소스코드를 가져오고 BeautifulSoup(변수.text, 'html.parser'): 태그를 확인하기 편해짐 *html.parser: html 문법 규칙에 따르는 문자열을, 해당 문법을 바탕으로 단어의 의미나 구조를 분석하는 parse를 행하는 프로그램을 일컬음. soup.find('태그') soup.find_all('태그') find(): 가장 먼저 등장하는 해당 태그 값을 가져옴 find_all(): 해당 태그를 가진 모든 값을 리스트 형식으로 가져옴 *find()로 더 크게 감싸는 html 태그로 추출.. 2021. 2. 13.
코로나 확진자 현황 크롤링 (네이버) github.com/engineercha/Python-study/blob/master/pj_covid19.py 출력화면 작년 2월에 파이썬 기초문법을 배우고 작성한 코드인데 당시에는 확진환자, 검사중, 격리해제, 사망자 였던 것이 현재는 일일확진, 재원 위중증, 신규 입원, 일일 사망 으로 바뀌었기 때문에 print문 수정이 필요하다 서울시 구별 코로나 확진자 현황 크롤링(blog.naver.com/devopia/222069192125) 코로나19 사이트 크롤링 디스코드 봇(https://blog.naver.com/seojune5383/222177121480) 크롤링을 통해 코로나19 현황 파악(blog.naver.com/jinzzasol/221845326153) 2021. 2. 13.
주식 크롤링 be-myself1994.tistory.com/9 네이버 금융 코스피200 일별시세 에서 종가 데이터 크롤링 본 포스팅은 아래 책을 공부한 내용임을 밝힙니다. 파이썬을 활용한 금융공학 레시피 저자: 김용환 출판: 한빛미디어 발매: 2018.06.01. import datetime as dt # 객체를 date 타입으로 만들어줄 모듈 from url be-myself1994.tistory.com blog.naver.com/vitality1994/221979040670 네이버 금융 코스피200 일별시세 에서 종가 데이터 크롤링 본 포스팅은 아래 책을 공부한 내용임을 밝힙니다.​아래 티스토리 블로그에 더 상세한 코드설명이 있습니... blog.naver.com blog.naver.com/jjys9047/221.. 2021. 2. 12.