일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- mysql
- C
- SSH
- Python
- 채보
- C#
- OpenCV
- Linux
- JSON
- pandas
- Docker
- VS Code
- 기타 연주
- windows forms
- label
- Selenium
- C++
- Visual Studio
- 프로그래머스
- 오류
- pytorch
- YOLO
- 명령어
- paramiko
- pip
- Numpy
- LIST
- ubuntu
- error
- 핑거스타일
- Today
- Total
기계는 거짓말하지 않는다
Python Selenium, BeautifulSoup 본문
Selenium
다양한 브라우저, 플랫폼에서 웹 애플리케이션을 검증하는 데 사용되는 오픈 소스 자동화 테스트 프레임워크이다.
Java, C#, Python 등과 같은 여러 프로그래밍 언어를 사용하여 Selenium 테스트 스크립트를 만들 수 있다.
Selenium Software는 단일 도구가 아니라 소프트웨어 제품군이다.
Install: pip install selenium
Import: import selenium
Webdriver: from selenium import webdriver
- 장점
1. Python, Node.js, Java 이외의 다른 프로그래밍 언어에서도 실행 가능
2. 크롬, 인터넷 익스플로러, 파이어폭스와 같은 주요 웹 브라우저 제어 가능
3. AJAX, PJAX 요청 쉽게 처리 가능
4. JavaScript 데이터 액세스
- 단점
1. 라이브러리 무거움
2. 느림
BeautifulSoup
HTML, XML 및 기타 마크업 언어에서 데이터를 가져오기 위한 Python 라이브러리이다.
Install: pip install bs4
Import: from bs4 import BeautifulSoup
- 장점
1. 사용하기 쉽고 친화적, 복잡하지 않고 HTML 문서에서 데이터를 선택하는 것이 용이
2. 멀티태스킹에 사용 가능. 단 멀티스레드 프로그래밍에 능숙해야 함
3. 문제가 발생할 때 도움을 주는 커뮤니티 지원
- 단점
1. 다른 라이브러리에 의존. 웹 요청을 보내기 위해 requests 모듈 또는 urllib 사용해야 함
2. Parser를 지원하지 않는다. html.parser, HTML5lib, XML Parser 및 기타 옵션 중 선택해야 함
'Python' 카테고리의 다른 글
Python Matplotlib 폰트 확인, 적용 (0) | 2021.07.23 |
---|---|
Python BeautifulSoup 사용법, 속성 (0) | 2021.07.20 |
Python Crawling (0) | 2021.07.19 |
Python OpenCV (4) 이미지 편집 (0) | 2021.07.14 |
Python OpenCV (3) 이미지 편집 (0) | 2021.07.14 |