일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 프로그래머스
- Python
- 컨테이너
- pip
- pandas
- Linux
- windows forms
- C++
- OpenCV
- mysql
- ubuntu
- Selenium
- label
- 핑거스타일
- C#
- Visual Studio
- SSH
- pytorch
- 기타 연주
- C
- VS Code
- 채보
- paramiko
- YOLO
- JSON
- error
- Numpy
- LIST
- 오류
- Docker
- Today
- Total
기계는 거짓말하지 않는다
Python Selenium, BeautifulSoup 본문
Selenium
다양한 브라우저, 플랫폼에서 웹 애플리케이션을 검증하는 데 사용되는 오픈 소스 자동화 테스트 프레임워크이다.
Java, C#, Python 등과 같은 여러 프로그래밍 언어를 사용하여 Selenium 테스트 스크립트를 만들 수 있다.
Selenium Software는 단일 도구가 아니라 소프트웨어 제품군이다.
Install: pip install selenium
Import: import selenium
Webdriver: from selenium import webdriver
- 장점
1. Python, Node.js, Java 이외의 다른 프로그래밍 언어에서도 실행 가능
2. 크롬, 인터넷 익스플로러, 파이어폭스와 같은 주요 웹 브라우저 제어 가능
3. AJAX, PJAX 요청 쉽게 처리 가능
4. JavaScript 데이터 액세스
- 단점
1. 라이브러리 무거움
2. 느림
BeautifulSoup
HTML, XML 및 기타 마크업 언어에서 데이터를 가져오기 위한 Python 라이브러리이다.
Install: pip install bs4
Import: from bs4 import BeautifulSoup
- 장점
1. 사용하기 쉽고 친화적, 복잡하지 않고 HTML 문서에서 데이터를 선택하는 것이 용이
2. 멀티태스킹에 사용 가능. 단 멀티스레드 프로그래밍에 능숙해야 함
3. 문제가 발생할 때 도움을 주는 커뮤니티 지원
- 단점
1. 다른 라이브러리에 의존. 웹 요청을 보내기 위해 requests 모듈 또는 urllib 사용해야 함
2. Parser를 지원하지 않는다. html.parser, HTML5lib, XML Parser 및 기타 옵션 중 선택해야 함
'Python' 카테고리의 다른 글
Python Matplotlib 폰트 확인, 적용 (0) | 2021.07.23 |
---|---|
Python BeautifulSoup 사용법, 속성 (0) | 2021.07.20 |
Python Crawling (0) | 2021.07.19 |
Python OpenCV (4) 이미지 편집 (0) | 2021.07.14 |
Python OpenCV (3) 이미지 편집 (0) | 2021.07.14 |