팁 & 노하우

|  분야 불문! 어떤 분야든지 자신이 알고 있는 팁이나 노하우를 남겨주세요.

?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

저는 우분투와 파이썬에 대해 잘 모르기 때문에 이 글에 부족한 부분이 많을 것으로 생각됩니다.


부정확한 부분이 있으면 댓글로 말씀해주시면 감사하겠습니다.



PhantomJS가 다른 Headless browser와 비교할 때 설치 및 Webdriver API 사용법이 가장 간단하지만,


현재는 deprecated된 상태이고 실행은 되지만 크롬이나 파폭을 이용하라고 경고가 뜹니다.


또한 크롬이나 파폭에서 보이는 화면과 다르게 보이는 경우가 적지 않게 있어서 


일일이 스크린샷을 찍으며 확인을 해야 되고,


가장 큰 문제점은 자바스크립트와 관련하여 충돌이 발생하는 경우가 있습니다.



한편 Chromedriver는 윈도우에서는 chromedriver.exe만 있으면 잘 돌아가지만


현재 우분투에서 크로미움과 관련하여 여러 에러가 보고되고 있습니다.


제가 아직 이에 대한 확실한 솔루션을 제시한 글을 찾지 못해서 이 글에서는 다루지 않겠습니다.



설치를 시작하기에 앞서 시스템을 최신으로 업데이트하는 것을 권장합니다.


# sudo apt-get update -y
# sudo apt-get upgrade -y
# sudo shutdown -r now




1. PhantomJS


(1) 우선 PhantomJS에서 필요로 하는 패키지를 설치합니다.

# sudo apt-get install build-essential chrpath libssl-dev libxft-dev libfreetype6-dev libfreetype6 libfontconfig1-dev libfontconfig1 -y


(2) 현재 최신버전의 PhantomJS를 다운로드 받습니다.

# sudo wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-2.1.1-linux-x86_64.tar.bz2


(3) 압축을 해제합니다.

# sudo tar xvjf phantomjs-2.1.1-linux-x86_64.tar.bz2 -C /usr/local/share/


(4) 심링크를 생성합니다.

# sudo ln -s /usr/local/share/phantomjs-2.1.1-linux-x86_64/bin/phantomjs /usr/local/bin/


(5) 설치된 PhantomJS의 버전을 확인해봅니다.

# phantomjs --version


(6) 파이썬에서는 webdriver API를 다음과 같은 방법으로 사용할 수 있습니다.


driver = webdriver.PhantomJS('/usr/local/bin/phantomjs')





2. Geckodriver (Firefox)


셀레니움 3.0 이전 버전에서는 geckodriver를 따로 설치할 필요가 없었지만 


현재는 설치를 하지 않으면 에러를 발생합니다.



우선 파이어폭스가 설치되어 있다는 전제하에 최신버전의 geckodriver를 다운받습니다.


# wget https://github.com/mozilla/geckodriver/releases/download/v0.18.0/geckodriver-v0.18.0-linux64.tar.gz



geckodriver 파일을 어느 폴더에 압축을 풀어야 하는지에 관하여 버전별로 조금씩 차이가 있고 이에 대한 논쟁이 있는데


현재는 /usr/local/bin/에 설치하고 퍼미션을 777로 주면 작동하는 것을 확인했습니다.

(주의: /usr/bin/이나 /usr/local/bin/geckodriver/가 아닙니다.)



기본적으로는 다음과 같은 방법으로 파이썬에서 Webdriver API를 사용할 수 있습니다.


-headless 등 옵션을 사용하려면 import 해줘야 합니다. (크롬과 차이점)



from selenium.webdriver.firefox.options import Options


options = webdriver.FirefoxOptions()

options.add_argument('-headless')

driver = webdriver.Firefox(executable_path="/usr/local/bin/geckodriver", firefox_options=options)




팁 & 노하우

분야 불문! 어떤 분야든지 자신이 알고 있는 팁이나 노하우를 남겨주세요.

  1. 앞으로 ssh 사용시 한글 사용이 가능합니다.

  2. 접속 불가 사태 수습은 진행중입니다.

  3. 회원 전용 페이지가 생겼습니다.

  4. No Image 12Oct
    by 이니스프리
    2018/10/12 by 이니스프리
    Views 38 

    특정 파일을 제외한 현재 디렉토리 내의 모든 파일을 삭제하는 배치파일

  5. No Image 12Oct
    by 이니스프리
    2018/10/12 by 이니스프리
    Views 23 

    외부 IP 주소만 보여주는 사이트

  6. No Image 11Oct
    by 도토리묵
    2018/10/11 by 도토리묵
    Views 43 

    Anti ADBLOCK 소스공유

  7. No Image 11Oct
    by 슬기
    2018/10/11 by 슬기
    Views 14 

    마지막 방문일자 알려주기

  8. No Image 09Oct
    by 이니스프리
    2018/10/09 by 이니스프리
    Views 64 

    Selenium에서 Headless browser의 설치 및 실행 (Ubuntu, Python 기준)

  9. No Image 07Oct
    by 슬기
    2018/10/07 by 슬기
    Views 41 

    Free jQuery plugins 다운로드

  10. No Image 07Oct
    by 슬기
    2018/10/07 by 슬기
    Views 29 

    CSS/HTML 소스 압축 해주는 홈페이지

  11. No Image 06Oct
    by 이니스프리
    2018/10/06 by 이니스프리
    Views 84 

    그누보드에서 우측 aside(로그인) 없애고 회원가입을 봉쇄하는 방법

  12. No Image 06Oct
    by 슬기
    2018/10/06 by 슬기
    Views 43 

    일부사이트에서 막은 우클릭 해제하기 (즐겨찾기 이용)

  13. 무료 크론탭 이용가능한사이트

  14. 애드센스 광고 블럭 차단방지 소스

  15. No Image 06Oct
    by 슬기
    2018/10/06 by 슬기
    Views 23 

    소스파일 비교 홈페이지

  16. No Image 04Oct
    by 이니스프리
    2018/10/04 by 이니스프리
    Views 20 

    Autohotkey 내장변수 정리 - 62개

  17. 윈도우 작업 스케줄러에서 특정 작업이 실행 안 되는 경우 해결방법 (배치파일 등의 상대경로 관련)

  18. 유튜브 단축키를 정리해봤습니다 (+이스터 에그)

  19. No Image 25Sep
    by 이니스프리
    2018/09/25 by 이니스프리
    Views 46 

    윈도우에서 Jupyter Notebook 설치 및 기본설정

  20. 크롬 69 업데이트 전후로 자주가는 페이지가 안나오는 경우

  21. 구글 드라이브 API 사용시 파일 소유자 변경

  22. GitHub에서 학생계정 얻고 Private Repo 사용하기

  23. 빠르고 간단한 인터넷 속도 측정기

Board Pagination Prev 1 2 3 4 5 6 7 8 9 Next
/ 9
서버에 요청 중입니다. 잠시만 기다려 주십시오...