skinOptions.hljs
[Python] 웹 자동화 기초 - 엘레먼트(클릭, 텍스트, 프레임 이동)
·
python/자동화
엘레먼트에 관하여 우리는 웹브라우저에서 로그인도 하고 버튼도 클릭하고 검색창에 텍스트를 입력하기도 한다. 이렇게 브라우저 상에서 보이는 버튼, 검색창, 사진, 테이블, 동영상 등등 이 모든 것들을 엘레먼트(element, 요소) 라고 부른다. 셀레니움은 우리가 브라우저에서 특정 요소를 클릭하고 텍스트를 입력하고 사진등을 받아오고 텍스트를 가져오는 등등 어떠한 위치에 있는 무언가를 부를 때 엘레먼트라는 개념으로 접근한다. 다양한 방법으로 엘레먼트로 접근할 수 있는데 대부분 xpath 를 사용한다. 엘레먼트 접근하는 방법 driver.find_element_by_xpath('/html/body/div[2]/div[2]/div[1]/div/div[3]/form/fieldset/button/span[2]') #..
[Python] 웹 자동화 기초 - 브라우저 열기, 닫기, 탭 이동
·
python/자동화
셀레니움 소개 셀레니움은 파이어폭스, 인터넷 익스플로어, 크롬등과 같은 브라우저를 컨트롤 할 수 있게 해줍니다. 현재 파이썬 3.5 이상부터 지원되며 3.6 이상 버전 부터 pip 로 표준 라이브러리로 사용할 수 있습니다. 설치 – install pip install selenium 드라이버 – driver Chrome https://sites.google.com/a/chromium.org/chromedriver/downloads Edge https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/ Firefox https://github.com/mozilla/geckodriver/releases Safari https://webkit.or..
[NLP] 한국어 전처리 기법 모음
·
공부정리/NLP
https://colab.research.google.com/drive/1FfhWsP9izQcuVl06P30r5cCxELA1ciVE?usp=sharing 영어 전처리는 자연어처리 책에 많이 나오는 편입니다. 하지만 한글은 찾아보기가 어려운데요. 문장 분리, 띄어쓰기, 맞춤법, 외래어, 형태소분석, 스테밍 등 유용한 기법들이 정리되어 있습니다. 필요할 때마다 참고하기 좋을 듯 합니다.
[NLP] 노가다 없는 텍스트 분석을 위한 한국어 NLP
·
공부정리/NLP
reference http://aidev.co.kr/nlp/4728 자연어처리 - 노가다 없는 텍스트 분석을 위한 한국어 NLP https://www.slideshare.net/kimhyunjoonglovit/pycon2017-koreannlp 이전에 소개한 '한국어 채팅 데이터로 머신러닝하기'에서 사용된 cohesion tokenizer(결합 토크나이저)에 대해 자세히 설명한 슬라이드입니다. 토크 aidev.co.kr github https://github.com/lovit/soynlp
[Python] 네이버 뉴스 기사 웹 크롤링 - 매크로
·
python/자동화
해당 사이트를 참고하여 게시글을 작성하였습니다. 1단계. 원하는 웹 페이지의 html문서를 싹 긁어온다. 2단계. 긁어온 html 문서를 파싱(Parsing)한다. 3단계. 파싱한 html 문서에서 원하는 것을 골라서 사용한다. https://sillon-coding.tistory.com/301 [Python] 뉴스의 제목, 날짜, 본문 데이터 가져오기 - 1회성 (매크로아님) target_url 변수에 해당 링크를 입력하면 됩니다. from urllib.request import urlopen from bs4 import BeautifulSoup news_info = {"title": "", "content": "", "data": "" } def news_content_crawl(target_ur....
[Python] 뉴스의 제목, 날짜, 본문 데이터 가져오기 - 1회성 (매크로아님)
·
python/자동화
target_url 변수에 해당 링크를 입력하면 됩니다. from urllib.request import urlopen from bs4 import BeautifulSoup news_info = {"title": "", "content": "", "data": "" } def news_content_crawl(target_url): html = urlopen(target_url) bsObject = BeautifulSoup(html, "html.parser") title = bsObject.find("div", {"class":"media_end_head_title"}).get_text() content = bsObject.find("div", {"class":"go_trans _article_conte..
[Python] 웹 자동화 (2) - 웹 열고 HTML 태그를 통해 이동하기
·
python/자동화
이동하고자 하는 버튼의 HTML 태그를 찾아줍니다. 저는 로그인 버튼을 눌러보도록 하겠습니다. 개발자 도구에서 이 버튼을 누르고 태그를 찾아보면 좀 더 수월합니다. id 태그를 입력하는 것이 조금 더 정확합니다. - find_element 사용법 각 element에 따라 method를 따로 사용하는 것 보다 깔끔하게 정리하기 위해 By를 사용해 봅시다. driver.find_element(By., '')으로 사용합니다. 여러 element를 찾을 경우 find_elements로 할 수 있습니다. 사용은 아래와 같이 합니다. from selenium.webdriver.common.by import By driver.find_element(By.XPATH, '//button[text()="Some text"..
[Python] 웹 자동화 (1) - 파이썬으로 웹 열기
·
python/자동화
해당 파일이 있는 디렉토리에 크롬 드라이버가 있어야합니다. from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.webdriver.common.action_chains import ActionChains import time """ 크롬을 사용하여 창을 연다""" driver = webdriver.Chrome() # 크롬 웹 드라이버 연동 url = 'http://google.com' driver.get(url) driver.maximize_window() # 열고나서 창을 크게 만들어줌 (사실상 필요 X) action = ActionChains(driver)
[Python] 웹 자동화를 위한 준비 - Chrome Driver 다운로드
·
python/자동화
1. 크롬드라이버 다운로드 사이트 접속 https://chromedriver.chromium.org/downloads ​ 2. 본인 크롬 버전에 맞는 드라이버를 선택 ​ * 본인 크롬 버전 보는법 크롬 접속 > 더보기 > 도움말 > Chrome 정보(G) ​ 버전 확인 (79.0~) ​ 3. 이후 본인 OS에 따라 zip 다운로드 ​ ​ 4. 다운 후, 해당 파일(exe)을 python을 돌릴 directory 안에 업로드 이미지, 내용 출처: https://countrymouse.tistory.com/entry/ChromeDriver
[Android] 파이어 베이스 연동 안될 때 해결 방법 - 안드로이드 스튜디오
·
App & Web/Android
firebase 연결 오류가 있을 경우 다음과 같은 해결방법이 있습니다. GPS가 켜져있는 경우 gps를 꺼주어야합니다. 애뮬레이터 자체에서 인터넷 연결이 안되는 경우 애뮬레이터 삭제 후 재설치 firebase 연동 문제 상단에서 파이어베이스를 누릅니다. cloud storage for firebase 버튼 클릭 두가지 해당사항이 모두 체크가 되어있어야합니다. 체크가 되어있으면 다음과 같은 로그가 뜨는 것을 확인할 수 있습니다. MainActivity에서 이미지를 가져와서 확인버튼을 누르면 업로드 됩니다. (조금 기다려야함) ** 소켓 구현부분을 soketFun() 함수로 따로 생성하였습니다. 이미지 업로드에 실패하면 소켓함수가 실행되지 않습니다. 이미지 업로드 여부에 관계없이 소켓함수를 실행시키고자하면..
[Python] 파이썬 자동화 시작하기
·
python/자동화
https://nadocoding.tistory.com/15 [나도코딩] 파이썬 활용편4 업무자동화 - 소개 이번에 준비한 주제는 '업무 자동화' 입니다. '업무 자동화'라고 해서 꼭 업무에만 사용되는 것은 절대 아니구요 ㅋㅋ 컴퓨터를 사용해서 하는 일이라면, 룰만 명확하다면 얼마든 nadocoding.tistory.com https://www.youtube.com/watch?v=exgO1LFl9x8 나도 코딩님의 영상과 게시글 위주로 작성할 예정입니다.
(파이썬 기본문법) 파일 입출력
·
python/기초
print 기능 >>> print("life" "is" "too short") lifeistoo short >>> print("life"+"is"+"too short") #큰따옴표로 둘러싸인 문자열은 +연산과 동일 lifeistoo short >>> print("life","is","too short") #문자열 띄어쓰기는 콤마로 한다 life is too short >>> for i in range(10): print(i,end=',') #개행없이 end에다가 끝문자를 지정 할 수 있다 0,1,2,3,4,5,6,7,8,9, 파일 열기 -> 파일 읽기/쓰기 -> 파일 닫기 #write.py file = open('text.txt','w') file.write('hello') file.close() 실행결..