본문 바로가기

2

[파이썬] 위키를 엑셀로, 'beautiful Soup'이용해 웹 크롤링 하는 방법 오늘은 웹 크롤링을 해보려 합니다. 위키백과에서 세계 각 나라별 수도 정보에 대해 가져와 엑셀에 정렬해보겠습니다. 각자 에디터를 열어 '.py'로 끝나는 파이썬 파일을 만들어 주세요. 1. 홈페이지 열기 우선 홈페이지부터 열어야겠죠? 상단에 urlopen 라이브러리를 넣어준 후, 다음과 같이 코드를 넣어주면 url을 에디터에 불러올 수 있습니다. from urllib.request import urlopen #url 불러오기 html = urlopen("https://ko.wikipedia.org/wiki/%EB%82%98%EB%9D%BC_%EC%9D%B4%EB%A6%84%EC%88%9C_%EC%88%98%EB%8F%84_%EB%AA%A9%EB%A1%9D") 2. BeautifulSoup html에서 데.. 2020. 5. 8.
웹 기초) HTML,CSS,Javascripts개념과 차이 하,,, 이 글이랑 html기초랑 동시에 쓰고 있었는데 살짝 네트워크가 불안정해지더니 싹 다 날아갔어요... 그것도 벌서 두 번째!^^ 네이버는 이럴 때 자동 저장되던데 티스토리는 그대로 다 날아가네요?^^ 아 뭐냐!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 한 줄 적을 때마다 저장할 거야 ㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠ 티스토리 이사 갈 거야ㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠ 후, 그래도 오늘 끝내기로 했으니 다시 해보려 합니다... 자, 네, 오늘은 웹에 대해 아주 맛보기만 해보려 합니다. 웹을 하는데 필수적으로 들어가는 언어가 세 가지가 있는데요. HTML, CSS, Javascripts가 있습니다. 오늘은 이 세 가지에 대한 간단한 개념과 차이를 알아보겠습니다. 1. HT.. 2020. 4. 11.
728x90