티스토리 뷰

[HTML] 추출과 정규식을 사용하여 웹페이지의 이미지만 추출하는 방법

안녕하세요! 오늘은 HTML 추출을 소개합니다!!


HTML 추출과 정규식을 사용하여 웹페이지의 이미지만 추출하는 방법을 알아보겠습니다. 
 
우선 저는 두개의 function을 만들었습니다. 

- getTagList라는 function은 정규식을 이용하여 필요한 값을 추출하는 기능을 합니다. 
- getRemoteContent라는 function은 URL주소의 소스를 가져올 수 있는 기능을 합니다. 

이렇게 두 function을 통해 URL주소의 소스를 가져온 후 정규식을 이용하여 img태그의 요소(Element)를 추출하고 배열에 담아 리턴하는 형태로 진행하였습니다. 

원본링크 : http://vucket.com/topic/view/68
[ ▼ 참고 Source ]





Recent Comments