본문 바로가기
카테고리 없음

12/13 파이썬을 사용해 손쉽게 이미지 수집, 크롤링 하기 - Bing-image-downloader 라이브러리

by newbeverse 2023. 12. 13.

12-16 추가 업데이트)

어떤 이유에서인지 한번에 최대 40장만 출력가능합니다.

그럼 40장씩 25번하면 1,000장이 나오겠네? 가 아니라, 항상 이전에 뽑혔던 1 사진이 다음에도 똑같이 1번으로 출력되기 때문에 1,000장 출력이 의미가 없습니다. 😅 

아마도 데이터 로드(흔히 더보기) 처리가 제대로 안된것 아닌가 추측하며, 가능하다면 이후 크롤링 코드를 공유 해볼 예정입니다. 

 

bing-image-downloader란?

대량의 이미지를 손쉽게 수집할 수 있도록 도와주는 라이브러리입니다.

검색명, 데이터 타입(jpg,png 등..) 을 통해서 최대 1000개 이상의 이미지를 수집가능합니다.

https://pypi.org/project/bing-image-downloader/

 

bing-image-downloader

Python library to download bulk images from Bing.com

pypi.org

 

예제 코드

먼저 다운로드 합니다.

pip install bing-image-downloader

 

아래 코드를 사용하면 이미지를 수집할 수 있습니다.

'''
아래 url로 접속하시면 자세한 사용법을 볼 수 있습니다.
https://pypi.org/project/bing-image-downloader/
'''

from bing_image_downloader.downloader import download

query_string = 'muscle cars'

download(query_string, limit=3,  output_dir='dataset', adult_filter_off=True, force_replace=False, timeout=60, verbose=True, filter='jpg')

 

주요 코드설명

query_string : 해당 검색어로 이미지를 수집합니다.

output_dir : 이미지를 저장할  폴더명을 뜻합니다.

filter : 선택한 확장자명만 수집합니다.

 

결과

잘 나옵니다.

눈감고도 사용할 수 있는 난이도네요. ㅎㅎ~ 

 

 

반응형