12-16 추가 업데이트)
어떤 이유에서인지 한번에 최대 40장만 출력가능합니다.
그럼 40장씩 25번하면 1,000장이 나오겠네? 가 아니라, 항상 이전에 뽑혔던 1 사진이 다음에도 똑같이 1번으로 출력되기 때문에 1,000장 출력이 의미가 없습니다. 😅
아마도 데이터 로드(흔히 더보기) 처리가 제대로 안된것 아닌가 추측하며, 가능하다면 이후 크롤링 코드를 공유 해볼 예정입니다.
bing-image-downloader란?
대량의 이미지를 손쉽게 수집할 수 있도록 도와주는 라이브러리입니다.
검색명, 데이터 타입(jpg,png 등..) 을 통해서 최대 1000개 이상의 이미지를 수집가능합니다.
https://pypi.org/project/bing-image-downloader/
bing-image-downloader
Python library to download bulk images from Bing.com
pypi.org
예제 코드
먼저 다운로드 합니다.
pip install bing-image-downloader
아래 코드를 사용하면 이미지를 수집할 수 있습니다.
'''
아래 url로 접속하시면 자세한 사용법을 볼 수 있습니다.
https://pypi.org/project/bing-image-downloader/
'''
from bing_image_downloader.downloader import download
query_string = 'muscle cars'
download(query_string, limit=3, output_dir='dataset', adult_filter_off=True, force_replace=False, timeout=60, verbose=True, filter='jpg')
주요 코드설명
query_string : 해당 검색어로 이미지를 수집합니다.
output_dir : 이미지를 저장할 폴더명을 뜻합니다.
filter : 선택한 확장자명만 수집합니다.
결과
잘 나옵니다.
눈감고도 사용할 수 있는 난이도네요. ㅎㅎ~
반응형