2017年09月13日

「いらすとや」さんのWebサイトのスクレイピングで一括ダウンロード

computer_search_kensaku.png

みなさんおなじみの「いらすとや」さんですが、Pythonによる機械学習の勉強にイラストを使わせてもらいたいなーと思いました。まずは教師データが必要になるので、とりあえず画像データをスクレイピングするPythonのコードを作成しました。

コマンドと結果

コマンドの仕様としては、引数に「検索ワード」と「最大取得数」を渡すようにしました。
 > python.exe irasutoya_down.py インターネット 200

すると下記の様にひたすら画像がダウンロードされていきます。

http://4.bp.blogspot.com/-zTvzECyWEsk/VwIjHWMdszI/AAAAAAAA5e4/W_kAnVythXoHGzGO3AkgrHImS3cpvMiuQ/s800/internet_kanki_man1.png
http://4.bp.blogspot.com/-RK1r8J9kF_c/VwIjHdTzFVI/AAAAAAAA5e8/_N9Xhc0JtM0DLsHLU5eqhqxkk8lQ-aZSQ/s800/internet_kanki_man2.png
http://2.bp.blogspot.com/-llDpo-3-K7k/VwIjHt4UonI/AAAAAAAA5fA/PWpKhDKWK7IvwmC4yuyBZ8b4L4sXoZVMw/s800/internet_kanki_woman1.png
http://4.bp.blogspot.com/-IxWKND4JML8/VwIjILi7wFI/AAAAAAAA5fE/lgjzp6DwT6cVJKTZI5dOQe-AHX4hGDaYw/s800/internet_kanki_woman2.png

<<中略>>

http://2.bp.blogspot.com/-beSfKCyewTk/Udy6lPRVwhI/AAAAAAAAWI8/uNDgJL6OC3I/s800/computer_family.png
http://2.bp.blogspot.com/-KwGSRNHzsVA/UbVvOo58z5I/AAAAAAAAUsc/y2sh_GfnPQ8/s800/computer_wireless.png

フォルダにも下記のように保存されていきます。

20170916_irasutoya_0.jpg

続いて、コードになります。

続きを読む
posted by くまなべ at 08:00 | Comment(0) | TrackBack(0) | Python