主要功能

根据定义的 ID 列表下载每个画师的所有插画

下载链接

PixivSpider

如何使用

  1. 需要安装 python 3.7 环境。
  2. 解压文件包,在 pixivspider-data 目录下的 config.ini 文件中填入有效的 P 站账号以及对应密码用于正常访问 P 站。账号中的浏览限制选项不打开会影响部分插画的下载,需要下载则在网页中打开。
  3. 添加准备下载的画师 ID,以下方式选一种即可
    • 数据库文件不存在(首次使用):使用导入方式自动生成,参看导入部分,比较推荐此种方式,方便快捷。
    • 数据库文件不存在(首次使用):直接运行
      python pixivspider

      命令(命令行的工作目录设置为 pixivspider 所在目录),会自动在 pixivspider-data 目录中生成 download.db 数据库文件,随后手动添加 ID 到数据库中,见下方手动添加部分。

    • 手动添加/修改画师 ID 列表:使用 DB Browser for SQLite (下载)打开已存在的数据库文件 download.db ,切换到 creators 数据表,手动添加/修改相应的 ID,最后保存退出即可
  4. 运行之前需要确保能正常访问 P 站,因为脚本没做代理的处理,所以代理需要设为全局以便雨露均沾。至于如何改善国内这差劲的网络环境这一步不在此文说明范围。。。
  5. 在命令行中运行 python pixivspider 即可开始下载。下载成功和下载失败的插画会分别记录到数据库中的 illust 和 download_failed 数据表中。
  6. 去 pixivspider-data/downloads 目录收取已经下载的插画。

导入

主要是用来转移原有的数据,也可用于初始化画师 ID 列表。

  1. 在 pixivspider 文件夹所在目录下提供一个存有画师 ID 的文本文件 PixivIdList.txt,格式为每行一个 ID,运行
    python pixivspider --import

    命令进行导入。因为 ID 不能与已有的重复,所以在导入前要确认数据库中是否存在与 PixivIdList.txt 文件中相同的 ID,以免导入失败。

其他

  1. 下一次运行时会自行下载所有失败的插画,当成功下载后会自动从失败记录中移除。
  2. 程序使用数据库中的记录判断插画是否已经下载,因此可以随意处理 downloads 目录中已下载的插画。下次下载时仍会跳过这些文件。
  3. 向不知道是否存在的读者们求 star (๑•́ ₃ •̀๑)