非凡首页|软件资讯|最新更新|下载排行|软件分类|软件专题
您当前位置: 下载首页网络软件下载工具笔趣阁小说爬取工具【附源码】

笔趣阁小说爬取工具【附源码】 v2.28 下载工具

  • 软件等级:4 stars.
  • 软件大小:24.85MB
  • 支持语言:简体中文
  • 授权方式:免费版
  • 软件分类:网络软件/下载工具
  • 官网链接:
  • 更新时间:2025-05-12 21:21:03
  • 运行环境:WinXp,Win2003,WinVista,Win 7,Win 8,Win 10,x64
  • 厂商:
关 键 字:
软件介绍 软件截图 软件专题 软件问答 相关文章 相关软件 下载地址

笔趣阁小说爬取工具针对笔趣阁网站开发,由论坛用户原创制作并分享,基于Python编写,能够帮助喜欢阅读小说的用户们将自己喜欢的文章下载到电脑上,让阅读进行得更加方便,软件免费实用,直接爬取网站下载小说资源,让用户轻松获取想看的小说,软件附源码。

软件使用

程序运行方法:解压,在本文件夹中找到并打开dist文件夹,有一个“笔趣阁小说下载.exe”,双击运行

1、前往http://www.xbiquge.la/,找到要保存的小说,复制那个小说的目录页链接

2、按要求输入链接地址和小说名

3、爬取开始

(因为是单线程运行,爬取速度略慢大概1-2秒一章)

4、爬取结束后,会将所有章节内容整合成一个txt文件

软件源码

import requests

import re

header = {

'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36'

}

#定义全局变量,用于保存所有获取到的小说内容

story_all = []

#获取标题及章节链接地址

def main():

url = input("请输入小说目录页地址(暂时仅支持‘http://www.xbiquge.la/’站内小说):")

book_name = input("请输入小说名称:")

print("-----爬取开始-----")

#获取目录页的HTML文本

text = requests.get(url,header).content.decode('utf-8')

#获取每个章节的章节名

title = re.findall(r'

  • .*?

    (.*?)',text,re.DOTALL)


#获取每个章节的链接地址

loca = re.findall(r"

  • .*?='(.*?)' >",text,re.DOTALL)


#因为title和loca的长度相同,所以以索引的方式遍历,方便取值

for i in range(len(title)):

content(title[i],f'http://www.xbiquge.la{loca[i]}')

#小说爬取完毕,开始保存

print("@"*500)

with open(r'%s.txt'%book_name, 'w',encoding='utf-8')as file:

#遍历每一项,按顺序保存章节名和章节内容

for story in story_all:

file.write(story['title']+'⁄n')

print(story['title'])

file.write(story['story'])

#解析章节内容并保存

def content(title,url):

#获取章节页的HTML文本

text = requests.get(url,header).content.decode('utf-8')

#因为之前写过直接爬取所有内容的,爬取出来的文本都带有⁄r不好处理

#所以就一句一句的获取了

story_content = re.findall(r' (.*?)<br',text,re.DOTALL)

#因为章节名中有“”空格,没办法作为文件名,所以把空格去掉

title = re.sub(' ','-',title)

#有时候不知道为什么小说内容会爬取到一个空数组,所以这里添加了一个检测程序

#如果爬取到的为空,就重新爬取,直到获取到为止

if story_content==[]:

content(title,url)

return 0

story=""

#前面提到,因为我是一句一句爬取的,所以这里做一下拼接,顺便去空格

for story_contents in story_content:

story = story+story_contents.strip()+'⁄n'

#将章节名称和章节内容保存为一个字典

this_story = {

"title":title,

"story":story

}

print(this_story['title'])

#将字典添加到开头定义的全局变量中

story_all.append(this_story)

if __name__ == "__main__":

main()

喜欢小编为您带来的笔趣阁小说爬取工具【附源码】吗?希望可以帮到您~更多软件下载尽在非凡软件站。

软件截图

查看安装过程

网站下载工具

网站下载工具 网站下载工具不仅仅能够离线浏览某个网页,还可以从Interne 的任何地方抓回你想要的任何文件。当你需要建站,需要保存某个喜欢的网页内容时,网站下载工具就能将你指定的网站内容下载下来。

软件资讯

更多>
  • 小黑盒时长不显示怎么解决

    小黑盒时长不显示怎么解决

    在游戏的世界里,小黑盒是不少玩家爱不释手的工具,它能帮助我们便捷地管理游戏、查看各种数据。可要是小黑盒突然不显示时长了,那可真让人着急。别担心,下面就为你送上一套有效的解决办法,轻松让时长显示恢复正常。检查网络连接小黑盒获取游戏时长等数据,全靠稳定的网络连接。

  • 华为手表如何在上海购买医保卡

    华为手表如何在上海购买医保卡

    在科技飞速发展的当下,华为手表凭借其卓越的功能与创新应用,不断为人们的生活带来惊喜与便利。如今,在上海,华为手表又解锁了一项新技能——支持使用医保卡进行购买,这一举措无疑为市民的就医购药过程注入了一股全新的活力。华为手表与上海医保系统的深度融合,为用户带来了前

  • 小艺如何更新到deepseek版本

    小艺如何更新到deepseek版本

    在智能语音助手领域,小艺以其出色的表现受到众多用户喜爱。而当我们想要体验更强大功能的deepseek版本时,该如何进行更新呢?确认设备支持首先,要明确你的设备是否支持小艺更新到deepseek版本。不同的设备型号在兼容性上有所差异,你可以查阅设备的官方文档或者

  • iphone三维触控如何使用

    iphone三维触控如何使用

    三维触控(3dtouch)是苹果公司在iphone6s及后续部分机型上推出的一项创新技术,它允许用户通过不同力度的按压来访问应用的快捷操作和预览内容,极大地提升了手机操作的效率和便捷性。下面,就让我们一起深入了解如何在iphone上设置和使用三维触控功能。一、

  • 如何在高德地图查历史导航记录

    如何在高德地图查历史导航记录

    在日常使用高德地图进行导航的过程中,有时候我们需要查看之前的导航记录,可能是为了回忆曾经走过的路线,或者是核对一些行程信息。那么,高德地图究竟该如何查历史导航记录呢?首先,打开手机中的高德地图应用程序。进入主界面后,点击界面左上角的个人头像图标。这一步是进入个

  • 派派app怎么修改账号信息

    派派app怎么修改账号信息

    在使用派派app的过程中,有时我们可能需要修改账号信息。无论是更换昵称、头像,还是更改绑定的手机号等,都有相应的操作方法。修改昵称进入派派app后,点击界面右下角的“我的”选项。在打开的页面中,找到并点击自己的头像,进入个人资料页面。接着,再次点击头像区域,会

注意事项

本站所有资源(含游戏)均是软件作者、开发商投稿,任何涉及商业盈利目的均不得使用,否则产生的一切后果将由您自己承担!本站将不对任何资源负法律责任,所有资源请在下载后24小时内删除。
如侵犯了您的版权、商标等,请立刻联系我们并具体说明情况后,本站将尽快处理删除,联系版权说明注意事项)。若有关在线投稿、无法下载等问题,请与本站客服人员联系
用户可自行按线路选择相应的下载点,可以直接点击下载/另存为,若直接点击下载速度太慢,请尝试使用高速下载器。为确保下载的文件能正常使用,请使用WinRAR最新版本解压本站软件。
建议大家谨慎对待所下载的文件,大家在安装的时候务必留意每一步!关于360安全卫士QQ电脑管家的有关提示,请自行注意选择操作。