大家好,我是致力于分享实用技巧的EarlGrey,曾参与翻译出版了《Python编程无师自通》、《Python并行计算手册》等技术书籍。
如果你觉得我的分享对你有所帮助,请关注我,一起共同进步。
脚本链接:
https://greasyfork.org/zh-CN/scripts/486211
这是一款专为Tampermonkey或其他支持用户脚本的浏览器扩展设计的油猴脚本。
经常看到论坛上有很多朋友需要下载免费文档,但相关网站存在大量广告干扰,登录验证繁琐,下载步骤复杂。此脚本旨在简化这一过程,尽可能实现自动化处理。
安装指南
- 安装Tampermonkey浏览器插件。点击上述脚本链接或手动复制脚本代码。在Tampermonkey中新建一个脚本,将代码粘贴至编辑器并保存。
工作原理
在线文档通常以以下几种方式展示:
- 将图片绘制到画布上呈现将二进制数据绘制到画布上多张图片拼接渲染页面直接渲染图片页面
该脚本的作用是当浏览器渲染画布或图片时进行下载并拼接成PDF文件。请注意,它无法获取原始文件,也并非破解工具。其核心理念是:你能在浏览器中看到什么内容,就能下载什么内容。
关键技术创新点在于解决跨域问题
许多文档由多个域名提供,这导致了跨域问题。即如果尝试通过JavaScript直接下载这些图片,会遇到跨域限制,这也是其他类似脚本只能提供图片下载地址而无法直接下载的原因。
解决跨域问题的一个简单方法是确保同源性。脚本通过动态添加iframe元素,在iframe内打开当前图片所在的域名,并将需要下载的图片当作iframe页面内容下载,再利用postMessage方法将Blob数据传回主页面保存。
当然,可能还有更好的解决方案,但此脚本基于JavaScript编写,不依赖任何额外的第三方工具(如下载、合并等exe文件)。

支持平台与功能
???? 支持平台 | 状态 | 自动预览 | 停止预览 | 下载图片 | 下载PDF | 获取文本 | 打印PDF | 获取地址 |
---|---|---|---|---|---|---|---|---|
百度文库 | ✅ | ✅ | ✅ | ✔️部分 | ✔️部分 | ✔️ 部分 | ✅ | ✔️ 部分 |
原创力文档 | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ✅ |
人人文库 | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ✅ |
360文库 | ✅ | ❌ | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ |
豆丁网 | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
豆丁建筑 | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
道客巴巴 | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
MBA智库 | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ✅ |
得力文库 | ✅ | ❌ | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ |
七彩学科 | ✅ | ❌ | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ |
金锄头 | ✅ | ❌ | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ |
爱问文库 | ✅ | ❌ | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ |
蚂蚁文库 | ✅ | ❌ | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ |
读根网 | ✅ | ❌ | ❌ | ✅ | ✅ | ❌ | ❌ | ❌ |
搜弘文库 | ✅ | ❌ | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ |
微传网 | ✅ | ❌ | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ |
淘豆网 | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
1->2->3 功能执行优先级
功能 | 解释说明 |
---|---|
状态位 | 各个功能执行状态,显示当前进度。 |
自动预览 | 滚动页面使所有内容进入可视范围。对于百度文库,必须使用此功能;其他平台也可以手动操作。 |
停止预览 | 暂停滚动。 |
下载图片 | 打包下载所有图片,便于后续处理,例如OCR识别。 |
下载PDF | 将所有图片合并导出为PDF文件。 |
获取文本 | 提取文本内容。 |
打印PDF | 使用浏览器自带打印功能,可通过Ctrl+P调用,“目标打印机”处选择另存为PDF。 |
获取地址 | 导出所有图片地址,视文档类型而定。 |
使用提示
- F5刷新能解决大部分问题。按顺序点击功能按钮,等待一个功能完成后才开始下一个。蓝色箭头标记的平台类型相似,可直接下载无需预览。若zip js库加载失败,可修改脚本中的引用地址。
平台 | 注意事项 |
---|---|
百度文库 | PDF格式分为可编辑、不可编辑和图片格式。下载PDF仅支持图片格式,遇空白页可用打印PDF功能。对于可编辑PDF,先点击编辑文档再自动预览打印,即可获得可复制内容的PDF。文本内容支持全局复制。word/PDF自动预览后不能复制文本,需注意选择是否预览。建议优先使用可编辑模式下预览。 |
原创力文档 | PPT下载过程中,停止预览后若想继续预览全文需刷新页面重新开始。全屏预览时不要缩小浏览器窗口。 |
人人文库 | 从侧边栏“相似文档”切换文档可能无法下载,需F5刷新。 |
豆丁网/豆丁建筑 | 登录账号可查看更多内容,默认只展示部分内容。 |
道客巴巴 | 暂无特别需要注意的地方。 |
- EOF -