杂谈by立行

中文教材怎么找——玩转PDF系列01

2019-03-24 · 10 min read
书籍 找书 搜索

0 引子

我在公众号的菜单里面创建了一个“教材库”,放了一些计算机和数学的教材。原意只是想方便需要的人寻找,尽量节省诸位的时间。不过随着粉丝量的增多,后台催促我出教程的声音日益频繁,也对,授人以鱼不如授人以渔。📚

毕竟相较于音频、视频课程,书籍能传递的信息更为系统,也更加全面。通过书籍学习的知识也更利于复习。

获取电子书籍不应该成为我们的门槛

好人做到底,打磨出了一套 玩转PDF系列 教程集。涵盖了从寻找书籍处理PDF 再到各平台选择阅读器的全套流程。

关于 PDF 的一般问题看这套教程就够了。👌

为什么需要“玩转PDF系列”这套教程?

一来是随着 iPad 和 surface 的逐渐流行,越来越多的人选择了数字化的学习方式。但是很多人或者找不到数字学习材料,或者找到的材料质量不高,这样大大损伤了数字化学习的效率

二来是因为 PDF 有着全平台兼容性,不论是 Windows、Mac、Linux 抑或是 Android、iOS,PDF 的显示效果都是相同的。这种特性也使 PDF 更为了绝大多数教材、报告、文章的发布版本。但是很多人对 PDF 知之甚少,也不知道怎样去处理有关 PDF 的常见问题。

好了,话不多说,进入今天的正题——怎么找中文教材。


写在前面

促使人们搜寻 PDF 教材的原因有很多,或许是厌恶了纸质书籍的重量、或许是负担不起原书的价格,但不管是出于怎样的目的,我仍然十分建议你能够购买一本对应的正版书籍支持作者,这是对别人劳动成果的尊重

1 中文电子教材背景介绍

中文教材的电子化做的是不如英文教材的。英文教材大多都是由源文档直接输出,而中文教材大多是成书扫描影印得来的。这也就是为什么同样一本书,英文教材的 PDF 可能只有几 MB 大小,但是翻译成中文后 PDF 可能就会变成上百 MB 大小。并且扫描的 PDF 文件如果没有经过 OCR 识别,是不支持对文字进行操作的。

市面上多数中文 PDF 教材不外乎四种来源——图书馆扫描图书流出、个人扫描书籍上传、开源书籍(很少)、出版社文件流出(很少)

知道了来源就可以对症下药了,下面说怎么找。👀

PS:找到 Word、mobi、Epub、格式的教材也可以通过相关软件转换成 PDF,具体方法可以参考mobi / epub / azw3 书籍格式分不清楚?

2 中文 PDF 教材获取方法

2.1 网盘搜索器

国内的文件共享大多使用的都是网盘,教材也不例外。这里的网盘除了百度网盘,还包括微盘(新浪)、蓝奏云、城通网盘等一众云储存服务提供商。

但是这些网盘大多没有提供搜索功能,这里的“搜索”指搜索非公开分享的内容。拿百度网盘举例,公开分享是我们可以直接搜索到的。但是如果带提取码的分享,官方并没有提供这样的搜索入口。

这也就催生出了一大批的网盘搜索器,比如 磁力猫西林街。这种网站还有很多,Google 一下一大堆。

mark

这里推荐几个,都是做聚合网盘搜索器进行搜索的🤞🤞🤞

2.1.1 虫部落-快搜

mark

注意上栏、侧栏、底栏

虫部落的强大远不止于此,但是由于这次的主题是 PDF 相关,所以就不在这里展开了。

2.1.2 龙轩导航

mark

同样也是非常强大的一个导航页,除了网盘搜也还有很多其他的实用功能,也不展开了。

2.1.3 猎手导航

mark

同样,不展开讲。

至于百度网盘不限速的方法,下文也会讲到。🎁

2.2 论坛、BBS

有些教材通过网盘搜索仍然是搜索不到的,这时候就需要到对应学科专门的论坛去找了,而且大概率是可以找到的

这里说几个学科常用的论坛✔✔✔

2.2.1 CSDN

mark

面向学科:计算机、数学为主

虽然 CSDN 文章质量不咋地,但是它可能真的是全国最大的盗版资源汇集地了。😶

2.2.2 小木虫

mark

面向学科:理工科为主

论坛整体的氛围较好,资源也比较丰富。

2.2.3 经管之家

mark

面向学科:经济、金融、管理等

2.2.4 怎么下载

如你所见,这些论坛都需要通过论坛币/积分/金币等虚拟货币进行下载。通常可以通过每日签到等手段赚取,但是比较麻烦而且比较慢。

如果只是偶尔下载一次,建议直接去万能某宝搜索下载。🛒

mark

如果需要经常下载,最好可以拥有自己的账号及对应的论坛币

其中 CSDN 一般没有账号出售,需要另外想办法获取积分。方法和渠道你可以加入后面的「电子教材计划」📚后获取。

2.2.5 Github💻

面向学科:计算机、数学为主

之所以放在这个位置,是因为 Github 的开源性,书籍可以免费下载

这里简单列举几个

mark
  1. 经典技术书籍 PDF 文件,持续更新...
  2. Directory of Python books
  3. 经典编程书籍大全
  4. 中医药古籍文本
  5. [译] 面向数据科学的概率论

小技巧:用 “awesome”加你想要搜索的关键词往往有意想不到的收获。🥚

2.3 找专业人员购买

2.3.1 确认图书馆是否扫描过及其清晰度

上文提到过,中文 PDF 教材一部分来源是图书馆扫描图书流出,所以找具有管理权限的人也可以获取相关的 PDF 书籍。

mark

首先请到全国图书馆参考咨询联盟检索图书,通过书名、ISBN、作者等多种方式都可以进行检索(推荐使用 ISBN 检索,效率非常高)

PS:ISBN 就是书背面右下角条形码处的数字,也可以在电商网站详情页找到。

mark

如果图书详情页的右上角有试读(版权、前言、目录、正文),则可以通过这种途径购买。如果没有试读,则无法通过这种途径购买。

点进去查看清晰度,试读的清晰度就是制作出来的 PDF 教材的清晰度

mark

2.3.2 找人购买

你可以在通过淘宝等途径找到这类人员,通常一本价格 5-15 元不等,自己挑选即可。

为了避免打广告的嫌疑,文章中不做推荐。但是你可以在后台回复”电子书购买“获取我推荐的一位从业者联系方式,一本大概 3 元。

PS:图书馆的扫描格式是 PDG,转成 PDF 需要一定的时间,请耐心等待。

2.4 通用搜索引擎搜索

如果走到了这一步,要么你的书比较新,图书馆还没来得及扫描;要么就是书比较偏,需求不大。

所以,还是得依靠广大的网友了。用通用搜索引擎搜索。建议使用 Google 或者及其镜像网站

当然,搜索也是有技巧的。

2.4.1 善于利用 ”filetype:“

mark

注意冒号是英文的冒号

filetype 也就是只显示某一文件类型,例如.doc .pdf .xls .ppt .txt

2.4.2 善于利用英文双引号 ”“

mark

双引号里面的内容是精确匹配的,也就是说连接中必定含有双引号里面相同的内容。在很多相似书籍中检索很方便。

2.4.3 善于利用 “-”

mark

减号通常用来排除某一搜索内容,图示即为 不含 python 的 machine learning 搜索结果。

注意:前一个关键词和减号之间必须有空格,后一个关键词和减号之间不能有空格

2.4.4 更多搜索语法技巧

搜索的语法技巧还有很多,这里不做展开。你可以参考这篇文章了解。当然,只要会几种常用的就能够大大提高检索的效率了。

PS:现在多数的搜索引擎是基于关键词检索而非语义检索,所以请不要输入”如何找到笨方法学python这本书“🙃🙃🙃,而应该拆分关键词——”笨方法 python” 。

2.5 杂项

mark

中国哲学书电子化计划

类似的专门计划应该还有,欢迎留言区内补充。🔗

2.6 众筹扫描

如果前面的方法都试过了但是还是走到了这一步,恭喜你,你即将解锁一个新的技能。😬

请自己扫描吧...

淘宝买书——寄送到淘宝扫描店——获取 PDF。

一般报价:

报价:拆书扫描0.1元/面,不拆书扫描0.2元/面。A3扫描要拆书0.2元/面。如您的书300页,拆书为30元。

400 dpi 的清晰度足够,建议拆书扫描,效果很好。

如果是刚需,十分建议对此书发起众筹扫描,平摊成本。因为稍微厚一些的书可能卖 15 元,但扫描制作成 PDF 一套服务下来可能会过百。

你可以加入后文的 「电子教材计划」发起你的众筹需求(首先自己有个判断需求是否小众)

3 高阶技巧

3.1 关于百度网盘不限速

mark

GitHub 上关于百度网盘不限速的项目有很多,比如 ProxyeeDown 你可以自行搜索。

市面上也会有一些相对成熟的第三方软件,比如 速盘PanDownload

当然,第三方的客户端都是有风险的,可能账号会被限速。

你也可以使用 IDM+油猴脚本 ,更保险一些。如果你懒得折腾,这里推荐奶酪的方法

3.2 Chrome+Context Search 插件配合提高搜索效率

每次搜索都需要重新打开网页,键入关键词,比较麻烦。使用这一款插件可以加快搜索效率。

mark

效果如图

下期预告:英文教材怎么找?