电子教材的图片来自于人教网,1-6年纪共12册,每册有100+张图片,而这图片是在一个个页面中的,如果是打开一个页面图片另存为并重命名,这得重复操作1200次!
搜遍网络,完整的纯图片的没有,有个exe版本的,可图片分辨率太低。
而我是准备用来做课件的素材的,所以开始了1200次的机械操作,刚开始比较顺,可辛辛苦苦半个多小时重复下来一册都还没搞定,并且人教网页面打不开了……
经常访问人教网的肯定遇到过这种情况,尝试挂上SSH,竟然可以打开,且非常稳定,真是天大的笑话!
这么干1200次太没效率了,这里得感谢hzlzh童鞋,帮我写了一个类爬虫PHP程序(教程):
经过分析图片的HTML页面ID是连续的,而图片的名称是无规律的,只能把这1200多个页面里的图片名称爬出来,然后构建出下载地址,并用Firefox的DownThemAll插件批量下载。
其中艰辛不再累述,服务器500错误12次,CtrlC、CtrlV无数次,对所有图片页码命名并分册分单元归档。
真是个体力活!

哇
首页没有滴干活..
我说呢 轻易获得第一次沙发
因为推上没消息了,前排都占不到
貌似微博通不提供同步到推的服务了..
今晚加上同步代码~呵呵
为啥首页没有这篇文章
被潜规则了。。
这个分类被排除在首页文章了~
这个排列形状真性感…
辛苦了 这个教材是通用的么
人教版的~
可惜爸爸现在已经基本不用教课了 之前他一直教的数学
真的呀,急需资料学习哟~~
是哇 教了30多年的小学数学了
教材也变了又变 不过应该是万变不离其宗的
现在的现代化教学 估计他也不是太懂的
传统教学还是很有可取之处的~
恩是的 只是现在的教育状况。。。 说不上来。。
哎呀 木木真真苦力啊
自己要用,有次就为了载一页图片,网址楞是打不开……
刚手机回复米有了,再发一遍。
这玩意要是手动下载会死人的,最简单是把服务器 HEI 了,对了你咋换网盘了?怕别人找你侵权? 哈哈
黑服务器的确最直接,不过页码重命名还是需要一定时间的~
1200次
还是技术党nb
有了程序下载是秒杀了,重命名和归档还是耗了不少时间~
还没想到竟然可以搞到电子版的
人教有电子版可网址经常抽,让人很崩溃!
1200次,太恐怖了..
用程序图片是很快载下来了~
我要好好研究一下去
很强大的一个程序~
那不会,教学这东西还是需要面对面的交流的~
呵呵,痛苦已经过去~
老师就是老帅啊。
累到吐血……
哈哈,这也能写程序,果然是牛逼。
可以考虑下下来怀念下。
现在教材花多了,到处都是图案~
辛苦了~~
唔,有点……
真能干…
蛋疼出品~
这么大的工作量…
表示佩服…表示慰问…
感动~
加油啊
恩,会的~谢谢
呃,你真勇猛……
也是很无奈啊……
木木你太厉害了,居然坚持了半个多小时 ~
天天蛋疼的狠……
可以看出,做老师是多么辛苦。。
不单单是技术活,还得从事大量体力活……
小学教材?哈哈,俺飘过了……
您太有才了,向你学习。请问要怎么样才能下载您的电子课本呢?提取码是多少?