首先描述程序实现的事情:输入题目url链接,自动爬取题目区域,持续输入,直到用户停止,停止后自动将刚刚所有连接的题目合并到一个html文件里。
首先要清楚一个特性,小猿搜题使用“分享到qq”可以获得题目的链接,并且是文字的形式(作业帮分享出来的链接里的题目是带水印的图片格式,体验比较差)。所以根据这个特性,为了服务老师出卷子找题目可能会遇到的要慢慢打字的或者其他扒取题目成为可打印或者可分享文件的困难,写下这个python程序,只需要输入多个小猿搜题的题目链接,就可以自动生成这几个题目的html文档。
前期构想差不多是这样,后期说不定能引入自动生成pdf等。
那具体实现就是python的requests和xpath之类的了。