微信号:python6359

介绍:每天推送python语言的相关信息

教你用python撸走《百万英雄》《冲顶大会》奖金。

2018-01-13 15:55 Vendar_GM

百万英雄类答题游戏的程序员打开方式

最近这类答题app比较火,我的同事wangtonghe为开源社区贡献了他的python代码。以下文章为他的思路,分享给大家。


-初步思路

思路很明确,把答案截图pull过来,通过PYTHON OCR 库进行识别成文字后再放到百度搜索。匹配出现率最频繁的词语,记过几番尝试后,一些容易搜索的问题还是是可以搜索大部分答案的。


  • 尝试

目前它是手动的,也就是说每次答案出现,手动执行脚本返回答案。同样由于个别题目原因(如某个词有多少笔画)虽然不是百分之百的成功率,但是一般都能进入决赛+一张复活卡基本妥妥‘吃鸡’,下面是吃鸡截图:


  • 技术栈

实现语言python,用到的类库如下:

  1. PIL

  2. pytesseract(图片识别库)

  3. BeautifulSoup(页面解析)


文字识别引擎需单独安装,参见Python人工智能之图片识别,Python3一行代码实现图片文字识别以及mac上文字识别 Tesseract-OCR for mac


主体代码如下:

文字识别需经训练,训练越多结果越准。

  • 结语

要想实现更智能化,有个思路是不停的截图(1秒一次),一旦截到答题页(可以用答题页的色差来做),做文字识别后百度,将百度后的结果与选项做比较,哪个出现次数最多哪个就是最佳答案,这里可以加个判断,如果特别确定直接模拟点击事件选答案,不确定就手工。

有同学提到分析请求,也是个思路,后续可以研究。

欢迎探讨其他更好的实现方式。

作者:Vendar_GM

源自:https://juejin.im/post/5a579d63f265da3e4d72a028

声明:文章著作权归作者所有,如有侵权,请联系小编删除



 
python 更多文章 改善Python程序的一些建议(笔记一) Python爬取网站的一些小技巧 Python微信跳一跳:半自动版教程and全自动版教程 py3.6 + xadmin的自学网站搭建 Python3爬取B站视频弹幕【文字+视频】
猜您喜欢 APP运营七种武器之“多情环” 机器学习常见算法分类汇总 达内成为中国教育创新“20+”论坛创始成员 spring环绕增强 过了35岁后,硅谷人会计划做什么呢?