微信号:datadw

介绍:实战学习资料提供.涵盖数据分析工具使用,数据挖掘算法原理与案例,机器学习,R语言,Python编程,爬虫.如需发布广告请联系: hai299014

百万英雄直播答题辅助系统,非OCR实现

2018-02-01 00:00 数据挖掘入门与实战

 向AI转型的程序员都关注了这个号👇👇👇


大数据挖掘DT数据分析  公众号: datadw


本文代码在公众号 datadw 里 回复 百万英雄  即可获取。


摘要

看了网上很多的教程都是通过OCR识别的,这种方法的有优点在于通用性强。不同的答题活动都可以参加,但是缺点也明显,速度有限,并且如果通过调用第三方OCR,有次数限制。但是使用本教程提到的数据接口。我们能很容易的获取数据,速度快,但是接口是变化的,需要及时更新。


一、前言


看了网上很多的教程都是通过OCR识别的,这种方法的优点在于通用性强。不同的答题活动都可以参加,但是缺点也明显,速度有限,并且如果通过调用第三方OCR,有次数限制。但是使用本教程提到的数据接口。我们能很容易的获取数据,速度快,但是接口是变化的,需要及时更新。

本文来自 微信公众号 datadw  【大数据挖掘DT数据分析】


二、实战解析


1、背景介绍


百万英雄答题是一个最近很火爆的答题软件,答对12题的人,可以平分最后的奖金。奖金不错,笔者参加过几次,不过获得的都是小奖,最后几块钱的那种。对于不难的题目,能够直接百度出答案的题目,如果有个软件辅助实时给出参考,还是一件很舒服的事情。想干就干,走起!


2、先睹为快

先看下部署效果,通过服务器后端处理,通过前端显示:


本文代码在公众号 datadw 里 回复 百万英雄  即可获取。


3、西瓜视频APP抓包

对于如何抓包,我想应该都会了,我在手机APP抓包教程中有详细讲解,如有不会的,请暂时移步:http://blog.csdn.net/c406495762/article/details/76850843



在比赛答题的时候,我们可以通过抓包,找到这样的接口(点击放大):可以看到,参数如上图所示。其中heartbeat后面的参数是一个随着场次的增加,逐渐增加的一个数,后面其他的例如iid和device_id是每个人的用户信息,在接口的最后,有个rticket参数,这个是一个时间戳,可以通过time.time()模拟。

2018-1-17更新:据朋友反应,url的有效参数只有heartbeat和rticket参数,用户信息可以不填写。


注意:只有在答题直播开始的时候,才能通过接口抓取到数据,没有直播的时候,是获取不到数据的,是乱码。



通过这个接口获取数据,然后对数据进行解析,在通过百度知道索问题,简单高效。有了这个思想,就可以开始写代码了。

本文来自 微信公众号 datadw  【大数据挖掘DT数据分析】



获取数据和查找答案就是这样,很简单。


本文代码在公众号 datadw 里 回复 百万英雄  即可获取。


将这些部署到服务器上。这是我的部署效果:

部署好后。使用指令运行Node.js服务:


1

node app.js

运行python3脚本:


1

python3 baiwan.py

如果一切都搭建好了,那么这个百万英雄答题辅助系统就可以运行了!

via http://cuijiahua.com/blog/2018/01/spider_3.html


人工智能大数据与深度学习

搜索添加微信公众号:weic2c

长按图片,识别二维码,点关注



大数据挖掘DT数据分析

搜索添加微信公众号:datadw


教你机器学习,教你数据挖掘

长按图片,识别二维码,点关注

 
数据挖掘入门与实战 更多文章 3 个月如何从小白到 Python 高手?清华博士带你入门带你飞! 用Python调用百度OCR接口实例 重磅|教育部发文:AI、算法等2018年进入全国高中课程! 算法工程师的面试难不难,如何准备?-图像处理\/CV\/ML\/DL到HR面总结 使用深度学习进行语言翻译:神经网络和seq2seq为何效果非凡?
猜您喜欢 年底无工作,谈何新年快乐? 【大宝电台】想开一家设计公司?他问了我这些问题(中) Git 的基本操作、开发流程、实用技巧总结 健身房「倒闭潮」的冬天,是「健身内容」的春天|风向2018