微信号:bigdatalab

介绍:宽客俱乐部旗下美国大数据实验室,大数据研究应用.

亲测,手把手教你用Python抢票

2015-12-13 10:03 大数据实验室

随着春节的临近,大家都在和12306斗智斗勇。今天,大数据文摘推出不到100行的Python程序帮助大家来抢票。


首先说明一下,我们程序的出发点是能用机器做的事就用机器做,需要人来做的事还是要自己来做。因此,12306上五花八门的验证码还是需要大家自己动手输入确认的。另外,本程序对容错什么的考虑较少,请大家见谅。


我们要用到浏览器chrome,还没有安装的读者可以从这个下载地址下载chrome并进行安装:http://chromedriver.storage.googleapis.com/index.html?path=2.20/,大家可以根据自己的电脑系统选择下载包进行安装。如果你用的是MAC,可以直接通过brew install chromedriver来安装。



现在一切就绪,让我们学习一下这个Python程序。


Splinter是一个自动化测试网络应用的Python库。有了Splinter,就可以将打开浏览器、输入URL、填写表单、点击按钮等全部操作自动化。因此,我们需要引入这个库。通过pip install splinter来安装。



1 from splinter.browser import Browser

2 from time import sleep

#traceback模块被用来跟踪异常返回信息

3 import traceback

# 设定用户名,密码

4 username = u"用户名"

5 passwd = u"密码"

# 起始地址的cookies值要自己去找, 下面两个分别是上海, 营口东。如何找,我们在文#后有简单的介绍

6 starts = u"%u4E0A%u6D77%2CSHH"

7 ends = u"%u8425%u53E3%u4E1C%2CYGT"

# 时间格式2016-02-01

8 dtime = u"2016-02-01"

# 车次,选择第几趟,0则从上之下依次点击

9 order = 0

#设定乘客姓名

10 pa = u"乘客姓名"

#设定网址

11 ticket_url = "https://kyfw.12306.cn/otn/leftTicket/init"

12 login_url = "https://kyfw.12306.cn/otn/login/init"

13 initmy_url = https://kyfw.12306.cn/otn/index/initMy12306

#登录网站

14 def login():

15 b.find_by_text(u"登录").click()

16 sleep(3)


我们在这里尝试了模拟登录12306,得到结果如下:




登录页面成功显示!


#第17至20行代码用于自动登录,username是12306账号名,passwd是12306密码

17 b.fill("loginUserDTO.user_name", username)

18 sleep(1)

19 b.fill("userDTO.password", passwd)

20 sleep(1)


在我们的模拟登录中,结果如下:




成功登录!


接下来的验证码还是要大家自己动手输入啦!据说12306的验证码辨识难度堪比常识竞赛。在此,大数据文摘祝你好运!


21 print u"等待验证码,自行输入..."

22 while True:

23 if b.url != initmy_url:

24 sleep(1)

25 else:

26 break


#购票

27 def huoche():

28 global b

#使用splinter打开chrome浏览器

29 b = Browser(driver_name="chrome")

#返回购票页面

30 b.visit(ticket_url)


现在让我们来看看程序运行结果



看到了吗?网页能正常打开!


31 while b.is_text_present(u"登录"):

32 sleep(1)

33 login()

34 if b.url == initmy_url:

35 break


36 try:

37 print u"购票页面..."

38 # 跳回购票页面

39 b.visit(ticket_url)


40 # 加载查询信息

我们的模拟登录中以上海为始发站,营口东为终点站,时间选定2016年2月1日


41 b.cookies.add({"_jc_save_fromStation": starts})

42 b.cookies.add({"_jc_save_toStation": ends})

43 b.cookies.add({"_jc_save_fromDate": dtime})

44 b.reload()


让我们一起来看看运行结果如何?



45 sleep(2)


46 count = 0

47 # 循环点击预订

48 if order != 0:

49 while b.url == ticket_url:

50 b.find_by_text(u"查询").click()


程序自动点击查询后,结果如下:




51 count +=1

52 print u"循环点击查询... 第 %s 次" % count

53 sleep(1)

54 try:

55 b.find_by_text(u"预订")[order - 1].click()


程序自动点击预订后,结果如下:



哇啦!我们成功预订了春运车票!


56 except:

57 print u"还没开始预订"

58 continue

59 else:

60 while b.url == ticket_url:

61 b.find_by_text(u"查询").click()

62 count += 1

63 print u"循环点击查询... 第 %s 次" % count

64 sleep(1)

65 try:

66 for i in b.find_by_text(u"预订"):

67 i.click()

68 except:

69 print u"还没开始预订"

70 continue

71 sleep(1)


注意:可以通过修改sleep的参数来调整延时, 但延时不要太低, 防止被12306网站认为是刷票屏蔽掉.

72 b.find_by_text(pa)[1].click()


如果你运气不好,程序会给出一个这样的信息:

73 print u"能做的都做了.....不再对浏览器进行任何操作"


如果出现这样的信息,你也不要灰心,重新执行程序,让好运降临!


74 except Exception as e:

75 print(traceback.print_exc())

76 if __name__ == "__main__":

77 huoche()


小技巧:

如何在chrome中获得起始站和终点站等的cookie值?

大家可以先登录一下12306,输入地点日期什么的查询一下,然后在chrome浏览器中按F12,出现如下页面,在resource选项里找到相应的值。




大家可以看到对应表格中的cookie值:

_jc_save_fromeStation的值为出发地

_jc_save_toSatation的值为目的地

_jc_save_fromDate 出发日期

_jc_save_toDate返程日期


看到这里,你还不快点动手抢票?



(程序设计:刘博 作者:席雄芬 姚佳灵 来源:大数据文摘)





金手指股票操盘手特训营(第十五期 上海)


  • 二天系统学习+三天实盘实战训练

  • 辅导班——长期服务

  • 旗下数十位学员曾创造2011-2015年度账户翻番的利润业绩;


报名咨询手机/微信:13061694649

点击“阅读原文”可了解详情


 
大数据实验室 更多文章 用户画像数据建模方法 李光斗:警方是如何利用大数据抓到王全安的 降楼价,新加坡居然靠的是无人驾驶! 小数法则和经验主义 什么性格的人适合 Quant 这个职位?能否描述一下 Quant 一天的生活是怎样的?
猜您喜欢 24条Docker建议 决定APP用户是否留存的三个重要因素 API 调用次数限制实现 为编程语言设计的开源字体Hack 今晚直播,聊聊技术创业那些坑儿