毕业去向获取
适用于安徽地区,其他地区是否可用尚待观察
思考过程
网页部分
根据短信信息,打开该网页。使用网页开发者工具,定位网页网络流量。

输入任意手机号(如 13977887788 ),定位网页 GET 请求。

易知 Career.ashx 的 GET 请求 URL (以 13977887788 为例) 为:
https://job.ahbys.com/API/Admin/office/Career.ashx?action=authinfo&mobile=13977887788
浏览器直接使用该请求所获的内容如下:

自动化
使用 Python Requests 库获取 GET 后的网页源代码,并使用 re 库的正则表达式对网页源代码进行处理。整体方式比较简单,部分源代码如下:
//author: icloudsheep
import requests
import re
url = "https://job.ahbys.com/API/Admin/office/Career.ashx?action=authinfo&mobile=" //GET 请求 URL
mobile = 13977887788 //手机号
resp = requests.get(url + mobile)
if re.match(r'{"code.*?', resp.text):
print(row[1] + " " + mobile + " 手机号输入不正确")
else:
matchObj = re.match(r'{"name":"(.*?)","studentnum":"(.*?)","unitname":"(.*?)","school":"(.*?).*?', resp.text)
if matchObj:
print(matchObj.group(1) + " " + matchObj.group(2) + " " + matchObj.group(3) + " " + matchObj.group(4))
此段代码只能适用于单次搜索,如需对多次搜索进行自动化,需要考虑输入输出以及多次访问的防爬虫措施,在此就不过多赘述。
获取结果
最终可以根据以上方式,获取相关数据。在此声明,所有方法仅供学习使用,请勿用于非法目的,本网站所进行的数据收集、分析均符合相关法律法规规定。禁止任何单位或个人,非法收集他人个人隐私。
数据分析报告
本次共收集毕业去向 251 份 (全部为计算机科学与技术专业),其中有效数据 173 份。敏感信息全部进行脱敏处理,数据收集、分析均符合相关法律法规规定。
毕业去向饼图
在全部的 251 份数据中,毕业去向如图所示:

其中私企占比最大,约为47%;升学次之,占比约 17%;央国企占比约 3%;公务员与西部计划分别占比 1%。需要特别说明的是,未知并非无业,只是该用户该手机号并未查询到相关就业信息。
升学去向饼图
在全部的 43 份数据中,升学去向如图所示:

公务员、央企、国企去向饼图
在全部的 10 份数据中,公务员、央企、国企去向如图所示:

毕业生去向地区柱形图
在全部的 251 份数据中,毕业生去向地区如图所示:

地区分布全国图

地区分布安徽图

毕业去向具体图

隐私与安全

后记
理性讨论,如有疑问,欢迎联系。
当初青年大学习名单获取,引发纷争,想来也是误会,哈哈哈哈。

评论(0)
暂无评论