|
本帖最后由 黑崎一护 于 2018-8-28 17:57 编辑
1 简介
这有一份Google招聘需求数据集,想了解Google招聘最看重的技能么,让我们下载下来一探究竟,地址:https://www.kaggle.com/niyamatalmass/google-job-skills。这个数据集有7列,分别是公司(company),职位(Title),工作地址(Locations),工作职责(Responsibilities),获得工作的最低要求(Minimum Qualification),优先考虑录取的要求(Preferred Qualifications)。数据集大致内容如下图所示。公司只有Google和Yotube,Yotube是Google的附属公司。所以真正意义上的公司只有Google一家。
图1-1
2 数据分析 2.1 读取数据 - import numpy as np
- import pandas as pd
- import matplotlib.pyplot as plt
- import seaborn as sns
- df = pd.read_csv('../input/google-job-skills/job_skills.csv')
复制代码 2.2 数据缺失值检测
图2.2-1
从上图看出缺失值较少,使用下面代码直接丢弃即可。 - df = df.dropna(how='any',axis='rows')
复制代码 2.3 提取工作经验要求 - import re
- df['Minimum_years_experience'] = df['Minimum_Qualifications'].apply(lambda x : re.findall(r'([0-9]+) year',x))
- # 没有工作经验要求的以0代替
- df['Minimum_years_experience'] = df['Minimum_years_experience'].apply(lambda y : [0] if len(y)==0 else y)
- #提取要求里的最大工作经验年数
- df['Minimum_years_experience'] = df['Minimum_years_experience'].apply(lambda z : max(z))
- df['Minimum_years_experience'] = df.Minimum_years_experience.astype(int)
- import seaborn as sns
- sns.countplot('Minimum_years_experience',data=df)
- plt.suptitle('Minimum work experience')
复制代码
图2.3-1 从上图可以看出,0年工作经验的招聘最多,Google喜欢应届毕业生?也许可能是招聘要求里没列出来吧。其次比较高的是3-5年工作经验。
2.4 提取语言要求 作为程序员,可能当初学习接触的第一门课就是语言了吧。来看看哪家语言最受Google大佬的青睐。 - Programming_Languages = ['Python', 'Java ','C#', 'PHP', 'Javascript', 'Ruby', 'Perl', 'SQL','Go ']
- Languages = dict((x,0) for x in Programming_Languages)
- for i in Languages:
- x = df['Minimum_Qualifications'].str.contains(i).sum()
- if i in Languages:
- Languages[i] = x
- language.plot.barh(x='Language',y='Count',legend=False)
- plt.suptitle('Languages Distribution',fontsize=14)
复制代码
图2.4-1
从上图可以得知,Python,SQL,占大部分,从而得知数据分析的岗位需求比其他岗位需求要大,这是不是暗示我们的小伙伴去学数据分析啊。
2.5 提取分析师招聘需求中词频最高的关键词
- def MadeWordCloud(title,text):
- df_subset = df.loc[df.Title.str.contains(title).fillna(False)]
- long_text = ' '.join(df_subset[text].tolist())
- sns.set(rc={'figure.figsize':(11.7,8.27)})
- wordcloud = WordCloud(mask=G,background_color="white").generate(long_text)
- plt.figure()
- plt.imshow(wordcloud, interpolation="bilinear")
- plt.axis("off")
- plt.margins(x=0, y=0)
- plt.title(text,size=24)
- plt.show()
复制代码
图2.5-1
从上图可以得知,分析师最看重的职责关键点如下 - 标准:数据/团队/产品/业务/工作
- 洞察力:战略/质量/键/项目/计划/确定/分析/行动/业务/基础设施
- 观众:销售/操作/利益相关者
- 动词:保持/提高/支持/模型/画/定制/确定/提供
- 特点:领导/数量/效率
总结起来就是寻找具有业务和数据知识,熟悉产品的分析师作为团队工作。再来看看google对分析师的最低要求。 - MadeWordCloud('Analyst','Minimum_Qualifications')
复制代码
图2.5-2
上图显示的关键词: - 领域:商业/计算机科学/数学/统计/经济学/工程
- 学位:文科学士/ 理科学士
- 语言Python / SASS/ JAVA / SQL
- 工具:Tableau
Google招聘数据分析师的最低要求小伙伴们满足了吗?反正我是没满足。
- MadeWordCloud('Analyst','Preferred_Qualifications')
复制代码
图2.5-3 从上图的关键词可以了解在应聘Google数据分析师的时候如何更占优势。关键词如下。
- 领域:商业/计算机科学/数学/统计数据
- 技能:口头/书面/交流/管理
- 经验:咨询/分析/开发/ 公司中身兼数职的员工
3 总结
从对Google的招聘需求数据集的数据分析,我们得知对应聘分析师的要求。感兴趣的小伙伴可以自行分析下其他职业的招聘要求。
|
|