易学智能

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 2737|回复: 9

Google招聘需求数据集

[复制链接]

13

主题

53

帖子

131

积分

注册会员

Rank: 2

积分
131
发表于 2018-8-28 17:52:22 | 显示全部楼层 |阅读模式
本帖最后由 黑崎一护 于 2018-8-28 17:57 编辑

1 简介
    这有一份Google招聘需求数据集,想了解Google招聘最看重的技能么,让我们下载下来一探究竟,地址:https://www.kaggle.com/niyamatalmass/google-job-skills。这个数据集有7列,分别是公司(company),职位(Title),工作地址(Locations),工作职责(Responsibilities),获得工作的最低要求(Minimum Qualification),优先考虑录取的要求(Preferred Qualifications)。数据集大致内容如下图所示。公司只有Google和Yotube,Yotube是Google的附属公司。所以真正意义上的公司只有Google一家。

1.png

图1-1

2 数据分析
2.1 读取数据
  1. import numpy as np
  2. import pandas as pd
  3. import matplotlib.pyplot as plt
  4. import seaborn as sns
  5. df = pd.read_csv('../input/google-job-skills/job_skills.csv')
复制代码
2.2 数据缺失值检测
  1. pd.isnull(df).sum()
复制代码

1.png

图2.2-1

    从上图看出缺失值较少,使用下面代码直接丢弃即可。
  1. df = df.dropna(how='any',axis='rows')
复制代码
2.3 提取工作经验要求
  1. import re
  2. df['Minimum_years_experience'] = df['Minimum_Qualifications'].apply(lambda x : re.findall(r'([0-9]+) year',x))
  3. # 没有工作经验要求的以0代替
  4. df['Minimum_years_experience'] = df['Minimum_years_experience'].apply(lambda y : [0] if len(y)==0 else y)
  5. #提取要求里的最大工作经验年数
  6. df['Minimum_years_experience'] = df['Minimum_years_experience'].apply(lambda z : max(z))
  7. df['Minimum_years_experience'] = df.Minimum_years_experience.astype(int)
  8. import seaborn as sns
  9. sns.countplot('Minimum_years_experience',data=df)
  10. plt.suptitle('Minimum work experience')
复制代码

1.png

图2.3-1
    从上图可以看出,0年工作经验的招聘最多,Google喜欢应届毕业生?也许可能是招聘要求里没列出来吧。其次比较高的是3-5年工作经验。

2.4 提取语言要求
    作为程序员,可能当初学习接触的第一门课就是语言了吧。来看看哪家语言最受Google大佬的青睐。
  1. Programming_Languages = ['Python', 'Java ','C#', 'PHP', 'Javascript', 'Ruby', 'Perl', 'SQL','Go ']

  2. Languages = dict((x,0) for x in Programming_Languages)
  3. for i in Languages:
  4.     x = df['Minimum_Qualifications'].str.contains(i).sum()
  5.     if i in Languages:
  6.         Languages[i] = x
  7.   language.plot.barh(x='Language',y='Count',legend=False)
  8. plt.suptitle('Languages Distribution',fontsize=14)
复制代码

1.png

图2.4-1

     从上图可以得知,Python,SQL,占大部分,从而得知数据分析的岗位需求比其他岗位需求要大,这是不是暗示我们的小伙伴去学数据分析啊。

2.5 提取分析师招聘需求中词频最高的关键词

  1. def MadeWordCloud(title,text):
  2.     df_subset = df.loc[df.Title.str.contains(title).fillna(False)]
  3.     long_text = ' '.join(df_subset[text].tolist())
  4.     sns.set(rc={'figure.figsize':(11.7,8.27)})
  5.     wordcloud = WordCloud(mask=G,background_color="white").generate(long_text)
  6.     plt.figure()
  7.     plt.imshow(wordcloud, interpolation="bilinear")
  8.     plt.axis("off")
  9.     plt.margins(x=0, y=0)
  10.     plt.title(text,size=24)
  11.     plt.show()
复制代码

1.png

图2.5-1

    从上图可以得知,分析师最看重的职责关键点如下
  • 标准:数据/团队/产品/业务/工作
  • 洞察力:战略/质量/键/项目/计划/确定/分析/行动/业务/基础设施
  • 观众:销售/操作/利益相关者
  • 动词:保持/提高/支持/模型/画/定制/确定/提供
  • 特点:领导/数量/效率
    总结起来就是寻找具有业务和数据知识,熟悉产品的分析师作为团队工作。再来看看google对分析师的最低要求。
  1. MadeWordCloud('Analyst','Minimum_Qualifications')
复制代码
1.png

图2.5-2

    上图显示的关键词:
  • 领域:商业/计算机科学/数学/统计/经济学/工程
  • 学位:文科学士/ 理科学士
  • 语言Python / SASS/ JAVA / SQL
  • 工具:Tableau
    Google招聘数据分析师的最低要求小伙伴们满足了吗?反正我是没满足。
  1. MadeWordCloud('Analyst','Preferred_Qualifications')
复制代码

1.png

图2.5-3

从上图的关键词可以了解在应聘Google数据分析师的时候如何更占优势。关键词如下。


  • 领域:商业/计算机科学/数学/统计数据
  • 技能:口头/书面/交流/管理
  • 经验:咨询/分析/开发/ 公司中身兼数职的员工


3 总结


    从对Google的招聘需求数据集的数据分析,我们得知对应聘分析师的要求。感兴趣的小伙伴可以自行分析下其他职业的招聘要求。





回复

使用道具 举报

15

主题

97

帖子

310

积分

论坛管理

Rank: 4

积分
310
发表于 2018-9-8 10:53:33 | 显示全部楼层
我会嘤嘤嘤,Google会招我吗?
回复

使用道具 举报

11

主题

80

帖子

199

积分

注册会员

Rank: 2

积分
199
发表于 2018-9-8 11:11:06 | 显示全部楼层
I_Like_AI 发表于 2018-9-8 10:53
我会嘤嘤嘤,Google会招我吗?

发现一只嘤嘤怪,Google不需要嘤嘤怪
回复

使用道具 举报

13

主题

53

帖子

131

积分

注册会员

Rank: 2

积分
131
 楼主| 发表于 2018-9-8 11:28:04 | 显示全部楼层
I_Like_AI 发表于 2018-9-8 10:53
我会嘤嘤嘤,Google会招我吗?

不会,得按招聘流程来,进Google难度大啊,
回复

使用道具 举报

9

主题

74

帖子

185

积分

注册会员

Rank: 2

积分
185
发表于 2018-9-10 09:04:06 | 显示全部楼层
想进谷歌
回复

使用道具 举报

1

主题

27

帖子

71

积分

注册会员

Rank: 2

积分
71
发表于 2018-9-11 10:38:49 | 显示全部楼层
用来练练手还可以
回复

使用道具 举报

13

主题

53

帖子

131

积分

注册会员

Rank: 2

积分
131
 楼主| 发表于 2018-9-11 17:21:16 | 显示全部楼层

重要的不是练手,可以看清自己应该注重哪些方面的技能
回复

使用道具 举报

22

主题

107

帖子

266

积分

中级会员

Rank: 3Rank: 3

积分
266
发表于 2018-9-27 08:00:29 | 显示全部楼层
资源好评
回复

使用道具 举报

13

主题

53

帖子

131

积分

注册会员

Rank: 2

积分
131
 楼主| 发表于 2018-10-11 08:16:17 | 显示全部楼层

马猴哥,一起发资源啊
回复

使用道具 举报

22

主题

107

帖子

266

积分

中级会员

Rank: 3Rank: 3

积分
266
发表于 2018-10-11 08:21:20 | 显示全部楼层
黑崎一护 发表于 2018-10-11 08:16
马猴哥,一起发资源啊

好噻,一起来
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|易学智能

GMT+8, 2024-4-25 18:57 , Processed in 0.019593 second(s), 23 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表