专题外行人看大数据 数据行业如何雇佣员工的几点建议(上)
大数据已经成为一项火热的新产业,想要涉足这个产业,你需要了解的技能和背景都有哪些呢?数据科学、数据工程还有数...
![](/static/css/default/img/bg.gif)
哇特机器人—发现好用的机器人
![](/static/css/default/img/bg.gif)
编辑:张良 校对排版:吴双
![](/static/css/default/img/bg.gif)
![](/static/css/default/img/bg.gif)
(一)数据的存储
数据的存储是数据管理重要的一步,因为你拥有越多的数据,就意味着越多的服务、硬件以及第三方服务需要处理。然而,数据的存储除了捕捉整理数据,还包括数据的转码编译,甚至包括做一些重要的决策以确保在数据的修复和分析过程中依旧能保留数据的有效性。
![](/static/css/default/img/bg.gif)
(二)数据收集
数据收集工作量巨大,而且一般来说,公司会收集比自己需要量更大的数据。因此,在数据收集之前,应该先搞清楚自己想要收集什么样的数据,拥有什么类型的客户群体。就银行而言,银行对数据的要求很高,不能容许数据的滞后和在数据修复过程中出现延迟,因此银行雇佣的数据工作人员必须适应在高压环境中工作。相反,社会媒体网络对数据的要求没有那么高,允许在数据修复过程中短暂的不连续性。这就意味着公司在雇佣员工的时候应该着重考虑:“契合自己的商业模式”或“能适应灵活的、创新的环境”。
![](/static/css/default/img/bg.gif)
但是随着商业面临着“4V”:volume(体积)、 variety (种类)、velocity(速率)以及veracity(真实性),数据收集过程中的问题也渐渐暴露出来。一个数据收集工作者不能同时兼顾这四个问题,举个例子,解决收集数据的速率和真实性问题是数据工程方面的工作,这类问题可能连数据科学家和数据分析师都无法解决。Thusoo表示,自己一般会雇佣那些能知晓数据收集中错综复杂的关系、哪些东西可能有问题的员工。在计算领域有一句谚语“Garbage in, garbage out”,这同样适用于数据。查阅应征者的简历不应该只是看是否有该领域的经验,更要看员工能否发现数据的质量问题并加以解决问题的能力。
![](/static/css/default/img/bg.gif)
![](/static/css/default/img/bg.gif)
![](/static/css/default/img/bg.gif)
关注 哇特机器人
![](http://a-site.cn/static/down/wx_205x205.png)