(涨知识)这组文图让你了解什么是人工智能-大数据-数据标注员

标签:
老琴博客大数据人工智能数据标注员涨知识杂谈 |
分类: 好图转发 |
近几年,随着AlphaGo(阿尔法狗)击败人类顶尖围棋选手李世石、柯洁等一系列事件,人工智能开始逐渐走红。而人工智能需要大量的数据来供机器深度学习,而这些数据正是出自它背后一群隐形者手中,他们就是“人工智能背后的人工“为大数据提供服务与支持的数据标注员。有人说,数据标注员应该属于廉价劳动力,因此一些互联网企业的数据中心都选择设在了相对贫困的中国的贵州。还有人说这个行业能在中国发展起来,靠的是廉价劳动力支撑的,在这方面类似美国等发达国家确实干不过中国。
下面是前天在新浪网看到的一组介绍与人工智能-大数据-数据标注员相关的文图报道,看后感觉,在了解这些数据标注员工作生活状态的同时让人“涨知识”。
原标题:《人工智能背后的人工》
摄影 | Chin Chen 编辑 | 米杜 董淑云
新浪图片出品

人工智能,当今全球最炙手可热的前沿科技,已经悄然进入了人类生活的各个方面。人工智能看似高深莫测,但其背后必不可少的要素之一,供机器学习的大数据采集工作,如今依然出自人工之手。这是中国贵州大数据展示中心的时光隧道,在这里的深山之中,就有一群大数据采集者,他们是“人工智能背后的人工”。

贵州,曾经中国最落后的省份之一,近几年着力发展人工智能和大数据,一跃成为中国最炙手可热的高新产业区。这是在贵阳,一家互联网企业正在建设隐藏在山体隧道的大数据中心。2017年,根据中国国家信息中心发布的《中国大数据发展报告》,贵州的大数据发展政策环境指数居全国第一。截至目前,大数据产业对当地经济增长的拉动超过20个百分点。

从贵阳市区沿着刚修好的公路驾车50多公里,就到了百鸟河数字小镇上。小镇四面环山,人迹罕至。2017年12月,百鸟河数字小镇召开了人工智能服务论坛,渐渐为人所知。如今,这里吸引了不少外地的科技公司进驻。

这是小镇上一个容纳400多人的数据工场,电脑前坐满了来自附近一家扶贫高职的学生。学生来自各个专业,来这里主要进行数据标注的实习。所谓数据标注,即是把人工智能需要识别的数据,通过分类、画框等方式标注出来。譬如,把道路上的汽车、行人、红绿灯等框起来,用于自动驾驶的训练等等。

数据标注部接到了一个新项目,需要采集不同场景下的三十二套动作,学生们按照图纸中的指定姿势拍下照片。数据标注是劳动密集型行业,门槛并不高,一般经过几天的培训,学生们就能很快上手。

小纯是扶贫高职的一名学生,寒假期间来到数据工场进行实习。她每天从学校来到办公室的第一件事是打开电脑,那里有2000多个图片标注任务等着她完成。晚七点,小纯一个人继续留在公司加班,最近她和邻座的胖子比拼标注速度,为了赢过胖子,小纯利用晚上来赶工。

小纯在帮新来的学生装配电脑。虽然被分配到道路标注小组,但小纯对被自己框住的汽车一概不了解,她时常会好奇标注里的SUV长什么样,无人驾驶是不是真的安全,她还要不要考驾照等等。

小纯每天上班七八个小时,一个月能挣两千元,这对她来说是笔不错的收入。腊月二十七放寒假回家,小纯用挣来的钱给奶奶买了最喜欢的猕猴桃。从学校到小纯的家虽然只有几十公里,但也需要倒两趟车,再走一段山路。

在家里,小纯和堂姐、村里的小伙伴一起上山去摘蕨菜。与大城市不同,小纯的家乡属于贫困帮扶地区,网络闭塞,4G网络信号还没延伸到这里,村里面没几户人家能上网,更别提人工智能和大数据了。

小纯和奶奶、大伯母在阁楼里烧腊肉。小纯家买了半头猪熏成腊肉,平常奶奶一人在家舍不得,只有等小纯回来才切来吃。可是小纯回来刚两天,身体一直不错的奶奶突然患了一场大病,几天不吃不喝,卧床不起。这个春节小纯过得胆战心惊,还好离家前,奶奶病好了,现在也能走路了。

小纯房间的墙上,贴着许多初中时候画的画。虽然画画一直是她的最爱,却不得不因家庭贫困打消了学艺术的念头。小纯的父母常年分居两地打工,年前办理了离婚手续;哥哥不满父亲带后妈回家过年的举动,离家出走;小纯则几乎一个人扛起了全家的担子。

“我父母一生下来我,就没做到父母的责任,特别是我妈,每次打工回来一下就走。我小时候根本不认得我妈妈,就和奶奶最亲。有时候,我也不知道该不该恨我父母。如今,他们终于办完手续离婚了,从懂事以来,就觉得他们没有感情,离婚后,我好像终于放下了以前的恨。”小纯在附近的山上感慨道。

从家里回到公司,小纯的状态一直很压抑。傍晚下班,她在路旁看见一簇花开了,赶紧拿起手机过去拍,“花开很美,可惜白天没有时间去看它最美的样子。”小纯对自己的未来前途感到很迷茫,“即使数据标得再好,还是没有前途。”小纯一直梦想着,有朝一日能够通过自己的努力,走出这座大山。

与小纯渴望走出去的梦想不同,标注组长小广希望毕业后能继续留在这里打拼。小广是数据工场的元老级员工,见证了工场从几十人增至几百人的历程。2015年10月,他先是加入了扶贫高职的电子商务俱乐部,做跨境电商的产品分类,三个月后数据工场成立,他就进入到了数据标注部。

从数据标注员到质检员再到标注组长,小广用了整整一年的时间。从事数据标注的晋升之路极其狭窄,从组长升到经理的位置,还需要很多个年月。现在,小广手下管着十几个同学,他的主要工作是检查、指导组员的标注质量,并向主管汇报标注进度。

会议室里,主管正在和小光、小才两个标注组长商量周六日加班的事。这次标注衣服鞋子的任务被甲方退了回来很多,他们需要紧急加班交货才能拿到工资。数据标注的市场才刚打开,前一两个月,有些项目不能盈利,学生的工资还没发,有一些同学开始抗议。新调来的经理与小广和其他同学持续长谈之后,这场危机才总算是化解。

小广的电脑上摆放着几枚硬币,按照他的说法,这几枚硬币可以生出更多的财富。“以前项目不稳定,收入时多时少,一般我能拿到五六百。”小广说,现在项目产量多的时候,他一个月能赚五千多。春节期间,小广经济情况稍显宽裕,就给在浙江打工的妈妈买了一部1300元的手机。

早上八点,小广蹲在洗手间洗了个头,准备去上班。如今,小广已经把生活重心全放在了数据标注上,为了离上班地点更近些,小广从学校搬到了小镇上住。不过,小镇上没有什么生活必需品,每个星期,小广都会到县城里的超市买好一个星期的日常用品。

中午下班,小广邀请朋友来宿舍做饭吃。小广说,加入数据标注公司后,自己改变最大的是性格。自懂事以来,小广父母就在外出打工,他自己一个人在外婆家生活,慢慢地变得有点自闭。来到这里,小广开始和同学同事有了更多的交流,也开始了第一次恋爱。

休息的时候,小广习惯往窗外看。现在距离毕业仅有三个月时间,小广希望自己能留下来。“用通俗一点的话说,就是赚多点钱,养活自己和家人。”
前一篇:共享单车不是让你这样"共享"的