微信号:BigDataDigest

介绍:普及数据思维,传播数据文化

贫民窟的人工智能

2018-12-02 12:22 大数据文摘

大数据文摘出品

编译:Jiaxu、小七、夏雅薇


26岁的单身母亲Brenda住在非洲最大的贫民窟基贝拉,这也是全球最贫困的社区之一。


每天早上,Brenda从家离开,乘坐公共汽车前往内罗毕东部,和她的1000多名同事一起,在同一栋楼开始一天八小时的工作。


她的主要工作内容是建立训练数据集,将信息尤其是图像处理为一种计算机可以识别的格式:上传图片,然后用鼠标标记几乎所有内容,包括人、车辆、交通标识、道路标记,甚至是天空,尤其是要标记其能见度是晴天还是多云。


每天八小时,Brenda将对用于人工智能的数据进行标注。


这一切将服务于一个他们之前鲜有耳闻的概念——人工智能。从这里输出的数百万个类似的图像将流入人工智能系统中。以自动驾驶为例,这意味着系统可以开始“识别”现实世界中的物体了。而数据量越大,机器就越智能。


但这些技术成果或许永远都不会被基贝拉享受到。作为非洲最大的贫民窟,它有当前更迫切需要解决的问题,例如缺乏可靠的清洁水,以及众所周知的卫生危机。


他们的工作结果将由一位上级进行检查,如未达到标准,则将被退回。对于速度最快,标记最准确的标记师,他们的名字将荣登办公室附近的屏幕上。最受欢迎的奖励则是商场购物券。


为了确保每一个像素都被正确标记,Brenda和她的同事们每天工作时需要离电脑屏幕很近很近。


但没有人抱怨,“每个人都该做点与众不同的事,”Brenda对自己这份工作非常满意,“我相信我的工作将会对未来的人们有所帮助。”


贫民窟中的人工智能学校


Brenda所在的公司名叫Samasource。这是一家总部位于旧金山的公司,其客户包括谷歌、微软、Salesforce和雅虎。


大多数公司不愿谈及他们与Samasource合作的具体内容,因为这通常涉及的是公司未来的项目。但众所周知,Samasource 的前期数据整理是这些硅谷巨头在人工智能领域项目的重要组成部分。


Brenda 居住在非洲最大的贫民窟基贝拉中


似乎离这里无比遥远,但人工智能在这里依然带来了积极的影响。


BBC记者采访过程中驱车前往基贝拉的一座历史性建筑物,这座建筑物位于一条铁路线附近。在下雨天,建筑物被泥浆包裹。但自殖民地时期开始以来,它就一直有人在用。


一年多前,这座建筑物还是暴徒和军队之间的分界线。今天,它变成了一个蓬勃发展的活动中心,包括一所媒体学校和媒体工作室,一家自助餐厅。而一楼有一间机房,在这里,Gideon Ngeno向25名学生教授使用个人电脑的基本知识。


令人惊讶的是,即便是在基贝拉这样的地方,数字化程度也很高。智能手机十分普遍,充电器及相关配件也很容易找到,人们还会用MPesa 支付系统进行购买。


图像必须被精心标注,包括车辆,道路,标记。。。甚至是天空


但大部分的非洲地区跳过了个人电脑的时代。鼠标和键盘的组合对他们而言是一种陌生且繁琐的体验。Samasource员工告诉我,当需要查找资料时,公司里的大部分人常常会离开电脑直接拿出手机。


Ngeno教授的这项课程是专为想去Samasource或其他数字经济公司的人设计的。学费需要500肯尼亚先令,约合五美元。对于生活在贫困线以下的人来说这也不是一笔小数目。公司曾尝试免费授课,但没有了经济压力,出勤率和学员们的集中度都不尽如人意。


Ngeno说,最大的挑战其实是噪音。在我们讲课的同时,一群熊孩子正在窗外拿着乐器玩耍。教室外就是一个喧闹的市场。


“非洲硅谷”


相比之下,Samasource的位于内罗毕的办公室是这里城市化水平最高的地方。公司占据了商业园区其中一座建筑的四层楼,拥有大量用于数据处理培训的计算机。


SAMASOURE图像标注。这些数据讲帮助自动系统“识别”现实世界中的物体


如果你不看窗外的景色,你可能会认为你正置身于硅谷的一家科技公司。覆盖着瓦楞铁的墙壁在加州被认为是一种“后工业化风”,在这里却是一种标记,提醒着人们约75%的员工都来自贫民窟。


最令人印象深刻的是,Samasource克服了大多数硅谷公司正在努力解决的问题——性别歧视。


在这里,超过一半的劳动力由女性组成,结婚并不会阻碍女性的事业发展。长达90天的产假以及轮班模式的灵活性使该公司成为肯尼亚乃至全球范围内公司文化有包容性的典范。


负责管理人力资源的Hellen Savala说: “我们相信,如果公司有一名男性,他就能养活他的小家庭,但如果公司有一名女性,她不仅能养活她的小家庭,她还能担负起我们的大家庭。因此你会产生更大的影响力。”


廉价劳动力


Samasource公司数据产品的准确性和安全性是Google等大客户与他们合作的原因。但显然,这些公司倾向于在劳动力成本低下的地区雇佣劳力,当地人也迫切需要稳定的工作。


Samasource的目标雇佣人群是那些目前单日收入在2美元以下或从事危险的非正规工作的人。Samasource提供每天约9美元的工资。这对当地人的生活将会是一个巨大的改进,尽管对硅谷来说这些钱却微不足道。


Gideon Ngeno 在基贝拉的核心地带教授基本的数字技术


“是的,它具有成本效益,”Janah说。“但在我们的工作中至关重要的一件事是使我们支付的工资额度不会扭曲当地劳动力市场。如果我们向人们支付的金额远大于此,我们就会把物价整体抬高。这会对当地的社区住房和食物成本产生负面影响。


当然,还有一个更为重大的问题是这项工作的持续性。毕竟Samasource的主要业务是为自动化过程提供数据。如果创建数据的过程也变得自动化,公司将何去何从?


“大多数人都认为这是花十亿美元就可以解决的技术问题,”Janah说。


“我认为目前这只是炒作,如果你真的与数据科学家交谈这些算法背后的思想,你会发现机器比大多数人认为的要落后许多。


“市场将在很长时间内仍需要人工训练数据集。”


“它改变了我的一切”


成为一名数据标记师是一项无聊、重复且无休无止的工作。避开摄像机镜头时,一些工作人员会愿意聊聊他们如何减少休息时间,以应对工作压力达到公司目标。 Samasource的部分员工是不限工作地点的自由职业者,但在工作时间会有网络摄像头对他们的工作进行监管。


Idris Abdi搬出了贫民窟,并计划参与商业领导力课程


经我们观察,办公室内几乎没有人体工程学的设备来为工作人员服务。长时间的蹲伏、点击都将对视力和身体造成一定伤害。该公司已表示将对此采取改善措施。


Samasource相信它已经对发展中国家近5万人产生了积极影响;那些人要么在Samasource工作,要么得到过Samasource员工的支持。Samasource调查了他的前雇员,发现其中约84%的人找到了更正式的工作或接受了高等教育。


25岁的Idris Abdi是其中一员,他也因此搬出了贫民窟。


他说,“Samasource改变了我的一切,它改变了我的眼界,让我看到除了生活在这片土地之外新的希望。”


相关报道:

https://www.bbc.com/news/technology-46055595


【今日机器学习概念】

Have a Great Definition


志愿者介绍

后台回复志愿者”加入我们

 
大数据文摘 更多文章 万豪酒店宣称数据库被入侵,5亿用户私密信息或外泄! 超8千Star,火遍Github的Python反直觉案例集! 人脸分析:数据时代的“新玄学” 这些“秘密武器”,让你轻松跻身Kaggle前2% 我花了一年时间研究不确定性估算,写下了这份最全指南
猜您喜欢 FOX ENGINE中高超技术(2) 赛尔新闻 | 哈工大SCIR师生参加CCIR 2018 峰值从容应对,新浪微博基于Docker的混合云架构与应用实践 匆匆那年:高考后我们的故事! 听闻阿里将取消 UI 的招聘,取代以「全链路」设计,这是我们设计师的小小看法