人类帮助训练他们的机器人替代品
编者注:AImotive的注释工具可将注释速度提高15倍。这个故事在这个故事的原始版本中是不正确的。
要让一个人离开驾驶席,需要让很多人在后台工作。
使用从公共道路测试中收集到的大量数据来开发用于操作自动驾驶汽车的计算机中的人工智能。但要有用,必须对数据进行广泛标记-这种称为注释的过程可能需要数百个工时才能收集一个小时的数据。
加利福尼亚州芒廷维尤的自动驾驶初创企业Drive.ai的首席执行官Sameep Tandon说:“数据注释非常耗费人力。每个小时的数据收集需要近800人的小时才能进行注释。您打算如何缩放?”
为了满足自动驾驶汽车部署的严格时间表-一些制造商希望在5年内推出在规定条件下无需人工干预即可运行的4级自动驾驶汽车-从事人工智能技术的公司必须找到一种在不牺牲质量的前提下加快注释速度的方法。
Drive.ai的Tandon:“数据注释非常耗费人力。”
期权公司追求的目标包括将智能手机用户外包,并首先重新利用他们正在开发的技术。即使自动驾驶汽车投入生产,这些过程也将很有价值,可以教会汽车如何在瞬息万变的运输环境中安全互动。
Tandon说:“从长远来看,我们很可能需要某种形式的数据注释。”“未来的新情况将会出现,今天的汽车将不会经常出现。”
一台计算机的Premkumar Natarajan说,在过去的十年中,深度学习算法,移动设备,强大的传感器和图形处理单元(可以在一秒钟内评估数千万次操作)已经融合在一起,形成了一个功能强大的驾驶“大脑”。南加州大学信息科学研究所的视觉专家。
这些系统虽然功能强大,但需要学习许多情况细节,例如在左车道上更快行驶或阅读行人的肢体语言,以了解他们何时可能走进街道。
工程师通过向计算机提供数千张图像(通常通过研究车辆上的摄像头收集)来“教”这些情况。但是,如果没有标记和标记对象,这些图像对计算机而言就没有任何意义。标签有助于系统区分路线上的障碍物。
西雅图的人工智能培训初创公司Mighty AI首席执行官Daryn Nakhuda说:“最终,计算机将按照您所提供的东西工作。”“它需要足够的对与错来真正了解它在看什么。”
尽管计算机处理信息的速度比人类快许多倍,但是学习仍然是渐进的,并且可能被错误或不正确的信息所抛弃。
匈牙利初创公司AImotive欧洲销售主管Bence Varga说:“该系统像人的大脑一样缓慢学习。”“它看到的所有东西都必须正确标记。”
瓦尔加(Varga)估计,一台计算机可以安全地学习交通情况,需要大约100,000张图像和一周的教学时间。强大而全面的培训包括来自世界各地以及一天中不同时间(交通规则和情况千差万别)的图像。
瓦尔加说,由于行人和其他难以预测的变量,城市驾驶比公路驾驶更加劳动密集。
强大的AI可以利用智能手机所有者来注释行驶数据,从而减少轮廓和标记图像所需的时间。
训练需要大量图像,并且需要准确性,因此详细的数据注释对于确保自动驾驶汽车在公共场所的安全使用至关重要。
为了确保正确标记数据,一些公司正在以老式的方式手工处理数据,这需要大量的人工。
尽管Mighty AI只有大约50名全职员工,但它通过将数据注释外包给使用智能手机的任何人来满足高劳动力需求。
Nakhuda说:“我们有一个社区,可以在其中分配负载。”“我们试图将其分解成一口大小的碎片。”
该初创公司通过其Spare5应用程序实现了这一分发,任何人都可以下载。该应用程序将数据注释显示为一系列任务,在这些任务中,将为用户提供图像并执行标记活动,例如在行人周围画图框,勾勒出车辆轮廓或像标记单个像素一样详细。用户必须通过完成培训练习才能胜任这些任务,并为每项任务支付约10美分的报酬-这通常需要在图像中标记一种类型的物体,例如行人或汽车。
被证明是熟练注释者的应用程序用户必须先审核其他用户的工作,然后才能将其返回给Mighty AI。
“对我来说,这是一种放松,”阿拉巴马州萨默代尔市Spare5用户Iris Hanlon说。52岁的汉隆(Hanlon)是一位残疾的单身父母,在寻找额外收入来源时碰到了该应用程序。
该应用程序未带来可观的收入,但它已成为她放松的一种简便方法。汉隆说,数据的目的对她而言并不重要。
她说:“我画像素,以便计算机可以识别物体。”“但是说实话,我对自动驾驶汽车有点紧张。”
尽管Mighty AI的方法在使人员保持联系的同时加快了数据注释的速度,但其他公司也在寻找使流程自动化的方法。
那库达:将数据分解成碎片。
瓦尔加说,AImotive已经开发出一种半自动方法,可以标记视频而不是单个图像。系统还可以在贴标机绘制注释之前建议注释,这样可以节省时间。
他说:“我们利用软件工程师的技能来构建注释工具,该注释工具可将注释速度提高15倍。”他补充说,必须进一步提高速度以扩展操作规模。
Drive.ai的Tandon表示,视频游戏已被证明是自动驾驶汽车的仿真平台,非常有用,它带有标记的数据,使它们成为更具吸引力的工具。
Drive.ai也在努力将其标记过程自动化,将人工智能技术应用于其注释系统。该系统观察人类注释数据,然后尝试任务本身。
人工审核者可以纠正其错误,使其能够学习和改进。
坦顿说:“这就像训练轮。”“人类不必像以前那样做很多工作。他们没有纠正每辆汽车的标签,而是在纠正算法错误。自动化程度越高,人类要做的事情就越少。”
专家们预见了一个更加高效的未来,在这种未来中,车辆可以自行学习并适应新的情况,从而将人员排除在外。
USC的Natarajan说:“这是圣杯-无监督的学习。”“但是谁知道什么时候会成为现实呢?”