提供丰富的网站建站技术
及域名注册/SSL证书服务

机器中潜在的偏差

尽管近年来的科技里程碑-人工智能(AI)不断发展,但依然会遭受到非预期事件的影响。例如,2016年,微软在 Twitter 上发布的一个人工智能驱动的聊天机器人 Tay,后来这个机器人被平台上的同龄人带坏,在推特上发布种族主义和非常不适当的言论。由于无法覆盖社交学习中的恶意信息,Tay的帐号最终被关闭,但仍然保持私密。

还有其他一些和Tay如出一辙的AI失败案例也相继浮出水面。其中谷歌的图像识别软件最受人关注。Google Photos在将一些非白人用户标记为“大猩猩”后被指控为存在种族歧视。Google声称此事件为非故意伤害,但是将一个被忽视的代码转化为种族问题依然是一个令人担忧的问题。

不幸的是,像微软和谷歌的算法仍然依赖于人类输入,而且其环境还受到算法参数的限制,因此Tay无法确定互联网恶意破坏的真相,Google Photos也无法将一些非白人用户和大猩猩区别开来。然而这种问题存在更多的算法中,远远超乎我们的想象。

机器是人类交互的产物

随着人工智能的发展与出现,人类就成了AI的傀儡师。人机输入可以指导机器进行信息处理,从而对数据集进行分类。在其最简单的形式中,AI分析已知值数据库中不常见的信息,以得到正确的结果。就像人类学习一样,算法

中的索引图像越多,那么软件处理的结果就越精确。如果您使用数百张猫咪图像来训练算法,则会对未曾被视为猫的暹罗人照片进行分类。但是,在受控环境中使用典型或完美图像训练算法时,可能会形成问题。如果开发人员不使用代表不同条件的数据来训练这些机器,则可能会出现并发症。

这些问题甚至会出乎意料的对图像处理软件造成影响,如条形码识别。标准1D条形码由包含编码值的黑白相互交织宽度不一的条码组成。扫描仪通过分析条码之间的宽度并将其与预选的参数集进行匹配来处理宽度。如果由于光线不良或打印质量差,而导致条形码不明确,则计算机无法对编码数据进行解密。在这些情况下,计算机能够检测各种潜在的匹配,但需要额外的信息来识别正确的值。

误读条形码可能会导致用户误收错误的在线订单产品。在医院,条形码可以识别患者的关键健康信息,如药物特异性过敏;不正确或部分扫描可能导致严重后果,如过敏性休克甚至死亡。经常性不得不纠正机器错误会导致用户容易受到这些错误所带来的负面影响。

精确度要求全面的信息输入

举例来说,使用光线充足、清晰的完美照片来训练扫描仪识别图像。事实上,条形码通常是不完美的。运输标签上的条形码可能会在运输中容易变形,导致加工时出现错误。为了先发制人,开发人员需要发挥各种条件优势,并在构建算法时扩大输入信息范围。

虽然创建一个具有明确数据集的综合数据库似乎是合乎逻辑的,但事实上,大多数情况都有一些模棱两可。当算法包含尽可能多的输入信息时,人工智能(AI)驱动的机器会带来高度精确的分析,但这也不是一个万能的解决方案。

条形码扫描器在扫描时,需要使用不完美条件下的代码对算法进行练习。对于像Google 的图像助手这样的应用,将软件暴露于各种各样的主题可以使其正确识别并达到预期的结果。像任何优秀的老师一样,开发人员必须创建一个现实的环境,计算机可以用来处理并对比功能。例如,一个人同时看到老虎和斑马,并且能够基于他们所了解的知识区分出这是两个不同的物种。但是,如果没有适当的训练,计算机看到条纹会假设一个与之相似的类别。人们都知道,将斑马和老虎归为同类是不合逻辑的,但是计算机需要全面的信息输入才能清楚的解读二者之间的差异。

大量的信息输入也将暴露出与人类相同的偏差,所以机器如何解译输入信息和特征是一个重要的因素。随着图像识别技术的不断完善,开发人员需要意识到他们在解决方案中使用的图像及其对技术、谷歌和社会所带来的影响。

未经允许不得转载:自助建站资讯网 » 机器中潜在的偏差
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

为您提供权威 丰富的网站服务器资讯