“人工智能排除原住民的声音是历史的重演”

The exclusion of indigenous voices in artificial intelligence is a historical repetition.

全球人工智能设计和实施的领域不断多元化,对用户友好的生成式人工智能引领其增长。在线上和线下的无障碍空间进一步发展中,人工智能的作用仍在孵化中。

Meggan Van Harten是Design de Plume的战略领导者和合作伙伴,Design de Plume是一家位于加拿大的土著所有、女性主导的创意机构。Design de Plume的商业和设计理念融合了Van Harten所称的“万花筒”式的多种世界视角:土著性、包容性、多样性、公平性、可持续性和无障碍性。该公司是在Van Harten作为平面设计师的早期职业生涯之后成立的,她和合作创始人希望为主流数字设计中缺失的视角增添一个新的视角。

Design de Plume将这些原则直接融入服务和解决方案的框架中,比如最近与加拿大土著保护和保护区(IPCA)知识篮子的合作项目,这是一个用于土著领导的加拿大保护路径的数字信息共享平台。该公司因此项目获得了2023年DNA巴黎设计奖。

作为战略家和公共演讲者,Van Harten特别关注土著无障碍性。这位在安大略省工作的设计师表示,排除土著人民的文化和语言模式在无障碍标准和合规性中,对于使通信对土著社区可访问性留下了巨大的空白。

即使人工智能的兴起引领了所谓的技术创新和自动化的新浪潮,差距并没有缩小,事实上,它似乎正在扩大。

作为数字技术和空间设计的合作者,Van Harten及其同事敦促更多人评估整个无障碍系统,以探究如何使辅助技术、网络服务甚至人工智能驱动的工具(如实时转录和图像生成)对土著群体更有意义,并包容他们的需求。

在与ENBLE的Chase DiBenedetto谈论这项工作和使命时,Van Harten谈到了人工智能创建中的失败、不断发展的无障碍标准的需求,以及如何将土著视角纳入技术创新的首要步骤。

ENBLE:在你的工作中,“纳入土著性”是什么样子?

Van Harten:有这样一种观念,叫做“双眼看见”,同时利用西方原则和土著知识的最佳部分。你用双眼来完成这个任务。这在Design de Plume的文化中非常重要,也是做好设计的文化:汲取两个世界中最好的部分。我喜欢术语“开放的杯子”或“空杯子”,让别人把知识填满你,这样你就可以在一天结束时提供一个好的解决方案。这并不是一个新概念。对于美国企业来说可能是新的,但实际上并不是。这对土著的知识方式非常基础。

例如,我们与客户进行的参与会议方式。我们总是谈论它更像是一个圆圈,没有人处于控制地位或高于其他人,每个声音应该得到平等的代表。这样,我们能够创造一个更具包容性的环境,并专注于我们一起解决项目的想法。作为一家机构,我们不会带着过去的设计趋势或设计工具来参与。这可能对你遇到的每一个第一民族群体或每一个土著群体都不一定适用。你必须真正开放,成为一个安全、开放的空间,让人们与你合作。

你发现土著群体在无障碍设计中经常被排除在外,特别是在新AI工具的开发中。

就人工智能而言,实际上非常困难。技术中存在很多偏见,以及它的开发方式。当解决问题时,土著人民往往没有被咨询。我的意思是,如果他们被邀请参与,他们往往是在项目结束时被问,“这个过得去吗?”这不是良好的参与。你需要从一开始就让这些人参与进来,向他们解释问题,让他们参与解决问题,并为这些努力进行补偿。例如,字幕的一些困难,比如自动语音识别,非常困难。

你能详细说明实时字幕,或者更广泛地说,自动语音识别如何让这些社区失望?

例如,我刚刚下载了一场我做的现场演讲的文字稿,它把一个词从“Anishinaabe”(一个大型土著群体)改成了“Honest Nabi”。所以它完全扭曲了语言。我提到了一群人,它甚至无法理解。即使有一个直接的英文翻译…土著语言的工作方式是非常有意义的,每个字母和字母组合都有下层意义。对于这个特定的词,有很多有意义的细微差别被忽视了,尤其是在实时字幕的情况下。

在最近一篇关于3PlayMedia的2023年自动语音识别报告的ENBLE文章中,这家辅助服务公司表示,自动语音识别的准确率约为90%,但需要提高到99%左右。但是当涉及到土著语言时,准确率实际上为零。这是我们目前所处的严酷现实。我们构建技术、设计系统等方面的方式正在进一步促成一种文化灭绝和语言消除的文化。

通用设计的概念,即产品和空间应在开始时考虑完全无障碍的理念,是否是一个解决方案?

在制定标准、合规法律等方面有很多工作。但对土著人民来说,基础并不存在。在辅助服务领域,人们常常提到ADA合规性(或者在我所在的地方是AODA)只是地板,而不是天花板。对土著人民来说,这只是一个巨大的鸿沟。他们就会陷入这个漩涡中。他们的语言中没有可访问的语言系统,也无法同时开发基于两种语言的工具。

令人沮丧的是,我们已经有了这些想法。这些工具在某种程度上是好的。我们有字幕是好的。但是可怕的是,当我向系统拼写时,它无法理解我实际上想说什么。

我认为随着生成型人工智能的兴起和对其不断创新的投资,这个问题应该已经得到考虑。

当然。为什么我不能与AI提前交流呢?如果我要用某种语言进行演讲,让我教会你如何说。但我不能这样做。目前最好的解决方案是实时转录和实时字幕。这很好,但很多组织没有资金提供实时字幕。所以我必须警告他们,[自动]字幕将毫无意义。

这种完全的脱节是否有结构上的原因?

非常重视单语言无障碍支持,所以你有一份英语文档或法语文档,它将用英语或法语读给你听。但在土著语言圈内会发生什么情况,通过种族灭绝和歧视,部分语言已经失传?即使你开发了一个系统,可以完全用英语读出这一页,用另一种土著语言读出那一页,你可能仍然会完全错过概念,因为目前没有好的方法将两种语言嵌入到同一份文档中。任何辅助技术都无法做到这一点,因为重点是西方的思维方式,即一切都是分离的。

您是否在其他流行的人工智能应用情况中发现了这种单一关注的问题,比如图像生成或聊天机器人?

图像生成软件在设计领域非常有趣。你经常会听到这种“这个可以像Photoshop那样处理得很好。看起来很棒。”但那纯属胡扯,特别是当涉及到代表土著文化和原则时。

您有例子吗?

在加拿大的一些原住民文化中,我们有一种叫做“Medicine Wheel”的东西。这个符号有很多含义,它是一种治疗工具。我使用了图像生成软件,并输入了“Indigenous medicine wheel”。就是这样。并不复杂。如果你在Google搜索中输入这个,你会得到一个真正的Medicine Wheel。

但是图像生成软件返回的东西却是垃圾。有些图片上是一个盘子,上面有许多不同的东西。我以为它可能将其解释为食物。食物可以是医药,对吧?食物可以是治疗的。但当我放大图片时,我意识到,“这些是蜗牛壳。那是一支香烟。”仅仅是一些随机的纹理,被拉来制作一个“很酷”的图片,但从根本上失去了意图和土著文化原则。

我也在替代文本生成工具中看到了类似的情况…我认为如果人们能使用替代文本生成器之类的东西,至少可以有一个良好的起点。但如果没有意图和包容性的基础,你无法拥有这个起点。

那么,我是否担心人工智能会取代我的工作?不,一点也不担心。

除了对人工智能创新的热情外,似乎还存在一种对人工智能能力的担忧文化。

如果我们说人工智能正在创造一种恐惧文化,那是因为它没有代表人们。

你谈到要让一款人工智能助手完全“理解”土著语言或文化,同时提供服务。这需要什么?

我认为理解是一种协作的技能。现在人工智能非常棒的一点是可以与之对话,帮助它并使其成长。因此,在更多系统中提供这样的工具将有助于理解。你可以告诉它:“嘿,你说的其实是有害的,它延续了刻板印象。我们应该停止这种说法。”我希望看到这种工具更广泛地应用于这些系统中。

但是,在发布产品之前,仅仅期望世界通过与之互动来修复它,在开始阶段就要让人们参与其中,帮助影响它。邀请一群多样化的人与该人工智能对话,以便它能够理解互联网上有很多垃圾,或者人们会填充进去的东西。

实际上,一款全面包容、全面的工具是否可能存在?或者这是一种不应该委托给技术或基于人工智能的服务的东西?人在其中是否足够?

我认为,如果您以更包容的方式构建技术,并愿意采取一种破坏性的前进道路,重新思考以前的方法,这是可能的。

作为政府、公司或科技巨头,他们需要讨论的一个重要领域是,他们愿意排除谁?土著人是北美增长最快的人口之一。因此,如果不在开发中考虑这些工具的原住民性和包容性,我们将排除掉这一庞大的人群。这不是由土著人民来解决每个问题。实际上,应该由有资金实现它的人并愿意重新思考他们的过程以良好方式前进。

计算机无法伪造共情。它无法理解共情。同样的道理也适用于人类。如果他们没有共情能力,那么他们将无法理解为什么这很有意义,为什么我们在谈论这个特定问题。但正是人类层面的共情能力,才是我们实际上解决这个问题、解决它的方式。