欢迎来到中海德官网
   
分析人工智能领域7个备受瞩目的灾难性错误
来源: | 作者:中海德 | 发布时间: 2022-04-27 | 2219 次浏览 | 分享到:

2017年,《经济学人》宣称,数据已经超越石油成为世界上最有价值的资源。各行各业并一直将继续在数据和分析领域进行大量投入。但,数据和分析领域也有其阴暗面。

  根据《2022年首席信息官状况》报告,35%IT领导者表示,数据和业务分析领域将在今年推动其公司进行最大的IT投资。20%IT领导者表示,机器学习/人工智能将推动企业进行最大的IT投资。从机器学习算法驱动的业务举措和从分析工作中获取的洞察力可为企业带来竞争优势,但一些错误可能会使企业在声誉、收入甚至生命方面付出高昂的代价。

  了解数据以及其中所包含的信息,这很重要,了解使用的工具、数据以及牢记自己企业的价值观也很重要。

  以下是过去十年中关于在分析人工智能领域备受瞩目的错误,以及说明哪些方面可能会出现问题。

  人工智能算法可识别所有东西,但不包括新冠病毒

  自新冠疫情开始以来,许多企业都在试图利用机器学习算法来帮助医院更快地诊断或分诊患者。但据英国国家数据科学和人工智能中心“图灵研究所”(TuringInstitute)称,预测工具几乎没有带来多少影响。

  《麻省理工科技评论》(MITTechnologyReview)记录了许多失败案例,其中大部分失败案例源于工具训练或测试方式的错误。使用错误标记的数据或使用来自未知来源的数据是常见的问题起因。

  剑桥大学机器学习技术研究员DerekDriggs和他的同事在《自然-机器智能》(NatureMachineIntelligence)刊物上发表了一篇论文,探讨了使用深度学习模型来诊断病毒。该论文明确指出,这一技术不适合临床使用。例如,德里格斯的团队发现自己的模型存在缺陷,因为该模型是基于一个数据集来训练的,而该数据集包括躺卧患者的扫描图和站立患者的扫描图。躺卧患者更有可能患有重病,因此,该算法学会了根据扫描图中患者的身体位置来识别新冠病毒风险。

  一个类似的例子是使用含有健康儿童胸部扫描图的数据集进行训练的一个算法。该算法学会了如何识别儿童,而不是识别高危患者。

  由于购房算法的灾难性错误,Zillow公司损失了数百万美元,并大幅裁员

  202111月,在线房地产公司Zillow告诉股东,公司将在未来几个季度结束其ZillowOffers业务,并将裁掉25%的公司员工(2000名员工)。这家炒房公司的困境就是因为其用于预测房价的机器学习算法中的错误率所导致。

  ZillowOffers是一个程序,该公司通过该程序对某一房产给出现金报价,而该报价则是基于“Zestimate房产估价软件”的机器学习算法而得出的房屋价值。其想法是对这些房产进行翻新,然后迅速卖出。但Zillow公司的一位发言人告诉美国有线电视新闻网(CNN),该算法的错误率中位数为1.9%,而对于未上市房屋的错误率可能更高,高达6.9%

  美国有线电视新闻网报道称,Zillow公司自20184月推出ZillowOffers以来,通过此项业务购买了27000套房屋,但到20219月底仅售出17000套。新冠疫情和家庭装修劳动力短缺等黑天鹅事件也导致了该算法的准确率出现问题。

  Zillow公司表示,该算法导致公司无意中以高于当前预计的未来售价购买房屋,从而导致2021年第三季度的库存房屋跌价为3.04亿美元。

  在该消息发布后,Zillow公司联合创始人兼首席执行官RichBarton在与投资人举行的电话会议上表示,或许可以对该算法进行调整,但最终其风险太大。

  因超出电子表格的数据限制,英国丢失了数千个新冠病毒病例

  202010月,负责统计新冠病毒新增感染病历的英国政府机构“英国公共卫生部”(PHE)透露,在925日至102日期间,有近16000例冠状病毒病例没有上报。其罪魁祸首是什么?MicrosoftExcel表格中的数据限制。

  英国公共卫生部使用自动化流程将新冠病毒阳性实验室结果以CSV文件形式转入Excel模板中,然后用于报告仪表板和接触人追踪。不幸的是,Excel电子表格的每个工作表最多允许有1048576行和16384列。此外,“英国公共卫生部”按列而不是按行列出感染病例。当这些病例超过16384列的限制时,Excel表格会切断底部的15841条记录。

  这个“小故障”并没有影响接受病毒检测的个人收到他们的结果,但这确实阻碍了接触者追踪工作,使英国国家卫生署(NHS)更难找到和通知与病毒感染者密切接触的个人。英国公共卫生部(PHE)临时首席执行官迈克尔·布罗迪在104日的一份声明中表示,英国国家卫生署的测试和追踪部门和英国公共卫生部已迅速解决了这一问题,并已将所有未解决病例立即转移到英国国家卫生署的测试和追踪部门的接触者追踪系统中。

  英国公共卫生部实施了“快速缓解措施”,将大文件进行拆分,并对所有系统进行了全面的端到端审查,以防止未来发生类似事件。

  医疗服务算法未能标记黑人患者

  2019年,发表在《科学》杂志上的一项研究显示,美国各地的医院和保险公司使用一种医疗服务预测算法来找出需要加入“高风险护理管理”计划的患者,但这种算法不太可能单独挑出黑人患者。