文章列出了实现生成式人工智能(Gen AI)成功的十大挑战。这些挑战涵盖了从数据管理和法律法规到处理能力、解释能力、准确性问题等多个方面。文章强调,尽管Gen AI具有巨大的潜力,但要克服这些挑战以实现其在业务中的有效应用。这些挑战反映了目前Gen AI领域面临的关键问题和正在进行的研究工作。文章提供了对这些挑战的深入分析,对理解Gen AI的现状和未来发展具有重要意义。
企业计划实施生成式AI吗?这确实是个好消息!你可以将自己看作是众多也认识到这项变革性技术潜力的 IT 决策者之一。虽然生成式 AI 有望大幅提高你的业务效率,但它同样带来了一些必须面对和克服的挑战。
以下是实施生成式 AI 需要面对的前十大挑战,按重要性降序排列。
1. 不良数据
实施生成式 AI 的首要挑战是数据质量问题。如果不能确信你的数据准确无误、来源清晰,并且安全可靠,那么在开始之前你就已经处于不利地位。
虽然我们似乎已步入 AI 新时代——在这个时代,你最狂野的梦想似乎都能成真——但“垃圾进,垃圾出”这个老话仍然适用。
尽管数据管理可能永远是个挑战,但未来的发展仍然值得期待。自从 15 年前大数据热潮开始,各公司一直在努力理顺自己的数据基础,为构建更宏大的项目打下基础。
对数据管理的投资现在开始为那些投资公司带来回报,他们因为拥有高于平均水平的数据质量,能够立即利用生成式 AI。
2. 法律和监管问题
目前,你可以用 AI 合法做什么、不能做什么还存在一些争议。新的法律和规定正在制定,旨在限制组织使用 AI 的程度。因此,在商业采用 AI 方面,我们正处于一种灰色地带。
欧盟正在推进一项相对严格的法律。这项名为 AI 法案的新法律可能会禁止最危险的 AI 形式,如公共面部识别,并要求公司在使用 AI 进行招聘或大学录取等较不侵入性但仍可能有害的方式前获得批准。
美国在监管 AI 方面正追赶其欧盟同行,因此在 50 个州存在一种狂野西部的心态。乔·拜登总统在十月签署了一项行政命令,指示联邦机构开始制定规则,但这些规则不具有法律效力。
这种法律上的不确定性让大公司感到担忧,他们犹豫是否要投入大量资金来实施可能很快被禁止或严格监管的面向外部的 AI 技术。因此,许多 AI 应用正针对内部用户开发。
3. 计算能力不足
用户不仅需要强大的 GPU 来训练生成式 AI 模型,还需要用于模型推理。Nvidia 高端 GPU 的巨大需求已远远超过其供应。这对那些有能力在云中购买或租赁 GPU 的大公司以及 Nvidia 的股东来说可能是好事,但对于那些需要 GPU 时间来实施生成式 AI 的中小企业和初创公司来说,则是个挑战。
正如 HPCwire 的编辑 Doug Eadline 所描述的“大型 GPU 挤压”,这种情况短期内不太可能缓解——至少在 2024 年上半年不会。尽管 Nvidia 及其竞争对手正努力开发新的芯片设计,以更有效地训练和运行大型语言模型(LLM),但从设计到生产这些芯片需要时间。
因此,许多公司正在转向运行资源需求更低的小型语言模型,而不是大型语言模型。同时,也有努力通过压缩和量化技术来减小 LLM 的大小。
4. 可解释性和可解读性
即使在生成式 AI 成为企业董事会热议话题之前,可解释性和可解读性就已经是问题。就在五年前,许多公司就已经在深入思考如何应对深度学习——这是一种利用神经网络技术从大量数据中提取模式的机器学习子集。
在很多情况下,即使深度学习能提供更高的准确度,公司也倾向于采用基于简单机器学习算法的系统,原因是他们无法解释深度学习系统是如何得出其结果的。
作为生成式 AI 基础的大型语言模型(LLM)是一种神经网络,当然是在庞大的语料库上训练的——以 GPT-4 为例,其训练数据几乎包括了整个公开的互联网。
这就在解释 LLM 如何得出其答案时带来了巨大挑战。目前还没有直接的方法来应对这个问题。虽然已经有一些方法在出现,但它们相当复杂。这仍然是学术界、企业和政府研发部门积极研究的领域。
5. 准确性和幻觉
无论你的生成式 AI 应用多么出色,它都可能产生“幻觉”,这是该领域的专业术语。一些专家表示,任何被要求生成以前不存在的内容(如句子或图片)的 AI 都可能出现幻觉。
尽管专家们认为幻觉永远无法完全消除,但好消息是幻觉率已经在下降。OpenAI 早期版本的 GPT 错误率约为 20%,现在这个数字估计在 10% 以下。
有一些技术可以减轻 AI 模型产生幻觉的倾向,例如通过将一个 AI 模型的结果与另一个进行比对,这可以将幻觉率降至 1% 以下。减轻幻觉的程度很大程度上取决于实际应用场景,但这是 AI 开发人员必须考虑的问题。
6. 缺乏AI技能
与任何新技术一样,开发人员需要一套新技能来构建它。这在生成式 AI 中尤其如此,它引入了开发人员必须熟悉的许多新技术。但也有一些重要的注意事项。
不用说,将现有数据集接入大型语言模型(LLM),并在不违反法规、伦理、安全和隐私要求的情况下从中获取相关答案,需要一定的技巧。提示工程(prompt engineering)迅速出现,以至于提示工程师已成为 IT 中收入最高的职业之一,根据一项薪资调查,平均薪酬超过 30 万美元。
然而,在某些方面,与过去相比,使用预构建的大型语言模型(如 GPT-4)构建和实施 AI 应用时,生成式 AI 需要的高端数据科学技能反而更少。在这些情况下,一些基本的 Python 知识就足以应对。
由于文章篇幅有限,原文可以点下方链接了解:
创新指南|企业实施Gen AI面临的 10 大挑战
查看 1000+热门创新案例 请进入创新社区
Runwise创新社区是一个连接全球领先创新智库和专家,汇聚10+万专业企业创始人、创业家、创新提供者(咨询师/咨询顾问)创新研究学者参与的创新实践社区。
延展文章:
创新研报 | 金融机构敏捷转型白皮书:从“形似”到“神似” —— 敏捷转型成功之道
入门指南|Chat GPT 的兴起:它如何改变数字营销格局?
微软Garage 吸引7万+创新者,以黑客精神点燃企业创新火花