如何鉴别图像是否是 AI 创作

更新时间:2024/08/20, 21:02

人工智能的幽灵如何成为一种武器

总统候选人唐纳德·特朗普社交媒体帖子的截图

本周,总统候选人唐纳德·特朗普通过暗示卡玛拉·哈里斯在竞选集会上人群众多的照片是由人工智能生成的,抨击了对手。

在Truth Social上的帖子

主流新闻媒体立即指出,特朗普没有实际证据支持这一说法。当然,这并没有平息谣言。

我是一名在摄影和人工智能领域拥有超过14年经验的人工智能专家。在审查卡玛拉·哈里斯的照片后,这是我的看法,以及我对这些照片是否可能是由人工智能生成的结论。

人工智能的错误之处

为了评估特朗普的说法,让我们首先看看人工智能图像生成器通常会出现的错误类型。

支持特朗普人工智能说法的人经常引用各种表面缺乏反射的理由,以此为理由称哈里斯的照片是由人工智能创建的。

事实上,传统上操纵的图像通常缺乏逼真的反射。例如,这可以是识别Photoshop图像的一种方法。

但根据我的经验,人工智能实际上在生成令人信服的反射和阴影方面做得相当不错。

人工智能确实擅长的是生成需要特定程度细节的图像细节。

手是经典例子。人类的手(除非受伤或其他医学差异)有五根手指。数字五是具体的;三根手指是问题,而七根肯定不行。

问题在于人工智能实际上并不理解它所描绘的事物的本质。它不知道人类的手上有五根手指,甚至不知道手(或人类)是什么。

在训练时,人工智能模型看到成千上万张图像,其中一个人的一个或多个手指被遮挡。

也许训练照片中的人物手中拿着东西,或者他们的手倾斜以一种遮挡了一些手指的方式。

即使只有三根手指可见,我仍然有五根手指!

人类看到这些图像并意识到 - 即使一些手指被遮挡 - 图像中的人物很可能仍然每只手上有五根手指。

人工智能无法做到这一点 - 它只遵循训练数据中的统计模式。

因此,如果人工智能系统的训练数据中存在错误的模式,系统将在其输出中反映该模式。

这不仅适用于手,还适用于场景中的其他细节 - 人群中人们的手臂数量,他们头部的形状等。

出于类似原因,人工智能经常无法创建拼写正确的单词。

单词是图像中具体性的最佳例子。改变字母的顺序、方向,甚至字体都会完全改变单词的含义。

由于单词非常具体且对上下文非常敏感 - 以及人工智能系统擅长的具体性不佳 - 人工智能图像通常包含拼写错误或不准确的单词。

为什么哈里斯的图像不是由人工智能生成的

基于人工智能图像中的这些常见失败,我可以肯定地说卡玛拉·哈里斯的图像不是由人工智能生成的。

为什么?它们充满了准确、具体的细节。

让我们从哈里斯竞选集会照片中的人物开始。它们被准确呈现;我没有看到任何重复的手指、奇怪的额外附肢或其他人工智能经常出现的错误。

这在一些较大人群场景中尤为明显。人工智能可能能够生成一个小人群的图像,其中每个人都是准确的,但生成数百人的人群的高分辨率图像超出了系统当前的能力。

这是我使用Midjourney,一个流行的人工智能图像生成器创建的图像示例。我要求“一场竞选集会上的大人群。”

竞选集会上的人群的人工智能图像

乍一看,图像看起来相当不错。但是如果你放大,你立即开始看到具体性错误 - 人们缺少头部,身体突然中断等。我用橙色圈出了一些。

人工智能图像,显示具体性错误

相比之下,实际哈里斯集会的照片没有这样的扭曲或错误 - 即使放大。

每只手都属于一个人。头部齐全。手指逼真。

来源:哈里斯竞选活动通过X

然而,最有力的证据在于哈里斯照片中标语和其他基于文本的元素的出现方式。

在我审查的所有照片中,标语的文字拼写正确。它们在字体和布局方面在不同标语之间也是一致的。

最大的线索在于人群中有些人拿着倒挂的标语,但文字仍然准确。

详细视图显示一个倒挂的标语,通过发布在哈里斯竞选活动的X账户的照片

如果人工智能在创建一致的文本方面表现不佳,那么在创建准确的转换/转置文本方面,它就是_真的很差_。

再次强调,当文本正确定向时,人工智能通常无法正确识别文本。在市场上任何人工智能系统基本上无法创建准确的同时又是倒置和反向的文本。

我通过要求世界上最好(也是最昂贵)的几个人工智能系统创建一个带有简单文本“Hello World”的倒挂标语来测试这一点。

它们都失败了。

综上所述,哈里斯竞选照片中元素的具体性 - 以及包括一致和始终转换的文本 - 证实了它们不是由人工智能生成的。

除非哈里斯竞选团队拥有一种超级强大的人工智能,没有人听说过,也没有人意识到他们正在训练,而且有数十亿张显示倒置文本的输入图像,否则他们将无法使用人工智能生成这种类型的图像。

更大的画面

因此,根据我的专业分析,哈里斯竞选团队的图像是真实的。

然而,更有趣的是,特朗普认为可以通过提及人工智能来质疑她的图像。

人工智能图像生成器不太可能很快被用于操纵选举。然而,人工智能的存在本身就带来了另一个问题。

当每张图像都有可能是假的时,对手很容易指出一张真实的图像,称其为人工智能生成的,并立即对其真实性产生怀疑。

在选举背景下,这是一个巨大的问题,但在任何使用图像记录世界的情况下,这也是一个问题。

例如,战争罪行和其他暴行通常是以照片形式记录的。当独裁者可以指出这些图像,将其标记为人工智能生成的,并因此免除责任时,人工智能的幽灵 - 而不仅仅是技术本身 - 就成为一种武器。

同样,在法律案件中,辩护律师可以轻松声称图像是由人工智能生成的,并制造足够的怀疑以使他们的客户被无罪释放。

特朗普的策略是一种新颖的策略:将你不喜欢的任何事物标记为人工智能,并希望人们相信。他不会是最后一个使用这种策略的人。

那么面对来自人工智能的这种新威胁,我们该怎么办呢?

答案是我们可以像处理有争议的信息一样 - 查看信息来源。

我知道哈里斯的图像不是由人工智能创建的最大原因 - 超越技术方面的原因 - 是因为它们是由我在新闻摄影行业的同事们在像_美联社_这样值得信赖的组织中创作的。机构对于允许提交照片的人非常挑剔,在行业内存在自我监督的过程,以排除任何不准确的内容。

在一个我们永远无法完全相信一张图片是否仅基于其技术优点生成的世界里,这种信任变得更加重要。

最终,在人工智能的世界中,技术上的信任是不可能的。唯一的选择是确保我们信任的不是图片本身,而是制作它的人。