重建模糊,低分辨率人脸图像的正经 AI,被人用表情包玩坏了
《恐袭波士顿》这部根据真实情况改编的电影有这样一个情节,警察在波士顿爆炸案发生后开始浏览各种各样的监控录像,意图找出那个行为异于常人的嫌疑人。
在监控录像中,爆炸发生时有一个人把头转向了相反的方向,警方因此锁定了犯罪嫌疑人。
▲ 电影里的技术总是很高端. 图片来自:《碟中谍 4》
在电影中,警察或许只需要对控制监控的操作员说「放大,再放大!」屏幕就能清晰地呈现嫌疑人的大脸,旁边还配上他的生平年月、家庭情况、现居住址……
现实情况就很一言难尽了,谁知道录下嫌疑人的监控摄像头是几年前装的呢?这时候如果你只会说「放大,再放大!」那你估计就只能看到一个色彩均匀的像素块了。想只凭借监控就锁定犯罪嫌疑人,就目前的硬件条件而言还太难了。
▲ 图片来自:《恐袭波士顿》
硬件跟不上,那软件呢?最近,研究人员就展示了 AI 可能为此作出怎样的贡献,它或许可以帮助我们在不失真的情况下恢复人脸的基本特征。
研究人员通过 AI 可以重建模糊、低分辨率的人脸图像,使之更清晰、分辨率更高,更接近于真实的人脸。这一进展来自于人工智能研究的一个领域,被称为「人脸超分辨率」,该领域专注于从失真或低分辨率图像中重建更贴近真实的人脸。
最近在一个机器学习会议上,韩国高级科学技术研究院的研究人员发表了《通过对面部标记的关注,逐步提高人脸的超分辨率》的论文。研究人员在论文中提出了一种新的人脸识别方法,该方法可以生成 8 倍超分辨率的人脸图像,并完全保留面部细节。
▲ 像素图像,还原图像和真实图像的对比
为了锻炼 AI,研究人员采用了一种渐进的训练方法。通过将网络分成连续的步骤进行稳定的训练,每个步骤的输出的分辨率都在逐渐提高。他们还提出了一种新的面部注意力丢失方法,通过增加像素差和热图值来更好地恢复面部属性。除此之外,训练 AI 还用了最先进的人脸对齐网络提取出适用于人脸 SR 的热图,以此减少训练时间。
实验结果证明,研究人员的方法在定性、定量测量、感知质量等方面都优于目前最先进的方法。利用人工智能的能力,我们从像素化的初始图像中识别一个人会变得容易得多。
当然,这毕竟是 AI,还是有很多令人觉得啼笑皆非的成果。
Twitter 用户 @ jonathanfly 就把我们平常用的表情包模糊成像素块去让 AI 完成挑战,表情包模糊后的大小正好为 16×16 像素。结果 AI 还原出来的结果有点「可怕」,本身像素化可爱风的鼻子眼睛都变成了真实向的人脸,看上去有点搞笑,变成了我们常用的魔性表情包。
但用真人照片像素化之后,正常的图片还算贴近原貌。
如果调整了像素块图片的对比度,对齐人脸效果稍稍偏离就可能造成还原人脸的鼻飞眼斜。
如果你把披萨像素化之后再识别,那么香肠也会变成性感红唇。
不管是多奇怪的图像最后都能长出人类的五官。
毕竟 AI 还是靠着我们教给它的东西在做图像重建,所以还原出这些偏向人脸的效果其实也不让人意外,目前还没那么完善也可以理解。
博客 I Forced A Bot 还尝试了将像素化图片从 16×16 调整到 128×128,然后再降低到 16×16。通过这样的处理,他通常得到的都是一个更贴近真实人脸的结果。因为图像更模糊能为 AI 的还原工作提供了更多创造性解释图像的空间。
I Forced A Bot 还发现了一个论文中没有公布的细节,有些生成的人脸图像脸上会有黑色的不明物,博客作者将其成为「哈利波特的伤疤」。
到这,这个 AI 已经被人拿来做了各种各样表情包的尝试,看上去已经被彻底「玩坏了」。
但我们还是要承认,只要你不要把 AI 用在表情包还原上,那么专注于模糊图像还原的 AI 还是有非常积极的作用。如果在某个案件中捕捉到的嫌疑人图像过于模糊,那么 AI 很可能会成为呈现犯罪嫌疑人相貌的最后一环。
不过现有的技术还无法用于刑侦勘察,我们还是只能等它学成归来,再报效人类。
题图来自 Pixel Art Maker。
不太有趣,不太乐观。
欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: