各位见知的小伙伴们大家好啊,三月的AI巡山报告又和大家见面了。本期报告咱们给大家聊一聊最近超火后来又被下架的蚂蚁牙黑的背后。
除了搞怪的蚂蚁牙黑,AI还有温度

相信大家最近都有被类似这样的搞怪视频刷屏,就是利用AI技术把照片中静态的人脸生成一段动态的表情。乍看起来似乎和以前本专栏聊过的deepfake换脸,对抗生成网络(GAN)很相似。其实技术在发展,这个新东东和之前的还是有一点差别的。它是使用一种叫一阶运动模型 (First Order Motion Model)的方法搞定的。底层原理和电影特效制作中的动作捕捉技术很像,许多年前的阿凡达电影就是这样实现的。

先通过学习把一个脸部的运动抽象为若干特征点的运动,然后再在静态的新的一张脸部图片上把特征点对应起来,让特征点运动从而带动脸部的表情变化,相当于给骨骼运动披上不同的皮肤,自然也就实现了换脸。所以从这里可以发现AI技术的精髓并不是把不可能变为可能而是让旧时王谢堂前燕,飞入寻常百姓家。以前拍电影才能实现的成本现在一个人在自己家的手机上就可以实现了,这是何等的效率提升啊。
但是很可惜这个东西没火几天就被封杀了,理由大概是过于危险可能会产生不了的社会影响,比如名人造假视频乱飞之类的。不可否认这些问题确实存在,也一定要去解决。但是用什么方式解决,笔者觉得还是可以探索的。因为同样的技术用到了好的地方就可以是另一个暖心的故事。国外就有这么一家公司做了一个网站让你可以把自己的老照片上传上去然后它给你自动高清、上色加生成表情动作,仿佛就是哈利波特魔法世界里的报纸真的实现了一般。

当看到自己妈妈年轻时候的照片对自己莞尔一笑的时候,当看到自己已经去世的爷爷的照片对自己颔首点头的时候,当看到自己小时候照片对你挤眉弄眼的时候,难道这不正是科技发展改变人们生活的价值所在吗?

也许有人会说这些好处和它可能带来的危险相比不值一提,但如果我们的对象是那些马航遇难者的家属呢?如果是那些孩子意外夭折的爸爸妈妈呢?如果是那些刚失去最爱的爷爷的孩子们呢?如果是那些深爱女神却久久得不到回应的备胎呢?对于他们来说意义又是几何呢?如果更进一步利用GPT-3的文本生成工具把已逝之人的历史聊天记录学习一下做一个机器人,再用语音合成工具把他的声音也合成出来加上之前的动图那么一个活生生的视频聊天场景不就复现出来了吗?如果真有了这样一个东西那么李焕英或许就能陪着她的玲儿再走很久很久。
只要人类有需求,新技术就会层出不穷的出现。技术本无善恶只是看如何去使用。从人类发明了纸币的第一天起,假币就是一个已知的风险,但是社会总是向前在发展,最终人们的选择一定是提高纸币的防伪技术而不是倒退回去使用沉重的金银不是吗?