十一长假回来的第二天,让我们用最新的AI资讯为大家把长假中的快乐延续下去。
什么,AI也能做发明家了?咦,图片放大再也不受限制了?朋友们再也不用为图片缩放之后看不清而担心了!欲知详情,小伙伴们快伸出你们小手往下翻!
一、AI 也是发明家
八月六日,DABUS被认定为分形食品容器与能够引起更大注意力的警示灯的专利发明人。有人在想,好消息是因为多了两个专利吗? 专利天天有,多了两个专利有什么特别值得高兴的呢?其实真正值得高兴的是DABUS 不是一个外国人名,而是一个人工智能系统!DABUS 的全称是“device for the autonomous bootstrapping of unified sentience”(统一感知自动引导设备)。根据Imagination Engines Incorporated对DABUS的解释,[2]它的脑内存储着大量的数据,它能够把一些简单的概念进行组合,从而引发一系列的记忆,形成自己的想法。这也就意味着 ,人工智能(AI)可以跟人类一样被认定为发明家!惊不惊喜,意不意外?
[2]上图:在某一刻,神经网络中的A,B,C,D互相连在了一起,并最后分泌了神经介质(红色的点,也可以理解为一些新的想法)
左图:DABUS 所发明的分形食品容器,其形状有利于堆叠与被机械手臂操作
右图:通过特定的模式模仿人类神经活动、从而吸引更多注意力的警示灯
然而,让人工智能被认定为发明家的过程可谓是一波三折。DABUS的开发者Stephen Thaler为了让DABUS获得两项专利的所有权,在两年间向欧盟及十几个国家的法院提出,全部被驳回了,理由是人工智能不具备专利的所有权,只有人类才可以。然而Thaler并没有放弃。他一直认为:在分形食品容器与能够引起更大注意力的警示灯的专利发明过程中,自己并没有做出任何贡献,都是DABUS自己的想法。终于,在他和法律团队的不懈努力下,南非与澳大利亚认可DABUS为分形食品容器与能够引起更大注意力的警示灯的专利的发明人。
有些人认为:专利一旦申请成功,就可以被大众所看见。如果是像分形食品容器这种对社会有利的专利,这种透明性会使得大众收益。但AI毕竟是AI,充满了不确定性和不可预测性,一旦发明的专利对社会有害,这种透明性就可能产生负面的影响。因此,专利的审核部门可以对专利内容及其影响进行评估,再决定是否对外公布。这样也可以在一定程度上不用太过担心AI成为专利的拥有者。
再者,如果DABUS被认为是专利的拥有者,那么这会鼓励人们多去开发更为高级的人工智能系统。也不是说这样不好,只是这样一来人类所拥有的专利数将远少于AI所拥有的,因为人们都去花时间在开发高级AI上了,谁还会有时间自己研发专利呢?
正所谓,仁者见仁智者见智。AI到底应该不应该成为专利的发明者呢,小伙伴们怎么看?
二.AI助力下的照片无限放大技术
除了成为发明家,AI还能帮助图片无限放大!现今随着手机摄像头技术的飞速发展,大家分享在各种社交媒体上的照片已经越来越精细了。不过一直有一个遗憾也许曾经不只一次的困扰过你,就是当你对朋友新发的美照中的某个细节进行放大想看清楚究竟是什么,比如后面站的是谁的脸,招牌上到底是什么字,带的究竟是哪个款式的表的时候,总是放大倍数有限制,或者就是放大了也是一团乱麻完全丢失了细节看不清楚。那么我想今天介绍的技术一定能帮到你。废话不多说,直接快进到见证奇迹的时刻。
图片超分辨率解析技术成果动图
惊不惊喜,意不意外?这个成果来源于google最新SR3(Super-Resolution)图片超分辨率解析技术。左边是原始的低画质图像,也就是平时我们直接在手机上放大后看到的人脸,经过S3的处理之后一张清晰且细节满满的人脸立刻呈现在面前。一定要强调说明的是左边的原始图像是64*64的,而右边的分辨率则达到了恐怖的1024*1024,足足放大了16倍。那么究竟是如何做到的呢?现在手机对图片放大处理大都是简单粗暴的像素复制,比如要放大4倍,那么就把原图的一个点复制成4个,整个图片的像素点变多了自然图片就大了,但是效果就惨不忍睹了,完全是一堆色块的堆叠。
而SR3则利用大量的高精度图片进行AI建模训练。一张高清图片会被不断的添加随机噪声,让图片越来越模糊最终变成电视上的雪花点那种完全噪声图。然后AI的任务就是试图反向的重建这个过程,也就是说从雪花图一步步去除噪声最终把原始的高清大图给还原回来。这就是为什么如果你仔细看会发现高清图总是从一堆雪花点慢慢生成逐渐清晰起来,因为这就是SR3的训练过程。可以再通过细节放大图让我们再来感受下SR3的强大,几乎已经到发丝级别。
左一列为原图,左三列为SR3
有了这么强大的技术是不是以后电视剧情节里的无限放大监控里人脸抓坏人的故事就要成真了呢?很遗憾现实并没有那么美好。也许有些细心的小伙伴就会发现上图中SR3生成的人脸似乎和原图左眼下方有一点点不同。原图只有眼纹但是生成图却多了一个深色斑。一个细节出卖了SR3的本质,它并不是放大让我们看到原本模糊的细节,而放大并且通过猜想生成细节!而这个猜想的依据是训练数据的分布概率,也就是说如果你的训练数据都是白人,那么给它一个黑人的模糊图它极大可能生成的是一张白人的高清图。如果警方用目前的技术去发布通缉令,那后果就可想而知了。不是说完全不能用,但想来肯定是不能作为法庭证据的,万一AI脑补错了怎么办?比如“放大”成下面这种似是而非的结果。
人脸放大效果图(假设)
其实现在的photoshop已经有类似的功能了,有兴趣的小伙伴可以去试试。看看它究竟是真的放大还是“脑补”的呢?
参考链接:
- https://www.leiphone.com/category/academic/WCGquvRK83pD5gEP.html
- DABUS Described. Imagination Engines Incorporated. (n.d.). Retrieved October 8, 2021, from https://imagination-engines.com/dabus.html.
- https://ai.googleblog.com/2021/07/high-fidelity-image-generation-using.html
- https://iterative-refinement.github.io/