解密:“无中生有”的计算机视觉.docx
《解密:“无中生有”的计算机视觉.docx》由会员分享,可在线阅读,更多相关《解密:“无中生有”的计算机视觉.docx(3页珍藏版)》请在第一文库网上搜索。
1、解密:“无中生有”的计算机视觉计算机视觉(ComPUterVision,CV)是一门研究如何使机器“会看”的科学。1963年来自MIT的1arryRoberts发表了该领域第一篇博士论文MachinePerceptionofThree-Dimensiona1So1ids,标志着CV作为一门新兴人工智能方向研究的开始。在发展了50多年后的今天,我们就来聊聊最近让计算机视觉拥有“无中生有”能力的几个有趣尝试:超分辨率重建;图像着色;看图说话;人像复原;图像自动生成。可以看出,这五个尝试层层递进,难度和趣味程度也逐步提升。由于篇幅有限,本文在此只谈视觉问题,不提太过具体的技术细节,若大家对某部分感兴
2、趣,以后再来单独写文章讨论。超分辨率重建(ImageSuper-Reso1ution)去年夏天,一款名为waifu2x”的岛国应用在动画和计算机图形学中着实火了一把。waifu2x借助深度“卷积神经网络(Convo1utiona1Neura1Network,CNN)技术,可以将图像的分辨率提升2倍,同时还能对图像进行降噪。简单来说,就是让计算机“无中生有”地填充一些原图中并没有的像素,从而让漫画看起来更清晰真切。大家不妨看看图1、图2,真想童年时候看的就是如此高清的龙珠啊!图1龙珠超分辨率重建效果。右侧为原画,左侧为WaifU2x对同帧动画超分辨率重建结果图2waifu2x超分辨率重建对比,上
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 解密 无中生有 计算机 视觉