谷歌人工智能黑科技:用照片做小电影
新浪科技讯 北京时间7月10日下午消息,据美国科技博客Gizmodo报道,本周《麻省理工科技评论》(Technology Review)杂志发布的一篇论文披露了谷歌研发的新系统DeepStereo,该系统可以通过人工智能技术将一系列照片无缝组合成为视频。
论文作者名为约翰-弗林(John Flynn),是一名谷歌工程师,其他三位合著者也都在谷歌工作。在论文中,弗林阐述了谷歌研发DeepStereo系统的全过程。
早在DeepStereo之前,就有类似利用静态图片输出动画的技术存在。美国计算机协会计算机图形专业组(SIGGRAPH)就曾通过网上图像制作过延时动画。
但与其他静态图像生成动画技术相比,DeepStereo系统最大的不同在于,它可以猜测出图像的缺失部分,在空白处创造出来源图片中没有的新图像。据英国媒体Register报道,和传统动画利用视觉暂停的原理不同,DeepStereo可以“想象出”两幅静止图像之间的画面。
弗林和他的合著者在论文中写道,“这项技术与之前的产品截然不同,我们尝试采用新型深度架构直接合成新图像,不需要预先设置景深、焦距等训练数据。”
该系统背后的网络架构原理十分复杂,借鉴了各种先例。但作者在文中介绍了该技术的独到之处:系统在工作时会采用两套独立的网络架构。其中之一会根据已有的2D数据预测各个像素的景深。另外一个则会对色彩作出预测。两者共同以2D图像的形式完成对景深和色彩的预测,最终合成视频。
DeepStereo仍有不足之处:视频角落的画面很不清晰。“算法没有涉及到的区域往往是模糊的,无法被覆盖,也无法使用像素填充,”开发团队解释说。不过,这套系统暗藏了一个通过模糊的图源生成物体的小技巧:“移动对象在训练数据中非常常见,我们的模型可以优雅地完成这个动作:开始出现的时候是模糊的,然后逐渐转换为运动模糊效果。”
虽然该系统生成的最终产品与通过图像简单合成的动画区别不大,但该技术能够为谷歌的街景技术锦上添花。同时也能为谷歌的人工智能技术提供一个更加实用的范例。
本月,谷歌的“梦想机器人”在互联网上走红,这是该公司超级先进的人工神经网络,由谷歌的工程师团队开发而成。设计初衷是要找到一种切实可行的方法,让计算机辩认出图像中的内容。谷歌工程师正在教这些不可理喻的人工“大脑”辨识动物或架构,顺便也做做“梦”,此举令人感到震惊和恐惧。(斯眉)
(责任编辑:斯眉)版权及免责声明
1、本网转载媒体稿件旨在传播更多有益信息,并不代表同意该观点,本网不承担稿件侵权行为的连带责任;
2、在本网博客/论坛发表言论者,文责自负。
-
“中外青年万里读行:从荆楚到世界
中国国际教育电视台讯:6月15日,由中联部当代世界出版社、湖北省国际文化交流中心及华中师范大学共同举办的“中外青年万里读行:从荆楚到世界”主题沙龙在湖北省武汉市
-
CECTV《声起东方》全球中文经
制片主任:李敏
- ・《少林点穴的隐秘力量》纪录片在郑州圆满杀青
- ・2025GT世界挑战赛北京亦庄站启幕
- ・北京市侨联召开海外北京会座谈交流会
- ・2025GT世界挑战赛北京亦庄站圆满落幕
- ・短片【未封存的岁月日记】的时代意义
- ・光影铸魂传薪火 长征精神耀新程献礼长征胜利90周年
- ・侨智未来·创新人才发展活动举办
- ・2025GT世界挑战赛北京亦庄站筹备进入冲刺阶段
- ・2025“校园星主播”国际展演(韩国站)圆满结束
- ・“勇气少年团”综艺节目开始选拨啦
- ・CECTV《声起东方》全球中文经典朗读节目
- ・美国迈阿密大学访问学者项目
- ・2012第二届中国国际积极心理学大会
- ・首届世界香具文化大会暨高峰论坛在浙江龙泉圆满召开
- ・“中外青年万里读行:从荆楚到世界”主题沙龙在湖北武汉
- ・赓续千年馨香 赋能文化振兴——介休市洪山香文化研学基
- ・土中建交55周年文化对话座谈会在京举行
- ・尼泊尔-中国萨加玛塔(珠穆朗玛峰)探险节在京举办,中
- ・巴基斯坦驻华大使在昆明出席中国—南亚博览会和中国—南
- ・百集电视访谈栏目《健康大讲堂》龙心口服液全产业链诞生
- ・巴基斯坦驻华大使哈什米对中国东北沈阳市进行访问取得丰
- ・比利时副首相兼外交大臣普雷沃参观杭州英蓝中心“象外”
- ・百集电视访谈栏目《健康大讲堂》地龙蛋白 FDP 营养
- ・百集电视访谈栏目《健康大讲堂》地龙蛋白与纳豆激酶创新
- ・CECTV《声起东方》全球中文经典朗读节目
- ・“勇气少年团”综艺节目开始选拨啦
- ・2025“校园星主播”国际展演(韩国站)圆满结束
- ・首届世界香具文化大会暨高峰论坛在浙江龙泉圆满召开
- ・2012第二届中国国际积极心理学大会
- ・美国迈阿密大学访问学者项目







