亚博_主页

微软亚洲研究院梅涛博士: yabo体育机器也能看懂, 还能给" 影评" . ?

2018-10-08 19:38:38  by亚博国际

微软亚洲研究院梅涛博士: yabo体育机器也能看懂, 还能给

亚博体育特与香港中文大学(深圳)承办的这次大会共聚集了来自全球30 多位AI 领域科学家、近300 家AI 明星企业.雷锋网最近将会陆续放出峰会上的精华内容,回馈给长期以来支持雷锋网的读者们!

本次介绍的这位嘉宾是微软亚洲研究院资深研究员梅涛博士,分享主题为「内容的生命周期:创作,处理,消费」.

梅涛博士,微软亚洲研究院资深研究员,国际模式识别学会会士,美国计算机协会杰出科学家,中国科技大学和中山大学兼职教授博导.主要研究兴趣为多媒体分析、计算机视觉和机器学习,发表论文 100 余篇(h-index 42 ),先后10 次荣获最佳论文奖,拥有40 余项美国和国际专利(18 项授权),其研究成果十余次被成功转化到微软的产品和服务中.他的研究团队目前致力于和图像的深度理解、分析和应用.他同时担任 IEEE 和 ACM 多媒体汇刊(IEEE TMM 和 ACM TOMM )以及模式识别(Pattern Recognition )等学术期刊的编委,并且是多个国际多媒体会议(如 ACM Multimedia , IEEE ICME , IEEE MMSP 等)的大会主席和程序委员会主席.他分别于 2001 年和 2006 年在中国科技大学获学士和博士学位.

为什么要以「内容」为主题做分享?

梅涛博士从三个方面讲了他为什么想和大家分享「内容」这个话题.首先跟图像相比信息更丰富,处理起来也更富挑战性;其次,计算机视觉技术领域,如人脸识别,人体跟踪等研究的比较多,而互联网内容相对来说研究的比较少;最后,他说在十年前就开始做方面的研究,所有人都说是下一个风口,今天看来这个说法也是对的.

在传统的视觉理解(2012 年以前)的方法里,要做视觉问题基本上分三个步骤:

第一,理解一个物体,比如说识别一个桌子,首先要检测一个关键点(比如角、边、面等);

第二,人为设计一些特征来描述这些点的视觉属性;

第三,采用一些分类器将这些人为设计的特征作为输入进行分类和识别.

而现在的深度学习,尤其是在2012 年开始以后:

"图像理解的错误率在不断降低,深度神经网络也从最早的8 层到20 多层,到现在能达到152 层.我们最新的工作也表明,理解的深度神经网络也可以从2015 年3D CNN 的11 层做到现在的199 层."

梅涛博士也在演讲中表示,内容的生命周期大致可以分为三个部分,即的创作、处理和消费.

Creation (创作)

关于怎么去创造一个