展览时间:2018年6月11-13日
*与上海国际电影电视节同期

展览地点:上海世博展览馆
欢迎(中文English
首页 / 最新消息

【论坛】IBM唐文涛为您讲述——AI玩转视频

在国家新闻出版广电总局网络视听节目管理司、上海市文化广播影视管理局的大力支持下NAB Show Shanghai携手上海市网络视听行业协会、中国(上海)网络视听产业基地共同举办的“智能视频沙龙”活动于9月8日在上海国际会议中心圆满落下帷幕。“智能视频”成为热词。

 

 

IBM大中华媒体与传媒行业大客户总监唐文涛先生在智能视频沙龙当天分享了目前行业中,包括国内的电视台、电影机构在国际上的一些新媒体做的电影,制作公司所总结出来生产过程中的瓶颈。通过这个能够给大家一些人工智能落地方面的启发。当谷歌还在用阿尔法狗跟人下围棋的时候,IBM已经在行业强硬地落地。
他表示在现在的电视媒体或者电视新媒体的创作过程中,核心的部分包括外场素材、对素材的反复搜索和定位、场记信息等等,这属于媒体机构的核心资产,对它的管理其实一直是一个很热的话题,但是目前为止没有产生一个很好的解决方案。因为目前我们还是基于人工编目的输入,基于编辑人员的理解,以及企业内搜索引擎的使用。参差不齐的技术能力,导致编目的准确性不够,也导致素材和成片的利用率非常低。
基于以上问题,IBM在8月份发布的最新Waston Media就可以适配到人工智能的各个场景里面来。它的目标是是释放视频内在的潜力。举例来说我们是看着《西游记》、《三国演义》等各种各样的电影、电视剧成长起来的。电影、电视剧是我们认识这个世界的窗口。对人工智能来说,广电和媒体大量的视频素材,其实是它学习和成长的过程。
IBM在做Waston Media的时候,有四个方面的想法。第一个是提升内容的价值,第二个是优化内容性能,第三个是最大化用户收益,最终会提升他对内容理解。通过这四个方面诉求的整理,达到产品的落地。
Waston Media延展开也可以分为四个部分。第一个内容的发现,不仅对内容的生产面,还是对观众以及合作伙伴。对已有数据的发现,综合性的思考,不仅是视频本身的场景,还有里面的人物和关键的对象,比如说它的logo,或是它的音频文件。最后是能力的提升,我们在国外的话叫个性化定制,或者叫个人化定制。让观众不再靠遥控器去寻找我们的电视的内容。整个播出的节目单都会是每个观众喜爱的,具有个人偏好的菜单。第三个是自动化的字幕。有两方面的使用场景,第一是搬运,IBM Waston用语音识别的方式,加上一些搬运的能力,这样可以实时翻译,便于内容的传播和对不同地域的观众对理解的帮助。第二个IBM Waston会把识别出来的文字作为数据,作为它的内容本身你要进行整合。对以后的二次加工,甚至和观众的喜好进行匹配。下一个认知的编辑,传统非线性编辑其实都是人对视频的要求、希望和理解,去做一些编辑。这个过程中,IBM引入了人工智能在编辑这个平台。其实IBM Waston已经发布了API,全方位理解和认知我们的视频的内容。包括视频对象也好,音频对象也好,视频本身的其他属性也好,都会进行更深入的视频分析。不仅仅是视频的识别,像带来的语言的识别,包括内部的语言识别。内部的语言识别包括声音以及视频出现的文字。外部的识别,就是我们对它的标签,对它的编目进行数据的理解。这些方面的理解,可以推举出来它的一些场景,或者人物的一些语气和一些情绪,都可以进行发现和理解。这个方面是综合的视频的把握和一个认知。
目前人工智能具备四个条件。第一是理解,认知系统可以像人类一样理解非结构化信息。对这个世界,包括对音视频材料的理解,人工智能在其中起着很重要的作用。第二是推理,认知系统能掌握基本概念,形成假设,进行推断并提取想法。第三是学习,认知系统可以从每个数据点、互动和成果中不断学习,从而不断地增加专业知识。第四是互动,认知系统具有看、说和听的能力,能够与人类自然地进行互动。 人工智能其实离广电并不遥远,第一我们需要具备人工智能所了解它的一些模型算法、神经网络的使用。第二我们基于数学模型的建立,第三个我们需要应用场景。以上的分享更多是业务场景的一些经验的分享和行业的需求,人工智能的理念在广电行业的应用。

 

 

NAB Show Shanghai最新消息
提交邮箱订阅更多最新消息
主办方