智媒时代 融合创新 ——第六届世界智能大会媒体智能高峰论坛集锦

2022 年6 月24 日,第六届世界智能大会媒体智能高峰论坛在云端召开。论坛由中央广播 电视总台技术局、总台天津总站及天津市滨海新区人民政府联合主办,由总台超高清视音频 制播呈现国家重点实验室、央视网及中国电影电视技术学会承办。 媒体智能高峰论坛以“智媒时代 融合创新”为主题,聚焦世界人工智能技术发展前沿,探讨 人工智能算法的发展动态,展望媒体智能未来趋势,推动人工智能更好地赋能媒体融合发展。

摘要


image.png

首先,天津市大数据管理中心王扬处 长以《“津心办”创新移动政务服务打造城 市“数字名片”》为题,分享了打造“津心 办”数字社会服务平台的好经验、好做法。 自2019 年12 月上线以来,“津心办”实现 了App、微信小程序和支付宝小程序三重渠 道访问,累计注册人数超过1750 万。实现 市政服务超过1500 项,便民服务超过470 项, 为居民手续办理和企业业务办理提供了各方 面的便利。

image.png


央视网技术管理办公室樊翠芳主任以《打 造智慧媒体——央视网的融合创新实践》为题, 讲述了央视网的AI 平台建设历程、人工智能 编辑部(AIGC)的工作成果,以及超写实数 字人小C 的打造过程。央视网的大数据平台 具备极强的数据采集、计算和输出能力;AI 中台具有多种智能化服务,集成了多家供应商 的AI 能力,可以进行灵活调用以获得最优结 果。此外,央视网打造了一套智能化产品体系, 其中“I 学习”作为国内首个AI 时政数据库, 应用自然语言处理、知识图谱等多项人工智能 技术助力央视网连续4 年全网头条置顶稿件数 量在中央重点新闻网站中名列前茅。央视网还 利用最先进的4D 相机阵列扫描技术、语音合 成技术和动作渲染技术打造了超写实数字人小 C。小C 参加了许多重大活动,颇受年轻人喜 爱。本次论坛请小C 来主持,短短一周时间, 少女风的小C,摇身一变,以崭新的成熟稳重 的职业形象出现在云端会场,与这场内容丰富 的前沿科技盛宴相得益彰。

image.png

中科院研究员、中科闻歌董事长王磊博 士以《多模态数据分析技术在媒体融合中的 应用》为题,讲述了中科闻歌的多模态技术 体系。介绍了中科闻歌的“多语言、全媒体、 跨模态、深度语义”核心技术,以及具有自 主知识产权的天湖数据智算平台——其中的 人工智能中台“ZetaHub”,能够进行多模态 数据检索、理解、分析和可视化,赋能媒体 融合发展。平台应用于新闻配图、新闻内容 摘要、多级跨模态搜索引擎、视频和图片内 容拷贝检测、内容审核、虚拟人、自动编目 等多个场景。“智能媒资解决方案”在2021 世界人工智能创新大赛AIWIN“文化传媒数 字资产的自动编目”赛道中获得第一名。

image.png

北京大学博雅特聘教授马思伟的演讲 题目为《智能视频编码进展与挑战》。面对 超高清、沉浸式交互、智能处理的新需求, 需要更智能、更高效的编码方法。目前可行 的技术路线有三种:第一种是通过预后处 理技术优化编码/ 传输来提升编解码系统效 率;第二种是用神经网络编码替代传统预测 编码技术,通过非线性变换替代线性变换预 测,解决复杂编码难题;第三种是在合适的 视频应用场景和视觉质量要求等条件下,采 用神经网络基于特征识别进行视频压缩。神 经网络编码目前已经进入应用阶段,产生了 AVS、MPAI、IEEE1857 等标准。智能编码 面临算法模型、算力成本、质量评价三方面 的挑战,目前深度学习算法、计算平台、感 知质量评价技术都正在向促进神经网络编码 的方向发展,相较传统编码技术而言未来编 码技术更趋向认知理解。

image.png

腾讯智能产品副总裁李学朝以《从交互 智能出发,打造新一代“数智”传媒人》为题, 讲述了腾讯云小微打造数智传媒人助力媒体 数字化、智能化的历程。在2022 年初的冰雪 赛事中,腾讯3D 手语数智人聆语上线总台 央视频担任AI 手语翻译官。数智人是整合了 语音交互、自然语言理解、图像识别等多种 能力的数字化应用,通过人机协作的新模式, 数智人可以提升内容制作的质量和效率,可以 增加节目的个性和趣味性;新一代的多模态人 机交互技术可以使数智人为用户提供更多陪 伴、信息交互和感情连接。腾讯云小微数智人 基于全栈AI 底层能力打造,在多种业务场景 下做到听得清、听得懂、会表达,未来腾讯云 小微会深耕智能交互技术,用数字化助力媒体 机构讲好中国故事,传播中国声音。

image.png

百度智能云AI 及应用产品副总经理刘 倩演讲的题目是《AI 在媒体领域的发展趋 势与应用创新》。智能化媒体的核心包括内 容智能化生产、体验智能化交互、渠道智能 化分发。预训练大模型在内容智能化生产方 面起到了很大作用,能够通过使用少量数据 进行微调达到很好效果,具有很强的泛化能 力和通用性。百度大模型在语义理解、跨模 态内容生成、数字人主播等高阶内容创作领 域的相关技术已在冬奥会、中国文物交流中 心等重大活动中得到应用。在体验智能化交 互方面,百度推出了基于隐变量的、具有极 强对话能力和长期记忆能力的对话生成模型 PLATO,其对话水平已经接近人类。AI 智 能技术的发展将提升创作效率,激发创作灵 感,进一步释放创作者创造力。

image.png

阿里巴巴达摩院资深算法专家谢宣松 以《AI 智能驱动超高清视界》为题,讲述 了如何运用AI 技术将存量视频内容升级为 超高清内容。使用超分、插帧和色彩增强等 AI 技术对存量视频内容进行升级,可以丰 富高质量视频内容。为了应对视频升级过程 中可能出现的瑕疵问题,阿里巴巴达摩院开 发了GPEN 和智能瑕疵检测等算法,增强了 超分的清晰度、鲁棒性和插帧的流畅度,实 现细节还原更多、画面更流畅、色彩更逼真。 为了实现视频增强技术在不同领域、行业、 场景的落地,达摩院设计了一整套技术框架, 可以组合不同算法,通过PaaS、SDK、一体 机等方式落地,覆盖内容生产、传输、直播、 端到端播放等场景,通过AI 驱动超高清“视 界”智能化、平台化、普惠化的发展。

image.png

上海交通大学未来媒体网络协同创新 中心副教授张小云的演讲题目为《视频智 能增强技术及最新进展》。针对历史影像 的图像模糊、细节丢失、运动不流畅、画 面暗淡等质量问题,该中心进行了超分辨 率、视频插帧、人脸增强、自动上色等关 键技术研究,提出了融合外部参考图像和 局部自回归模型的超分、运动估计运动补 偿模型驱动和场景深度感知的插帧、基于 隐空间学习的人脸增强等系列创新算法, 从分辨率、帧率、色彩、目标区域等多维 度显著提升视觉质量。目前上海交通大 学AI 增强技术已应用于中央广播电视总 台大量历史影像的修复增强,并在2022 北京冬奥会、建党百年宣传报道等重要 活动中使用。

image.png

火山引擎智媒高级架构师龙妮娜以 《智能技术探索媒体生产传播新形态》为 题,讲述了火山引擎的智能技术框架。火 山引擎是字节跳动旗下的云服务平台,将 抖音集团快速发展过程中积累的增长方 法、技术工具和能力开放给外部企业,提 供云、AI、大数据技术等系列产品和服务, 帮助企业在数字化升级中实现持续增长。 在智能AI 方面对外提供了包括基础设施、 素材支撑、算法引擎、智能应用四个层面 的全栈AI 技术支撑能力,不仅提供成熟 的视觉、语音和语义三大领域AI 算法, 降低AI 应用门槛,并将AI 技术与应用产 品打包,面向媒体场景生态提供节目制作 场景、虚拟直播间场景和新媒体互动传播 场景解决方案。让创作更加简单,分发更 加精准,互动更加有趣,帮助媒体做好用 户体验。

image.png

凌云光技术股份有限公司创始人,董 事长兼总裁姚毅以《元宇宙虚拟内容制作 方案探索》为题,讲述在融媒体场景下, 虚拟制作需要引入更多的AI 技术提高内 容制作的效率。凌云光开发了LuStage 光 场建模系统、Fzmotion 运动捕捉系统和 Infision XR 立体演播系统,通过AI 实现 了高效率、高精度人物建模、动作捕捉和 全方位的虚实拍摄制作,打造出智能虚拟 内容制作工作室和智能虚实融合XR 演播 室。相关技术在影视剧制作、总台春晚、 元宇宙沉浸媒体中得到应用,创造了较好 的视觉效果和互动效果。虚拟内容制作是 未来媒体的技术发展方向,凌云光一直在 探索研究虚拟内容制作技术,例如全息体 视频技术,致力研究沉浸媒体制作技术。

image.png

英特尔超大规模云计算高级软件架构 师谢义以《基于英特尔至强服务器平台的 AI 视频增强优化》为题,讲述了英特尔至 强服务器平台通过众多CPU 指令集解决 了视频增强需部署在GPU 上的问题,通 过INT8 精度代替FP32,在保证质量的情 况下降低计算量。即将推出的新一代至强 在AI 性能上实现了里程碑的跨越,算力 提升8 倍,同时通过HBM 解决内存瓶颈。 为帮助开发者平稳过渡,英特尔通过系列 软件实现性能和精度的“双赢”,在至强 平台实现满足实时转码的视频增强。

image.png

转载请注明来源:《现代电视技术》 作者:本刊特约记者 简维毅 段蓉 李欢 关崴泷