全国服务热线:0898-08980898

欧宝平台【精选】基于人工智能的TVOS 4K超高清智能电视终端研究及应用

发布时间:2024-06-14 18:54:49点击量:

  本文为论文精要,原文刊发于《广播与电视技术》2021年第8期“人工智能应用创新大赛

  二是同一个地区的接收终端软件固定,无法根据用户的需求进行个性化调整,运营商也不能及时获取用户的反馈;

  三是接收终端操控方式不灵便,在运营商开展的业务越来越多的时候,用户需要花费更多的时间和精力去寻找感兴趣的节目。

  为此,本文开展了4K超高清智能电视终端的研究,以支持4K超高清视频解码的芯片为核心硬件,以智能电视操作系统(TVOS)为基础软件平台,通过在终端侧应用人工智能技术,在解决用户操控不方便问题的同时,打通用户和运营商的沟通渠道,满足用户个性化需求,提升用户收视体验和交互体验,从而让广播电视更好地为人民群众服务。

  黎政,男,1985年生,土家族,硕士研究生,国家广播电视总局广播电视科学研究院高级工程师,主要从事智能电视操作系统(TVOS)和人工智能方面的研究。

  本文研究的4K超高清智能电视终端采用TVOS 3.1版本作为基础软件平台,实现了终端软件技术体制的标准化和智能化,有效地支撑了有线电视网络各种新型融合媒体业务。

  TVOS 3.1版本具备对4K超高清视频的处理能力,可实现对4K超高清加扰直播频道的接收、解扰、解码和显示,以及对4K超高清加密点播视频的接收、解密、解码和显示,满足广播电视4K超高清发展需求。

  本文研究的4K超高清智能电视终端以TVOS数字电视、媒体播放、数据采集、人机交互等组件能力为基础,采用大数据处理和增强学习等人工智能技术,实现了智能语音交互、智能关联搜索和用户界面的个性化智能呈现等功能,极大地提升了用户体验。

  本文研究的4K超高清智能电视终端的硬件以支持4K超高清视频解码的芯片为核心,支持有线电视网络和互联网的接入,为运营商开展相关业务提供硬件能力支撑。

  中央处理器(CPU)采用海思Hi3798MV200H型号芯片,具备四核处理能力,主频达到1.2GHz。

  内存(DDR)容量达到2G Byte,闪存(FLASH)容量达到8G Byte,支持多路4K超高清视频的缓存和处理。

  视频解码支持AVS2、H.265等编码格式;音频解码支持AC3、AAC等编码格式;视频输出能力最高支持3840× 2160/60Hz。

  本文研究的4K超高清智能电视终端实现了智能语音交互功能,可通过语音输入方式,替代遥控器按键方式,进行直播频道切换台、点播节目播放、语音搜索、第三方应用唤起等功能。

  智能语音交互分为语音采集、语音识别、语义识别和指令操控等四个部分,如图1所示。

  语音采集部分实时监控用户的语音输入,智能地选择录音起点、录音时长,并自动去除噪音、环境音和电视背景音,获得真实的用户语音数据。用户可将蓝牙语音遥控器或者智能手机作为语音输入设备,通过蓝牙或者与智能电视终端相连接的Wi-Fi网络将语音数据输入给智能电视终端。当采用智能手机作为语音输入设备时,智能手机需要安装与智能电视终端相匹配的电视助手应用。

  语音识别部分通过语音识别引擎将采集到的语音数据转换为文字数据。智能电视终端接收到采集的语音数据后,通过上行网络将语音数据传递到运营商服务器,运营商服务器采用合作的语音云服务提供商提供的语音识别引擎,从语音数据中识别得到相应的文字,并将识别得到的文字通过下行网络传回给智能电视终端。

  语义识别部分采用内置在智能电视终端的本地语义解析引擎,结合智能电视终端所安装的应用信息、节目内容数据库以及用户的历史行为数据,采用模糊匹配算法,对识别得到的文字进行自然语言处理,提取出用户的意图,并将之转换为实际的操控指令。本地语义解析引擎通过增强学习算法,不断学习用户的语音操控习惯,提高语义识别的准确度。

  相较于在线的语义识别算法,本地语义解析引擎可以充分地利用智能电视终端的本地应用信息、本地节目内容信息以及本地用户的历史行为数据,减小在线语义识别算法中由于非本地用户数据所带来的计算误差,实现更精确的语义识别。

  指令操控部分采用TVOS人机交互组件提供的能力欧宝平台,将语义识别得到的操控指令分发给具体的业务应用,实现直播频道切换台、点播节目播放、语音搜索和第三方应用唤起等具体功能。

  本文所研究的智能语音交互技术,实现了语音输入设备多样化、应用中间件化和语音信息服务模组化,可同时对接各类语音输入设备,也可被动接收语音文件或消息,解决了语音服务与输入设备紧绑定的问题。语音服务通过TVOS标准协议与TVOS人机交互组件进行交互,实现了语音服务与终端应用之间的功能共享和标准化处理,使得上层应用不再需要与语音服务提供商对接,即可直接使用语音服务提供商的相关功能。

  本文研究的4K超高清智能电视终端实现了智能关联搜索功能,与智能语音交互功能协同,可通过语音输入方式,快速定位用户感兴趣节目。

  智能关联搜索分为本地节目信息采集、本地节目内容元数据标识库建立、本地节目内容关联关系标识库建立、基于关键词的智能关联搜索等四个部分。

  智能电视终端采用TVOS数字电视组件提供的能力,进行频道搜索并接收业务信息(SI)数据,按照SI节目信息对直播频道进行节目颗粒度切分,并与通过以太网从运营商获取得到的点播视频和回看节目信息一起构成本地节目数据集。本地节目数据集中每个元素为一个独立的节目。

  智能电视终端对本地节目数据集中的每个节目进行分析,提取节目内容的元数据,如节目内容所属分类信息(新闻、电视剧、电影、体育比赛、综艺、少儿、广告等等)、节目内容关键人物信息(主演、导演、明星等等)、节目内容体现的地点信息(新闻报道地点、体育比赛地点、综艺节目拍摄地点等等)、节目年代信息、节目时间信息、节目内容关键词等,并按照提取出的元数据对每个节目进行标识,构建本地节目内容元数据标识库。

  基于本地节目内容元数据标识库,通过在具有相同元数据标识的不同节目之间构建关联关系,形成本地节目内容关联关系标识库。

  基于本地节目内容元数据标识库,用户无需再手动从众多的直播频道或者点播视频和回看节目中逐个寻找,通过简单的输入操作欧宝平台,使用简单的关键词即可在本地节目内容元数据标识库中快速查找到感兴趣的本地节目。同时,基于本地节目内容关联关系标识库,终端可根据用户感兴趣的本地节目信息,自动为用户提供相关联的本地节目,增加用户的选择,提升用户的收视体验。

  基于数据分析的智能关联搜索技术,实现了在众多融合媒体业务环境中,快速定位用户感兴趣节目的功能,优化了用户的搜索路径,提升了用户体验,同时也为运营商将优质节目快速传达用户提供了有效手段。

  本文研究的4K超高清智能电视终端利用TVOS数据采集能力和基于偏好分群算法的实时用户分群技术,实现了终端用户界面的个性化智能呈现功能。

  用户界面的个性化智能呈现功能分为用户行为数据采集、用户偏好分群算法、用户分群节目推荐和“瀑布流”用户界面等四个部分。

  智能电视终端通过TVOS数据采集能力,根据用户的交互记录,实时采集用户的个性收视行为,主要包括用户浏览的直播频道/点播视频/回看节目、搜索的关键词、观看的时长等等。

  智能电视终端采用本地或在线或本地与在线相互协同的偏好分群算法,对用户收视行为数据进行增强学习,根据实时累计收益来调整偏好阈值,为用户划分所属群组。

  基于偏好分群算法的实时用户分群技术可以在终端侧实现对用户的实时分群,为用户节目智能推荐提供数据支持。

  根据用户所属群组,结合本地节目内容元数据标识库,终端实时为用户推荐最符合用户历史行为数据的节目内容。

  智能电视终端用户界面采用“瀑布流”布局方式,根据推荐的节目内容,动态调整界面显示的栏目,以及每个栏目显示的节目内容和显示优先级,真正实现用户界面的个性化智能呈现。

  通过构建用户界面与用户交互的反馈循环通道,不断增强用户分群的精准度,使得用户界面越来越符合用户的喜好,充分满足用户个性化需求,实现“千人千面”。

  本文研究的4K超高清智能电视终端通过了广电总局入网检测、TVOS技术符合性测试,以及智能语音交互、智能关联搜索和用户界面的个性化智能呈现等功能的功能测试和稳定性测试,并在上海市有线万台的规模部署应用,用户反馈良好,巩固和发展了有线电视网络视频消费用户,提升了市场竞争力。

  基于标准化的TVOS系统,本文研究的4K超高清智能电视终端可以快速地在全国有线电视双向网络中推广应用,其对人工智能技术的应用极大地提升了终端用户体验,推动了TVOS和4K超高清技术的落地应用,促进了广播电视超高清全产业链的飞速发展。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  王小川张鹏李大海杨植麟回应大模型的一切:AGI、价格战、开源和Scaling Law

  大手笔!央企又拿核心宅地,海口这一片区城市更新,线亿!中建智地+朝开+江苏绿建摘北京首宗多业态地块

  MediaTek联合Discovery探索频道推新节目 由天玑9300芯片手机全程录制

  17岁中专女生闯进全球数学竞赛决赛12强 ,竞争对手多来自清华 北大 剑桥 等名校欧宝平台欧宝平台欧宝平台

地址:海南省海口市  电话:0898-08980898  手机:13988888888
Copyright © 2012-2024 ob电竞·(中国)电子竞技平台 版权所有  ICP备案编号:粤ICP备88888888号  
网站地图