《视听纵横》杂志社
首页 > 期刊导读
 
/ / /
 

视听平台大数据分析在经营系统应用的设计与实

 
来源:视听纵横 栏目:期刊导读 时间:2021-04-01
 
随着信息和媒体技术的极大发展,视听生态迎来了巨变。生态中的两极,传统媒体(电视台)和网络新兴媒体(互联网公司),从各自领域向对方渗透。最终,涵盖了手机电视、OTT、IPTV、网络视频的“视听平台”成为双方短兵相见的战场。 视听平台被传统媒体称为“平台型媒体”,被互联网公司称为“媒体型平台”,其本质都是提供视听服务并最大化占领注意力市场。《2018中国网络视听发展研究报告》描述了我国网络视听发展现状及趋势,指出我国网络视听用户规模持续增加,行业蓬勃发展;内容付费收入显著提升,头部视频平台优势凸显;用户喜好差异化明显,圈层消费正形成;人工智能算法将优化视听产品制播流程。而根据《2018中国广播电视及网络视听业发展现状及前景分析》可以发现,传统电视媒体也正通过构建“电视+互联网”双受众市场媒介战略以获得全新价值增长点。 视听平台成为新老媒体鏖战的阵地,如何基于业务开展深入分析,建立完整的用户模型,挖掘用户价值,创造尽可能大的影响力及商业价值将是视听平台成败的关键。大数据分析技术是实现这一目标的有力保障。可以说,数据已成为网络视听的重要生产资料,数据应用技术和方法成为重要的生产力,数据评估成为网络视听行业正导向、助传播、扩影响的重要抓手。网络视听数据越来越受到社会各界的关注,移动化、数据化、智能化正在成为网络视听的三大趋势。在大数据时代,如何应用好大数据,利用数据创造价值,成为视听平台整体业务发展、技术转型、经营支撑的重要工作。 视听大数据 《互联网视听节目服务管理规定》中明确了互联网视听节目服务的定义,即制作、编辑、集成并通过互联网向公众提供视音频节目,为他人提供上载传播视听节目服务的活动。大数据是继云计算之后信息技术的又一次颠覆性的技术变革。顾名思义,大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。 具体到视听大数据,是指当媒体作为信息链的重要主体时,依附于媒体的、宽泛的数据。视听大数据涵盖了媒体的方方面面,如媒体的生产、储存、传播等不同阶段,如用户、内容、渠道等不同维度,又如媒体内容的制作、发行、营销、播出等不同角度。视听大数据带给媒体服务最明显的好处包括用户行为可跟踪分析,可定向精准服务;用户可管可控、黏着度强;市场管理相对有保障。 视听经营分析大数据系统构建 下面笔者以手机电视为例,阐述针对视听平台的经营发展如何构建视听经营分析大数据系统,如何采集、分析并总结各种经营所需的数据、如何为视听平台经营决策提供支撑。 系统架构。基于多年的经营经验积累,总体设计视听经营分析大数据系统的系统架构如图1所示,主要包括数据采集及传输层、大数据平台层、数据分析层、实时/批量应用执行层和应用层。 图1 系统架构图 数据采集及传输层主要负责把终端用户(自有APP及网站)的访问行为以及第三方经营商的用户行为统计数据传输到大数据平台,在此基础上做进一步的分析及应用处理。根据数据采集的时效性,应用数据采集方式分为两大类:一是自有平台及APP应用数据实时采集,在网页及APP应用中嵌入特定代码,当用户访问该网页或APP应用时,前端应用把用户访问行为(如逗留时长、点击内容等)通过即时通讯协议传输到相应的即时通讯服务端,实时传输到Hadoop大数据平台进一步处理;二是第三方平台及自有平台数据批量采集,第三方平台及自有平台把需要上传的增量数据按照一定格式存放到数据交换平台或自有平台数据缓冲区内,然后由大数据平台定时把增量数据进行初步清洗和整理后,存储到数据仓库。 大数据平台层包括以Hadoop技术为基础的大数据存储及处理服务集群和关系型数据仓库集群。大数据平台层结合了Hadoop平台和关系型数据仓库的不同优势,即基于Hadoop平台对海量数据进行高性能查询及处理工作,以及关系型数据仓库处理及存储复杂处理后的预汇总数据。大数据平台层通过MQTT服务端实时上传用户行为数据,并通过Kafka把实时用户行为数据发送到存储实时用户行为数据的数据仓库;通过Spark技术对实时用户行为数据进行流式处理,然后通过相应的实时应用执行服务层输出相应的实时运算结果,以满足实时分析需要(如内容主动推荐、事件营销等)。 数据分析层主要包括三大部分,即可视化分析应用,数据挖掘及文本内容分析。一是数据可视化分析,应用既可以帮助业务人员直接访问大数据平台,并通过简单易用的功能快速完成大部分临时性业务分析需求,也可以把常用的可视化分析应用予以固化并由前端页面进行调用并展现。二是数据挖掘,即提供了快速建模功能,也提供了专业建模能力,从而满足突发性的数据挖掘需求,如临时性、紧急的精准营销活动;也可以完成更为专业的预测模型,如事件营销等,把模型直接部署到执行平台侧。三是文本内容分析,主要负责对非结构化文本进行分析,如视频内容描述、搜索关键字、用户评论、弹幕等,结合产品内置算法和语义理解结果构建相应的情感分析及主题分类规则,最后实现根据特定的业务需求对新的非结构化数据进行情感分析或主题分类,如正面/负面评论、视频内容大类分类、筛选敏感视频等。 实时应用执行层主要包括两大部分:一是基于自定义业务规则的数据处理及分析,二是基于机器学习模型的数据处理及分析。由于数据脱敏属于基于自定义业务规则的数据处理,考虑到数据下载量过大可能对系统运行性能造成的影响,因此系统设计时加入下载数据量限制,对超过下载数据量限制的作业采用批量方式进行,即系统等闲时再启动数据脱敏作业,处理后存储到交换区供其他用户进行下载,对下载数据量低于限制的作业则采用实时下载方式进行。基于机器学习模型的数据处理及分析是根据代码执行率,实时应用部分的模型转换成Java代码进行部署,批量应用部分的效模型转换成该系统代码进行部署,由服务器在前端闲时进行批处理。实时应用执行层主要对平台的实际业务需求进行归纳总结,构建灵活的数据处理规则配置方式,从而实现数据处理规则“动态配置,即时实现”,既保证数据处理性能,又能满足用户大部分数据处理需求。实时应用执行层对基础大数据进行复杂处理后基于各前端应用接口,生成相应的数据接口文件,然后由相关前端应用做进一步的处理操作。 应用层既包括整个视听平台的管理及分析应用构建的前端展现应用,也包括相应的基于经营执行需要的前端执行应用,如精准营销平台、搜索引擎优化等。分析层、应用层既可以采用传统的B/S及C/S模式部署,也可以采用云服务平台模式部署。 功能模块。视听经营分析大数据系统包括八大模块。页面或客户端埋码模块可实现对浏览器或移动终端用户内容浏览及播放完整行为的采集,从而帮助相关分析人员进一步了解用户行为习惯。多数据源数据采集及统一存储模块可实现对不同播放渠道提供的数据进行清洗、处理并统一存储到大数据平台中,为后续的数据挖掘、文本分析及可视化展现等应用提供高质量的数据基础。KPI统计及数据挖掘模块可对大数据平台中的基础数据根据管理及分析要求进行描述性统计,形成相应的KPI(包括播放时长、点击次数、订购用户数等);还可结合特定的业务需求及数据挖掘工具构建相应的数据挖掘应用,帮助相关业务人员及时了解用户行为偏好及潜在需求,从而为个性化推荐、精准营销及管理优化提供准确的客观建议。数据可视化展现模块提供报表、仪表盘等传统可视化图表展现功能(展现方式包括大屏、PC端、智能移动端等);提供简单易用的数据可视化工具帮助业务分析人员能够根据业务分析需要,快速对大数据分析平台中的数据,通过各种可视化方式进行呈现,从而及时帮助相关人员发掘企业经营中的潜在问题及商业机遇。 个性化推荐模块结合数据挖掘模型、协同过滤算法等方式,及时了解用户行为偏好,并通过相应的推送渠道为用户主动提供用户可能感兴趣的视频内容,在提升用户满意度的同时,提升平台整体收入。视频描述内容及搜索关键字分析模块对用户搜索关键字,视频内容描述等非结构化数据进行分析,一方面帮助相关分析人员及时从最新上线的海量视频内容中了解当前热点,或发现不合规的视频内容;另一方面帮助相关分析人员了解用户当前关注的视频热点,从而帮助经营人员优化视频内容,实现精准主动信息推送以及提高舆论导向及管控效率。拆账及报表输出模块对用户上传或改编的原创视频内容访问及订阅情况进行统计,根据约定的拆账规则,对收入进行拆账及结算(拆账内容还包括与第三方经营商合作的手机电视视频业务)。数据脱敏模块可根据设定的规则对需要输出的数据进行脱敏,如关联关键字需要保持一致,指标保持同比例关系等,以及脱敏数据结果的还原,并能把相应的脱敏过程形成相应的作业流并进行统一存储及管理。 数据流程设计。视听经营分析大数据系统的数据流转流程设计如图2所示,主要包括几个阶段:第一阶段是数据来源,包括各个内容服务平台以及相关的播出控制、经营支撑等平台;第二阶段是数据预处理及汇总,形成数据仓库和集市;第三阶段是数据深度处理,包括数据脱敏、挖掘等;第四阶段是数据的应用,包括可视化以及对外输出接口等。 图2 数据流转流程图 接口设计。视听经营分析大数据系统的数据接口设计为三大类:一是全量数据采集接口,包括批量加载接口、实时加载接口以及系统日志采集及解析接口等;二是系统内数据共享接口,分为实时接口和批量接口,分别适用两个应用场景;三是系统外第三方数据共享接口,包括数据脱敏、实时共享和批量共享,其中数据脱敏接口可以设置各种脱敏选项,如目标字段、脱敏算法、关系匹配等。 视听经营分析大数据系统应用 基于以上视听经营分析大数据系统构建了各种应用,涵盖数据的全生命过程。视听经营分析大数据系统的应用设计比较繁复,以下就其中几个方面进行举例说明。 全量数据采集。通过页面或客户端埋码,对页面或客户端用户体验分析的全量数据采集方式以及对接CDN的数据采集等技术方式,对多终端产品(包括手机客户端、PC端、页面等)、播放器等各类信息采集;融合媒体集成播控平台和视听平台等自身数据采集;同步第三方平台用户和经营数据等方式实现平台内容数据、用户数据、用户行为数据、产品经营数据等的全量数据采集工作。 数据挖掘及分析。在经营分析系统中,对上述采集到的数据进行统计分析,包括访问、使用、订购、收入等经营类数据,产品、渠道、节目等业务类数据以及聚合量、改编量、转码量、审核量、分发量等平台类数据的数据统计分析,建立分析引擎并行处理各种不同的工作流和算法。同时,建立用户、内容和产品等数据模型,验证和检验这些模型,并通过深度学习来提高模型分析的精准性。实现从数据采集、分析到最终数据应用的整个过程形成良性的闭环式生态循环,让原始数据对产品的经营提供商业价值参考,同时又反哺于原始数据的采集工作,逐步丰富经营分析系统进而不断为用户的使用、内容的质量提升和产品的多元化带来效益。 数据可视化展现。数据的可视化展现不仅局限于报表、仪表盘、KPI考核等报表展现方式,还可根据实际数据展现需求,定制、设计各类型数据展现模型,支持多种数据展现的可视化场景模板选取,多种数据库内容的数据源整合,对实时动态业务经营数据、系统实时监控数据以及通过离线方式进行数据加工后的数据等进行展现。支持多终端的数据可视化展现方式,展现终端包含大屏终端、电视终端、PC终端以及不同的移动终端等(如图3、图4)。 图3 首页热点大数据分析可视化图示 图4 在线媒体投放预警分析图示 智能推荐及搜索。基于用户模型、内容相似性模型等数据模型,以及用户搜索行为及热词分析,挖掘不同人群用户的同质化观看习惯,基于用户行为分析结论,并根据内容的内在相关性,快速生成大量的用户兴趣标签,为用户智能推荐其所喜爱的内容,提高用户黏性,展开精细化内容营销,个性化推荐,观众维系挽留,获取新的用户,并进行风险控制,获得价值的最大化。同时结合元数据标签等数据,为经营人员及编辑提供视频素材搜索功能,方便对素材内容进行二次加工(如图5)。 图5 智能推荐应用示意图 数据拆账及报表输出。基于专业用户(PGC)上传或改编的原创内容产生的数据及产生的收入,根据事先约定的拆账规则,实现PGC用户的数据拆分及内容结算。基于数据的拆账同时包含与经营商合作的相关业务的结算数据的拆账。 数据脱敏。对经营分析平台数据的数据脱敏是出于对平台数据输出的安全性考虑。系统数据脱敏首先对多类型的数据源进行统一管理,然后通过脱敏规则发现数据源中的敏感数据,对数据进行脱敏输出,同时支持对脱敏流程的作业化管理。 结语 以上视听经营分析大数据系统已应用在某国家级视听平台及其与之合作的多个移动视听平台、省网视听平台上,实现了从多个渠道、各种终端的数据采集,对多数据源进行整合和管理,对业务进行深入分析,从而建立了用户模型,挖掘了用户价值,并最终提升该平台的影响力及商业价值。 随着信息和媒体技术的极大发展,视听生态迎来了巨变。生态中的两极,传统媒体(电视台)和网络新兴媒体(互联网公司),从各自领域向对方渗透。最终,涵盖了手机电视、OTT、IPTV、网络视频的“视听平台”成为双方短兵相见的战场。视听平台被传统媒体称为“平台型媒体”,被互联网公司称为“媒体型平台”,其本质都是提供视听服务并最大化占领注意力市场。《2018中国网络视听发展研究报告》描述了我国网络视听发展现状及趋势,指出我国网络视听用户规模持续增加,行业蓬勃发展;内容付费收入显著提升,头部视频平台优势凸显;用户喜好差异化明显,圈层消费正形成;人工智能算法将优化视听产品制播流程。而根据《2018中国广播电视及网络视听业发展现状及前景分析》可以发现,传统电视媒体也正通过构建“电视+互联网”双受众市场媒介战略以获得全新价值增长点。视听平台成为新老媒体鏖战的阵地,如何基于业务开展深入分析,建立完整的用户模型,挖掘用户价值,创造尽可能大的影响力及商业价值将是视听平台成败的关键。大数据分析技术是实现这一目标的有力保障。可以说,数据已成为网络视听的重要生产资料,数据应用技术和方法成为重要的生产力,数据评估成为网络视听行业正导向、助传播、扩影响的重要抓手。网络视听数据越来越受到社会各界的关注,移动化、数据化、智能化正在成为网络视听的三大趋势。在大数据时代,如何应用好大数据,利用数据创造价值,成为视听平台整体业务发展、技术转型、经营支撑的重要工作。视听大数据《互联网视听节目服务管理规定》中明确了互联网视听节目服务的定义,即制作、编辑、集成并通过互联网向公众提供视音频节目,为他人提供上载传播视听节目服务的活动。大数据是继云计算之后信息技术的又一次颠覆性的技术变革。顾名思义,大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。具体到视听大数据,是指当媒体作为信息链的重要主体时,依附于媒体的、宽泛的数据。视听大数据涵盖了媒体的方方面面,如媒体的生产、储存、传播等不同阶段,如用户、内容、渠道等不同维度,又如媒体内容的制作、发行、营销、播出等不同角度。视听大数据带给媒体服务最明显的好处包括用户行为可跟踪分析,可定向精准服务;用户可管可控、黏着度强;市场管理相对有保障。视听经营分析大数据系统构建下面笔者以手机电视为例,阐述针对视听平台的经营发展如何构建视听经营分析大数据系统,如何采集、分析并总结各种经营所需的数据、如何为视听平台经营决策提供支撑。系统架构。基于多年的经营经验积累,总体设计视听经营分析大数据系统的系统架构如图1所示,主要包括数据采集及传输层、大数据平台层、数据分析层、实时/批量应用执行层和应用层。图1 系统架构图数据采集及传输层主要负责把终端用户(自有APP及网站)的访问行为以及第三方经营商的用户行为统计数据传输到大数据平台,在此基础上做进一步的分析及应用处理。根据数据采集的时效性,应用数据采集方式分为两大类:一是自有平台及APP应用数据实时采集,在网页及APP应用中嵌入特定代码,当用户访问该网页或APP应用时,前端应用把用户访问行为(如逗留时长、点击内容等)通过即时通讯协议传输到相应的即时通讯服务端,实时传输到Hadoop大数据平台进一步处理;二是第三方平台及自有平台数据批量采集,第三方平台及自有平台把需要上传的增量数据按照一定格式存放到数据交换平台或自有平台数据缓冲区内,然后由大数据平台定时把增量数据进行初步清洗和整理后,存储到数据仓库。大数据平台层包括以Hadoop技术为基础的大数据存储及处理服务集群和关系型数据仓库集群。大数据平台层结合了Hadoop平台和关系型数据仓库的不同优势,即基于Hadoop平台对海量数据进行高性能查询及处理工作,以及关系型数据仓库处理及存储复杂处理后的预汇总数据。大数据平台层通过MQTT服务端实时上传用户行为数据,并通过Kafka把实时用户行为数据发送到存储实时用户行为数据的数据仓库;通过Spark技术对实时用户行为数据进行流式处理,然后通过相应的实时应用执行服务层输出相应的实时运算结果,以满足实时分析需要(如内容主动推荐、事件营销等)。数据分析层主要包括三大部分,即可视化分析应用,数据挖掘及文本内容分析。一是数据可视化分析,应用既可以帮助业务人员直接访问大数据平台,并通过简单易用的功能快速完成大部分临时性业务分析需求,也可以把常用的可视化分析应用予以固化并由前端页面进行调用并展现。二是数据挖掘,即提供了快速建模功能,也提供了专业建模能力,从而满足突发性的数据挖掘需求,如临时性、紧急的精准营销活动;也可以完成更为专业的预测模型,如事件营销等,把模型直接部署到执行平台侧。三是文本内容分析,主要负责对非结构化文本进行分析,如视频内容描述、搜索关键字、用户评论、弹幕等,结合产品内置算法和语义理解结果构建相应的情感分析及主题分类规则,最后实现根据特定的业务需求对新的非结构化数据进行情感分析或主题分类,如正面/负面评论、视频内容大类分类、筛选敏感视频等。实时应用执行层主要包括两大部分:一是基于自定义业务规则的数据处理及分析,二是基于机器学习模型的数据处理及分析。由于数据脱敏属于基于自定义业务规则的数据处理,考虑到数据下载量过大可能对系统运行性能造成的影响,因此系统设计时加入下载数据量限制,对超过下载数据量限制的作业采用批量方式进行,即系统等闲时再启动数据脱敏作业,处理后存储到交换区供其他用户进行下载,对下载数据量低于限制的作业则采用实时下载方式进行。基于机器学习模型的数据处理及分析是根据代码执行率,实时应用部分的模型转换成Java代码进行部署,批量应用部分的效模型转换成该系统代码进行部署,由服务器在前端闲时进行批处理。实时应用执行层主要对平台的实际业务需求进行归纳总结,构建灵活的数据处理规则配置方式,从而实现数据处理规则“动态配置,即时实现”,既保证数据处理性能,又能满足用户大部分数据处理需求。实时应用执行层对基础大数据进行复杂处理后基于各前端应用接口,生成相应的数据接口文件,然后由相关前端应用做进一步的处理操作。应用层既包括整个视听平台的管理及分析应用构建的前端展现应用,也包括相应的基于经营执行需要的前端执行应用,如精准营销平台、搜索引擎优化等。分析层、应用层既可以采用传统的B/S及C/S模式部署,也可以采用云服务平台模式部署。功能模块。视听经营分析大数据系统包括八大模块。页面或客户端埋码模块可实现对浏览器或移动终端用户内容浏览及播放完整行为的采集,从而帮助相关分析人员进一步了解用户行为习惯。多数据源数据采集及统一存储模块可实现对不同播放渠道提供的数据进行清洗、处理并统一存储到大数据平台中,为后续的数据挖掘、文本分析及可视化展现等应用提供高质量的数据基础。KPI统计及数据挖掘模块可对大数据平台中的基础数据根据管理及分析要求进行描述性统计,形成相应的KPI(包括播放时长、点击次数、订购用户数等);还可结合特定的业务需求及数据挖掘工具构建相应的数据挖掘应用,帮助相关业务人员及时了解用户行为偏好及潜在需求,从而为个性化推荐、精准营销及管理优化提供准确的客观建议。数据可视化展现模块提供报表、仪表盘等传统可视化图表展现功能(展现方式包括大屏、PC端、智能移动端等);提供简单易用的数据可视化工具帮助业务分析人员能够根据业务分析需要,快速对大数据分析平台中的数据,通过各种可视化方式进行呈现,从而及时帮助相关人员发掘企业经营中的潜在问题及商业机遇。个性化推荐模块结合数据挖掘模型、协同过滤算法等方式,及时了解用户行为偏好,并通过相应的推送渠道为用户主动提供用户可能感兴趣的视频内容,在提升用户满意度的同时,提升平台整体收入。视频描述内容及搜索关键字分析模块对用户搜索关键字,视频内容描述等非结构化数据进行分析,一方面帮助相关分析人员及时从最新上线的海量视频内容中了解当前热点,或发现不合规的视频内容;另一方面帮助相关分析人员了解用户当前关注的视频热点,从而帮助经营人员优化视频内容,实现精准主动信息推送以及提高舆论导向及管控效率。拆账及报表输出模块对用户上传或改编的原创视频内容访问及订阅情况进行统计,根据约定的拆账规则,对收入进行拆账及结算(拆账内容还包括与第三方经营商合作的手机电视视频业务)。数据脱敏模块可根据设定的规则对需要输出的数据进行脱敏,如关联关键字需要保持一致,指标保持同比例关系等,以及脱敏数据结果的还原,并能把相应的脱敏过程形成相应的作业流并进行统一存储及管理。数据流程设计。视听经营分析大数据系统的数据流转流程设计如图2所示,主要包括几个阶段:第一阶段是数据来源,包括各个内容服务平台以及相关的播出控制、经营支撑等平台;第二阶段是数据预处理及汇总,形成数据仓库和集市;第三阶段是数据深度处理,包括数据脱敏、挖掘等;第四阶段是数据的应用,包括可视化以及对外输出接口等。图2 数据流转流程图接口设计。视听经营分析大数据系统的数据接口设计为三大类:一是全量数据采集接口,包括批量加载接口、实时加载接口以及系统日志采集及解析接口等;二是系统内数据共享接口,分为实时接口和批量接口,分别适用两个应用场景;三是系统外第三方数据共享接口,包括数据脱敏、实时共享和批量共享,其中数据脱敏接口可以设置各种脱敏选项,如目标字段、脱敏算法、关系匹配等。视听经营分析大数据系统应用基于以上视听经营分析大数据系统构建了各种应用,涵盖数据的全生命过程。视听经营分析大数据系统的应用设计比较繁复,以下就其中几个方面进行举例说明。全量数据采集。通过页面或客户端埋码,对页面或客户端用户体验分析的全量数据采集方式以及对接CDN的数据采集等技术方式,对多终端产品(包括手机客户端、PC端、页面等)、播放器等各类信息采集;融合媒体集成播控平台和视听平台等自身数据采集;同步第三方平台用户和经营数据等方式实现平台内容数据、用户数据、用户行为数据、产品经营数据等的全量数据采集工作。数据挖掘及分析。在经营分析系统中,对上述采集到的数据进行统计分析,包括访问、使用、订购、收入等经营类数据,产品、渠道、节目等业务类数据以及聚合量、改编量、转码量、审核量、分发量等平台类数据的数据统计分析,建立分析引擎并行处理各种不同的工作流和算法。同时,建立用户、内容和产品等数据模型,验证和检验这些模型,并通过深度学习来提高模型分析的精准性。实现从数据采集、分析到最终数据应用的整个过程形成良性的闭环式生态循环,让原始数据对产品的经营提供商业价值参考,同时又反哺于原始数据的采集工作,逐步丰富经营分析系统进而不断为用户的使用、内容的质量提升和产品的多元化带来效益。数据可视化展现。数据的可视化展现不仅局限于报表、仪表盘、KPI考核等报表展现方式,还可根据实际数据展现需求,定制、设计各类型数据展现模型,支持多种数据展现的可视化场景模板选取,多种数据库内容的数据源整合,对实时动态业务经营数据、系统实时监控数据以及通过离线方式进行数据加工后的数据等进行展现。支持多终端的数据可视化展现方式,展现终端包含大屏终端、电视终端、PC终端以及不同的移动终端等(如图3、图4)。图3 首页热点大数据分析可视化图示图4 在线媒体投放预警分析图示智能推荐及搜索。基于用户模型、内容相似性模型等数据模型,以及用户搜索行为及热词分析,挖掘不同人群用户的同质化观看习惯,基于用户行为分析结论,并根据内容的内在相关性,快速生成大量的用户兴趣标签,为用户智能推荐其所喜爱的内容,提高用户黏性,展开精细化内容营销,个性化推荐,观众维系挽留,获取新的用户,并进行风险控制,获得价值的最大化。同时结合元数据标签等数据,为经营人员及编辑提供视频素材搜索功能,方便对素材内容进行二次加工(如图5)。图5 智能推荐应用示意图数据拆账及报表输出。基于专业用户(PGC)上传或改编的原创内容产生的数据及产生的收入,根据事先约定的拆账规则,实现PGC用户的数据拆分及内容结算。基于数据的拆账同时包含与经营商合作的相关业务的结算数据的拆账。数据脱敏。对经营分析平台数据的数据脱敏是出于对平台数据输出的安全性考虑。系统数据脱敏首先对多类型的数据源进行统一管理,然后通过脱敏规则发现数据源中的敏感数据,对数据进行脱敏输出,同时支持对脱敏流程的作业化管理。结语以上视听经营分析大数据系统已应用在某国家级视听平台及其与之合作的多个移动视听平台、省网视听平台上,实现了从多个渠道、各种终端的数据采集,对多数据源进行整合和管理,对业务进行深入分析,从而建立了用户模型,挖掘了用户价值,并最终提升该平台的影响力及商业价值。

文章来源:视听纵横 网址: http://stzh.400nongye.com/lunwen/itemid-14438.shtml


上一篇: 暂无
下一篇: 临床医学论文_基于超声BI-RADS最大切面及其垂直切面的乳腺肿瘤纵横比价值再探讨



点击在线投稿

 
/ / /
 
 
 
 

Copyright 2001-2021 400农业期刊网版权所有 做最专业学术期刊论文发表网站
本站不是《视听纵横杂志社》官网,如果需要联系官方杂志社,请联系客服索取网站或者电话。