天天看点

深度学习 用户画像_一种基于深度神经网络的用户画像表示学习系统及方法与流程...

深度学习 用户画像_一种基于深度神经网络的用户画像表示学习系统及方法与流程...

本发明涉及大数据、人工智能、机器学习,特别涉及一种基于深度神经网络的用户画像表示学习系统及方法。

背景技术:

近年来,社交网络迅速发展,用户人数呈爆炸式增长。通过社交网络服务,人们除了进行社交行为,则更多的是将社交网络当成公共的媒体平台,满足社交需求和特定兴趣获取需求。对于用户的专业信息及特定兴趣获取需求,而当前社交网络产品则不能很好的满足该需求,各类用户发表的信息混杂在一起,用户需要自己去甄别其中自己感兴趣的信息。如果对社交网络特定领域中信息走向及分布特点进行深度学习提取特征,则更有利于获取用户的信息特征。

目前用户画像主要通过统计的方式来实现,这种方式往往忽略了用户的一些隐含的一些信息。通过深度学习的方式来学习用户画像,可以对特征进行抽象提炼,特征表示更简洁更精准,也能提取到更深层次的隐含信息。

技术实现要素:

本发明公开一种基于深度神经网络的用户画像表示学习系统,其中包括:意图识别模块,用于根据接收的语句识别用户的使用功能;特征向量提取模块,用于通过深度学习对输入语句文本的上下文关系进行建模,提取到用户使用功能的特征信息;以及用户画像学习模块,用于通过特征信息和监督信息迭代训练,来不断更新用户画像。

优选的,还包括语句接收模块,用于接收用户输入的语句。

优选的,用户输入的语句包含有做非结构化数据处理的语句以及可转为结构化数据的语句。

优选的,所述非结构化数据是指用户输入的语句文本。

优选的,所述结构化数据是指把输入语句转化为实体和关系后的数据。

优选的,所述识别用户的使用功能中包含有多个功能。

本发明还公开了一种基于深度神经网络的用户画像表示学习方法,其中包。括:识别用户的使用功能;提取使用功能的特征信息;以及通过特征信息和监督信息迭代训练,来不断更新用户画像。

优选的,还包括接收用户输入的语句。

优选的,用户输入的语句包含做非结构化数据处理的语句以及可转为结构化数据的语句。

优选的,所述非结构化数据是指用户输入的语句文本。

优选的,所述结构化数据是指把输入语句转化为实体和关系后的数据。

优选的,更新用户画像时要结合监督信息。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明的实施例基于深度神经网络的用户画像表示学习系统的模块图;

图2是本发明的实施例基于深度神经网络的用户画像表示学习的方法流程图。

具体实施例

下面结合附图和具体实施例对本发明的技术方案作进一步更详细的描述。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。

如图1所示为根据本发明的实施例基于深度神经网络的用户画像表示学习系统的模块图100。如图1所示,用户画像表示学习系统100中包括有语句接收模块101、意图识别模块102、特征向量提取模块103以及用户画像学习模块104。其中语句接收模块用于接收用户输入的语句,接收到用户的语句后发送至意图识别模块102,意图识别模块102用于根据用户的语句识别用户想要使用的功能,比如用户希望闲聊、点播或是调教等等功能,可以是众多功能中的一个或者多个。针对每一种不同的功能需求,可以按结构化数据和非结构化数据进行区分。具体地,结构化数据是指把输入语句转化为实体和关系后的数据。而比如闲聊输入的语句,调教的语句可以作为非结构化数据,点播输入的语句数据可以提取出对应的点播实体。其中用户输入的语句包含有做非结构化数据处理的语句以及可转为结构化数据的语句。

在一个实施例中,用户输入的语句文本设定为非结构化数据。当意图识别模块102获取到用户想要使用的功能后,特征向量提取模块103根据非结构化数据,通过深度学习对输入语句文本的上下文关系进行建模,提取到用户使用功能的特征信息值。在获取到特征信息值后,用户画像学习模块104通过特征信息和监督信息迭代训练,来不断更新用户画像。而对于结构化数据,使用深度学习对实体之间的关系进行建模,再通过少量监督信息更新用户画像,最终获取高质量的用户画像。具体地,结构化数据是指把输入语句转化为实体和关系后的数据。

图2是本发明的实施例基于深度神经网络的用户画像表示学习的方法流程图。图2将结合图1进行描述。如图2所示,步骤S201,用户输入语句文本;根据用于输入的语句文本判断用户的意图。步骤S202,获取到用户的意图信息,比如用户输入的是闲聊语句、点播语句或者调教语句等。对获取到的用户意图信息进行特征提取,主要是通过深度学习提取特征向量。步骤S203,提取到用户意图信息的特征向量,比如闲聊向量、点播向量或者调教向量等等。步骤S204,用户画像更新,通过特征信息和监督信息迭代训练,来不断更新用户画像。

图2中所示以三种意图判断为实施例来描述本发明,但应该理解的是本发明并不局限于这三种意图的输入(即闲聊意图、点播意图或调教意图),也可以是其他类型的意图输入。

在一个实施例中,用户输入的语句文本设定为非结构化数据。获取到用户想要使用的功能后,根据非结构化数据,通过深度学习对输入语句文本的上下文关系进行建模,提取到用户使用功能的特征信息。在获取到特征信息值后,结合少量的监督信息,更新用户画像。而对于结构化数据,使用深度学习对实体之间的关系进行建模,再通过少量监督信息更新用户画像,最终获取高质量的用户画像。具体地,结构化数据是指把输入语句转化为实体和关系后的数据。

综上所述,本发明提出了一种深度神经网络的用户画像表示学习系统及方法,通过分析用户的特征,更新用户画像,从而获取高质量的用户画像。

显然,本领域的技术人员应该理解,上述的本发明的各模块或各步骤可以用通用的计算系统来实现,它们可以集中在单个的计算系统上,或者分布在多个计算系统所组成的网络上,可选地,它们可以用计算系统可执行的程序代码来实现,从而,可以将它们存储在存储系统中由计算系统来执行。这样,本发明不限制于任何特定的硬件和软件结合。

以上所揭露的仅为本发明实施例中的较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。