你所在的位置: 首页 > 正文

【专利解密】科大讯飞为你“量身”播放音乐

2019-08-22 点击:1014

半导体投资联盟我想在3天前分享

据微网消息,7月16日下午,Keda Xunfei发布了非公开发行股票和上市公告,并向10位新一代投资者发行了1.08亿股新股。感知和认知智能。核心技术研发,智能语音人工智能开放平台,销售和服务系统升级建设项目。

image.php?url=0MpUGFR7mN

随着现代生活水平的不断提高,人们对娱乐的需求也越来越多样化。计算机技术和图像识别技术已经逐渐应用于日常生活的各个领域,例如,在数亿人中。快速定位目标人物,并根据脸部图像判断面部表情信息。目前,随着音视频内容的多样性,音视频压缩技术的成熟以及存储技术的提高,基于人脸图像推荐音乐的应用已经有很多,它们将音乐和图像呈现给用户以新的形式。一直受到越来越多用户的关注和喜爱。

事实上,早在7月30日,15日,Keda Xunfei申请了一项名为“基于面部的音视频推荐方法和系统”的发明专利(申请号:9),申请人为Keda Xunfei。有限公司

根据目前公布的专利资料,让我们来看看香港科技大学的这个音视频推荐系统。

image.php?url=0MpUGFQaAP

上图为音视频推荐方法的流程图,具体包括以下步骤。

首先,接收包含用户发送的面部的用户图像。这些用户图像可以是包含用户使用移动终端设备拍摄的人脸的图像。可能存在:用户的自拍,朋友的照片,家庭成员的家庭照片等。

其次,确定用户图像中的面部数量,包括面部的面部检测和局部特征点位置。可以预先收集大量包含人脸的用户图像,通过提取尺度不变的特征转换特征来训练人脸和非人脸的分类模型,并通过使用该人脸图像检测用户图像中的人脸。模型。在确定用户图像中所有面部的位置之后,在位置区域上检测面部特征点以确定面部的局部特征点(诸如眼睛,眉毛,鼻子,嘴和面部轮廓)的位置。

然后,根据用户图像的面部检测和面部的局部特征点位置结果,可以确定用户图像中的面部数量。如果是1,执行1):

1)提取与单面用户图像有关的特征信息:单面特征提取主要包括根据单个面部信息获取用户属性相关信息(如年龄,性别,化妆等),计算星形相似度,获取用户。图像的拍摄时间。

如果有多个,请执行2):

2)提取包括多个面部的图像特征信息:对于包括多个面部的用户图像,可以提取的图像特征信息可以包括:整体图像氛围,面部亲和力等。

如果不包含面部,则不建议使用音频和视频推荐或推荐的预设音频和视频。

最后,根据提取的图像特征信息确定推荐给用户的音频和视频,并向用户推荐音频和视频。

在了解了科技大学的音视频推荐方法后,您是否仍然觉得它非常神奇,因为这种智能技术仍然与人们的生活有一定距离,而且还需要产品登陆。但是想到扬声器可以看到自己喜欢的音乐,真是令人兴奋,让我们期待这类产品的到来!

收集报告投诉

据微网消息,7月16日下午,Keda Xunfei发布了非公开发行股票和上市公告,并向10位新一代投资者发行了1.08亿股新股。感知和认知智能。核心技术研发,智能语音人工智能开放平台,销售和服务系统升级建设项目。

image.php?url=0MpUGFR7mN

随着现代生活水平的不断提高,人们对娱乐的需求也越来越多样化。计算机技术和图像识别技术已经逐渐应用于日常生活的各个领域,例如,在数亿人中。快速定位目标人物,并根据脸部图像判断面部表情信息。目前,随着音视频内容的多样性,音视频压缩技术的成熟以及存储技术的提高,基于人脸图像推荐音乐的应用已经有很多,它们将音乐和图像呈现给用户以新的形式。一直受到越来越多用户的关注和喜爱。

事实上,早在7月30日,15日,Keda Xunfei申请了一项名为“基于面部的音视频推荐方法和系统”的发明专利(申请号:9),申请人为Keda Xunfei。有限公司

根据目前公布的专利资料,让我们来看看香港科技大学的这个音视频推荐系统。

image.php?url=0MpUGFQaAP

上图为音视频推荐方法的流程图,具体包括以下步骤。

首先,接收包含用户发送的面部的用户图像。这些用户图像可以是包含用户使用移动终端设备拍摄的人脸的图像。可能存在:用户的自拍,朋友的照片,家庭成员的家庭照片等。

其次,确定用户图像中的面部数量,包括面部的面部检测和局部特征点位置。可以预先收集大量包含人脸的用户图像,通过提取尺度不变的特征转换特征来训练人脸和非人脸的分类模型,并通过使用该人脸图像检测用户图像中的人脸。模型。在确定用户图像中所有面部的位置之后,在位置区域上检测面部特征点以确定面部的局部特征点(诸如眼睛,眉毛,鼻子,嘴和面部轮廓)的位置。

然后,根据用户图像的面部检测和面部的局部特征点位置结果,可以确定用户图像中的面部数量。如果是1,执行1):

1)提取与单面用户图像有关的特征信息:单面特征提取主要包括根据单个面部信息获取用户属性相关信息(如年龄,性别,化妆等),计算星形相似度,获取用户。图像的拍摄时间。

如果有多个,请执行2):

2)提取包括多个面部的图像特征信息:对于包括多个面部的用户图像,可以提取的图像特征信息可以包括:整体图像氛围,面部亲和力等。

如果不包含面部,则不建议使用音频和视频推荐或推荐的预设音频和视频。

最后,根据提取的图像特征信息确定推荐给用户的音频和视频,并向用户推荐音频和视频。

在了解了科技大学的音视频推荐方法后,您是否仍然觉得它非常神奇,因为这种智能技术仍然与人们的生活有一定距离,而且还需要产品登陆。但是想到扬声器可以看到自己喜欢的音乐,真是令人兴奋,让我们期待这类产品的到来!

深圳新闻网 版权所有© www.u4321.cn 技术支持:深圳新闻网 | 网站地图