数据智能

2023爱分析·跨模态信息检索平台市场厂商评估报告:蜜度

随着企业数据规模膨胀、类型逐渐丰富,对于不同模态的相同信息往往有同样的检索需求。

2023年09月05日
  • 数据智能

 

01 研究范围定义

人工智能是指运用机器学习/深度学习、自然语言处理、计算机视觉、知识图谱等技术,并结合业务场景形成解决方案,以辅助、增强或替代人工来制定决策或执行任务。
爱分析从产业链角度,把人工智能市场划分为基础设施层、AI平台层和应用层,具体市场划分详见下图。

本评估报告聚焦应用层的跨模态信息检索平台市场,爱分析遴选出具备成熟解决方案和落地能力的厂商,为企业选型提供参考。同时,在该市场下,爱分析重点选取了跨模态信息检索平台厂商蜜度进行能力评估。

02 跨模态信息检索平台市场分析

市场定义:

跨模态检索平台是指以一种类型的数据作为查询输入,检索另一种类型数据的平台,主要应用于舆情分析、口碑分析、视频溯源、智能预警等领域。

甲方终端用户:

企业营销部门、市场部门;媒体编辑;政府宣传部门、内容监管部门

甲方核心需求:
随着数据规模膨胀、类型逐渐丰富,数据的存储方式也呈现出多模态形式。当企业、媒体和政府部门用户出于舆情管理、内容监管等原因进行信息检索时,对于不同模态的相同信息,往往有同样的检索需求,跨模态信息检索平台应运而生。
各类用户对于跨模态信息检索平台的基础需求包括快速、全面和准确。近年来,随着信息数量和隐蔽性的增加,粗颗粒度的跨模态检索结果逐渐难以满足用户要求,细颗粒度检索需求也逐渐显现。

图1:甲方对跨模态信息检索平台的核心需求

  • 企业需要跨模态检索结果覆盖全面。互联网数据规模持续扩张,信息分布呈现多模态、多渠道的特点。一方面,短视频的兴起使得视频类信息数量激增,关键信息可能作为某一帧画面的一部分出现,具有更强的隐蔽性,传统检索方式很难准确识别。另一方面,随着网络信息渠道的多元化,相同的信息可能出现在多个网站,容易产生“漏网之鱼”。以上因素对企业和政府部门的舆情管理提出更高要求。为保证信息获取的完整性和舆情管理的有效性,企业和政府部门需要对互联网公开信息进行跨模态全面检索,不遗漏关键信息。
  • 企业需要具备跨模态信息监测能力,快速发现多模态舆情信息。舆情和品牌风险管理是跨模态信息检索平台的重要应用场景。以企业品牌风险管理为例,公关事件对企业响应速度提出很高要求,企业需要及时发现舆情,迅速做出回应。如果应对速度缓慢,会导致网络舆情发酵,对企业声誉乃至业务产生更严重的影响。为此,企业需要具备跨模态品牌风险监测能力,快速发现多模态舆情信息。
  • 企业需要提高跨模态信息检索准确性,保障搜索效率。用户通过关键词、图片、视频等搜索方式,从跨模态信息检索平台获取信息后,还需要从中筛选出满足需求的结果。如果检索结果中包含过多与搜索目标不相关的内容,用户会浪费大量时间进行二次筛选。为此,企业需要提高跨模态信息检索准确性,从而保障用户信息搜索效率。
  • 企业需要细化跨模态检索信息颗粒度,一步获取关键信息。随着信息数量和隐蔽性的增加,粗颗粒度的检索结果逐渐难以满足用户需求。以视频检索为例,常见的跨模态检索只能筛选出特定的视频片段,需要用户自行从中筛选所需信息。以图片检索为例,当用户输入“海滩”时,只能得到带有“海滩”关键字的图片,需要二次筛选出包含海滩场景的图片。如今企业对跨模态检索结果的颗粒度要求逐渐细化,需要从视频中抽取特定的片段甚至关键帧,一步获取关键信息。