上海哔哩哔哩申请视频分类模型生成方法和装置专利,减少构建数据集所需时间

哔哩哔哩新专利:视频分类模型的创新方法

2024年12月5日,国家知识产权局公布了一项由上海哔哩哔哩科技有限公司申请的新专利,名为“视频分类模型的生成方法和装置”,公开号为CN 119068251 A,申请日期为2024年8月。

这项专利介绍了一种创新的视频分类模型生成方法及其装置。该方法首先获取一个初始的数据集(第一数据集)、预设的分类标签以及基于CLIP的图像处理模型。通过这个基于CLIP的图像处理模型,根据预设的分类标签对第一数据集中的每一张图像进行初步分类,生成每个图像对应的“伪标签”。接下来,根据这些伪标签从第一数据集中筛选出更为精确的第二数据集。4.利用第二数据集来进一步训练基于CLIP的图像处理模型,最终生成目标视频分类模型。

这一方法的亮点在于,它通过在现有的CLIP预训练模型基础上,结合特定任务的文本提示(Prompt),对少量的图像数据集进行预分类,再利用预分类结果作为伪标签进行模型训练。这种方法不仅显著减少了为特定任务训练模型所需的手动标注工作量,也大幅缩短了构建高质量数据集的时间,提高了模型训练的效率和准确性。

哔哩哔哩的这项技术创新,有望在未来视频内容管理、推荐系统等领域发挥重要作用,提升用户体验的同时,也为公司带来了新的技术竞争优势。