北京爱奇艺申请提升长文本理解能力的专利,涵盖长文本处理方法
爱奇艺申请长文本处理新专利
2024年12月18日,国家知识产权局公示了北京爱奇艺科技有限公司的一项新专利,名为“长文本处理方法、装置、电子设备及存储介质”。该专利的公开号为CN 119128050 A,申请日期为2024年8月。
专利技术详解
这项专利主要涉及一种长文本处理方法及其相关装置、电子设备和存储介质。具体来说,该方法通过以下步骤实现:
1. 获取特征:1.系统会获取目标长文本中当前词元的当前键特征、当前值特征和当前查询特征,同时还会获取上一词元对应的第一全局状态特征。
2. 编码器处理:接着,将当前键特征、当前值特征和第一全局状态特征输入到编码器中。编码器会输出一个包含当前词元及其之前所有词元高层语义信息的第二全局状态特征。
3. 解码器生成:4.将第二全局状态特征与当前查询特征输入到解码器中,解码器会输出当前词元的词元表示。
技术优势
这项专利的主要优势在于其能够显著节省存储和计算资源,同时有效解析高层语义信息,并融合长距离的上下文信息。这不仅提升了模型对长文本的理解能力,还为实际应用提供了更高效、更准确的解决方案。
通过这一创新,爱奇艺在长文本处理领域迈出了重要一步,有望在未来的文本分析、内容推荐等方面发挥重要作用。