金融界2024年1月13日消息,据国家知识产权局公告,阿里巴巴(中国)有限公司申请一项名为“文本分类方法、装置、设备和计算机可读存储介质“,公开号CN117390192A,申请日期为2023年11月。
专利摘要显示,本申请实施例公开了一种文本分类方法、装置、设备和计算机可读存储介质。主要技术方案包括:获取待分类文本;从第一数据库中检索得到K个候选文本,候选文本与待分类文本之间的相似度满足预设相似度要求,K为正整数,其中第一数据库包括标注有标签路径信息的第一文本样本;利用待分类文本、候选文本以及候选文本被标注的标签路径信息生成提示指令,将提示指令输入预测模型,获取预测模型依据提示指令预测得到的待分类文本的标签路径信息,预测模型基于LLM(大语言模型)实现;其中,文本的标签路径信息包括文本在层次标签结构的C个层级上对应的类别标签,C为大于1的正整数。本申请能够提高文本分类的准确性。
来源:金融界