字体
关灯
   存书签 书架管理 返回目录
    第105章 没有低级的专利(第 2/4 页)

    说到低级和高级之分,专利本身拿出来并没有低级和高级的分别。

    但在一个研究体系中却因负责的分工不同所处的层次不同会出现低级和高级之分。

    在lin hui提出了生成式文本摘要算法之后。

    现在的自动文摘实现方法主要分为抽取式方法和生成式方法。

    经过近期对生成式摘要算法技术路线的研究伊芙·卡莉已经能够很容易的理解生成式文本摘要和传统抽取式文本摘要的区别。

    所谓的抽取式摘要是从原始文档中提取关键文本单元来组成摘要。

    而生成式摘要则是根据对输入原始文本的理解来形成摘要,生成式摘要模型试图去理解文本的内容,可以生成原文中没有的单词,更加接近摘要的本质,具有生成高质量摘要的潜力。

    虽然这两者在具体摘要上略有区别,但此二者本质上都是自动文本摘要。

    既然二者都是自动文本摘要,那么这两者的技术框架就都可以概括为:

    内容表示→权重计算→内容选择→内容组织。

    1内容表示是将原始文本划分为文本单元的过程,主要是分字、词、句等预处理工作;

    内容表示的主要目的是通过预处理将原始文本处理成算法容易进行分析的形式。

    2权重计算则是要对文本单元(即预处理后原始文本)计算相应的权重评分,权重的计算方式多样,如基于特征评分、序列标注、分类模型等提取内容特征计算权重。

    这个步骤的目的是通过这一系列计算完成对预处理后的原始文本实现初步分析。

    3内容选择是对经过计算权重后的文本单元(即经过步骤2权重分析过的文本)选择相应的文本单元子集组成摘要候选集,可根据要求的摘要长度、线性规划、次模函数、启发式算法等选择文本单元;

    4内容组织是指对候选集的内容进行整理形成最终摘要,可根据字数要求按顺序输出,也有研究者提出使用基于语义信息、模板和神经网路学习的方法来产生符合要求的摘要。

    -->>(第 2/4 页)(本章未完,请点击下一页继续阅读)
上一页 目录 下一页
最近更新 重生2011,二本捡漏985 割鹿记 别叫我恶魔 怪谈游戏设计师 苟成圣人,仙官召我养马 红色莫斯科 他比我懂宝可梦 重生都市仙帝 那就让她们献上忠诚吧! 元始法则 我在修仙界万古长青 退下,让朕来 寒门宰相 全职剑修 死灵法师 东晋北府一丘八 我对念能力超有兴趣 别再催眠我了,反派皇女! 星空职业者 精灵,谁让他做道馆馆主的
最多阅读 剑名不奈何 着迷 顶级猎食者 我亲爱的法医小姐 感化主角失败以后[穿书] 是心跳说谎 女配没有求生欲 隔壁机长大叔是饿狼 反派肆意妄为[快穿] 邢棒穿越皇宫一名假太监芳华夫人完整版 HP同人之格林童话 主角姜栀商池 看鸟吗哥 疾风吻玫瑰 主角是邢棒芳华夫人 宝莲灯之风流猎艳 嘘,国王在冬眠 我五行缺你 金牌调解员[快穿] 日夜妄想