字体
关灯
   存书签 书架管理 返回目录
    第126章 飘洋过海的邮件(第 3/4 页)

    人类社会记录方式的进步,某种程度上就集中表现在文本的不同凝练形式上。

    文本的探索,对于一些大型企业来说,也是一项极为重要的工作。

    涉及到文本摘要的发展,决定着一项又一项的产品的问世。

    对于文本的探索,不仅仅对文学的深入研究有着很高的促进性,同样对于科技的推进有着巨大的促进作用。

    总而言之,对文本摘要倾注些心血不过分。

    毕竟这是林灰在技术领域方面迈出的第一步。

    说到伊芙·卡莉遇到的困惑。

    林灰没想到伊芙·卡莉的困惑主要集中在lh文本摘要准确度衡量模型的构建上。

    林灰记得当时他关于这个模型构建已经阐述的够清楚的了。

    构建模型的话首先要运用语言模型来评估算法生成语言的流畅度,然后使用相似度模型评估文本和摘要之间的语义相关性,最后为了有效评估实体、专有词的复现程度,引入原文信息量模型来评估。

    虽然为了避免教会徒弟饿死师傅,林灰在这几个步骤之间故意遗漏了一些琐屑的步骤。

    不过这种东西对于科研工作者来说,就像堑壕之于坦克。

    虽然会有一些影响,但问题应该不大。

    真的把所有的技术细节全部公布出来。

    那也不能叫做公布技术路线了,那叫编教科书。

    对于林灰提到的“运用语言模型来评估算法生成语言的流畅度”

    伊芙·卡莉比较困惑林灰是怎么搞定语言模型训练的语料库的?

    这个问题往后几年的话还真不是问题。

    因为现成的语料库就一大堆。

    仅仅是简体中文方面的语料库就有国家语委现代汉语语料库、京大语料库、语料库语言学在线等若干资源。

    不过换到现在这个时空节点林灰显然不能跟别人研究人员说他用的是现成的预料库。

    -->>(第 3/4 页)(本章未完,请点击下一页继续阅读)
上一页 目录 下一页
最近更新 重生2011,二本捡漏985 割鹿记 别叫我恶魔 怪谈游戏设计师 苟成圣人,仙官召我养马 红色莫斯科 他比我懂宝可梦 重生都市仙帝 那就让她们献上忠诚吧! 元始法则 我在修仙界万古长青 退下,让朕来 寒门宰相 全职剑修 死灵法师 东晋北府一丘八 我对念能力超有兴趣 别再催眠我了,反派皇女! 星空职业者 精灵,谁让他做道馆馆主的
最多阅读 剑名不奈何 着迷 顶级猎食者 我亲爱的法医小姐 感化主角失败以后[穿书] 是心跳说谎 女配没有求生欲 隔壁机长大叔是饿狼 反派肆意妄为[快穿] 邢棒穿越皇宫一名假太监芳华夫人完整版 主角姜栀商池 HP同人之格林童话 主角是邢棒芳华夫人 看鸟吗哥 疾风吻玫瑰 宝莲灯之风流猎艳 嘘,国王在冬眠 金牌调解员[快穿] 日夜妄想 我五行缺你