字体
关灯
   存书签 书架管理 返回目录
    第100章 谷歌产生浓厚兴趣(第 3/4 页)

    反正进行了一晚上尝试的伊芙·卡莉发现想要进行复现很难。

    抛开linhui提出的算法技术本身不谈。

    就是lin hui在生成式摘要算法专利中顺手牵羊搞定的那个“lh文本摘要准确度衡量模型”

    其他团队想要从无到有的构建一个同样的模型都有亿点困难。

    说起来lh文本摘要准确度衡量模型的构建过程思路倒是很清晰:

    第一,运用语言模型来评估算法生成语言的流畅度;

    第二,使用相似度模型评估文本和摘要之间的语义相关性;

    第三,为了有效评估实体、专有词的复现程度,引入原文信息量模型来评估。

    然鹅也仅仅是说起来很简单而已。

    说到把大象放进冰箱也很简单同样是三步:

    ——打开冰箱门,放进大象,关上冰箱门。

    知道怎么做没用,关键还是要执行。

    没办法执行的话,步骤再清晰也没用。

    lh文本摘要准确度衡量模型的构建过程有三步。

    第一步就很复杂。

    该怎么进行语言模型的构建呢?

    按照lin hui提出的技术路线。

    语言模型建模过程中,包括词典、语料、模型选择等。

    问题出在语料库上,语料库一词在语言学上意指大量的文本。

    这类文本通常经过整理,具有既定格式与标记。

    涉及到英文语料库的信息还比较容易,毕竟伊芙所在的团队和牛津、哈佛、耶鲁三所大学的语言学方面都是深度合作的关系。

    但涉及到中文以及其他文字预料信息该怎么处理这就完全不好说了。

    巧妇难为无米之炊。

    没有语料库清楚技术路线什么的也没用。

    倒是可以姑且先抛弃对中文以及其他新闻生成式摘要的研究。

    但是这样几乎等同于放弃了一个庞大的市场。

    而且最关键的是lin hui提出的算法本身就能兼顾中文新闻摘要以及英文新闻摘要。

    那么之后lin hui会不会直接开发个中文新闻处理成英文摘要的功能呢?

    能搞定文本摘要处理算法的人没道理一个翻译算法都搞不定吧??

    伊芙·卡莉越想越觉得这种可能性很大。

    不然为什么一个摘要软件要做成类似于翻译软件那样的交互风格呢?

    在她们还在踌躇不前的时候。

    对手却早已经大步向前挺进了。

    一时之间伊芙不禁有种酣战过后的无力感。

    这就是所谓的一步落后步步落后吧。

    这种情况还评估啥?

    直接建议谷歌方面把lin hui的算法买回来就好了!

    虽然lin hui是华国人.

    但这种技术又不是什么涉及到国家命脉的重要技术。

    总不至于不卖吧!

    不卖的话谋求专利授权也可以啊!

    总不至于非跟在别人身后造轮子吧。

    伊芙又没受/虐/欲。

    ……

    事实上,不止海外在关注林灰折腾出的算法。

    國内也注意到林灰搞出的动静。

    -->>(第 3/4 页)(本章未完,请点击下一页继续阅读)
上一页 目录 下一页
最近更新 重生2011,二本捡漏985 割鹿记 别叫我恶魔 怪谈游戏设计师 苟成圣人,仙官召我养马 红色莫斯科 他比我懂宝可梦 重生都市仙帝 那就让她们献上忠诚吧! 元始法则 我在修仙界万古长青 退下,让朕来 寒门宰相 全职剑修 死灵法师 东晋北府一丘八 我对念能力超有兴趣 别再催眠我了,反派皇女! 星空职业者 精灵,谁让他做道馆馆主的
最多阅读 剑名不奈何 感化主角失败以后[穿书] 顶级猎食者 主角姜栀商池 我亲爱的法医小姐 女配没有求生欲 隔壁机长大叔是饿狼 是心跳说谎 反派肆意妄为[快穿] 看鸟吗哥 HP同人之格林童话 宝莲灯之风流猎艳 主角是邢棒芳华夫人 邢棒穿越皇宫一名假太监芳华夫人完整版 新婚燕尔 日夜妄想 穿书八零军官老公是个宠妻狂魔江念姿沈程 着迷 你老婆掉了 金牌调解员[快穿]