字体
关灯
   存书签 书架管理 返回目录
    第四十章 搜索引擎算法(第 3/3 页)

    这里还有一个小小的心理问题,那就是同行之间很少会做超链接,所以拥有更多垂直类网站链接的网站,它的专业性肯定比被乱七八糟网站链接的网站要更大概率靠谱。

    第二,建立关键词库热度排序机制,现在的几家搜索引擎企业都对网页做了排序,而我对关键词也做了排序,而且给关键词做排序非常简单,那就是看用户的搜索量。

    就比如今天搜索汽车的用户最多,那么汽车的评分可能就是10分,这个时候,算法会分配更多的资源到汽车相关的信息上去,去抓取更多的优质网页。

    这里有四个好处,提升信息反馈速度、增加热点反馈的时效性、节约计算机资源以及围绕最终目的,让更多使用我们搜索引擎的用户得到有用信息。

    第三,用户反馈机制,也就是跟踪用户的点击情况和浏览情况。

    还是用汽车举例,有100个用户搜索汽车后,80个点击了a网页,a网页的评级就会上升,如果有更多的用户在a网页的停留时间较长,a网页的评级也会上升,如果有更多的用户在a网页上直接进行链接等操作,a网页的评级也会上升。

    也就是说,在整个网页评级系统中,加入用户反馈分。

    第四,规律算法,在用户的所有行为中寻找大概率行为,并将这些大概率反馈到人工,比如说60%搜索了汽车的用户下一个搜索词都是保险。

    这样的一些规律我们是无法预测的,但我们可以利用算法进行大数据挖掘,回馈的这些结果可以供人工分析部对一定的网页进行评分,这个就是人工分。

    结合以上四点,在我的算法下,任何一个网页同样会有一个分数,我称其为精度分。

    影响精度分的因子包括自己评分,链接的垂直网站评分,用户反馈分,人工制定分以及外链影响等。”

    之后,孟谦浅尝辄止的展示了各个分支的算法逻辑和算法推演公式。

    然而就在孟谦在说最后一个规律算法的过程中,来自ibm的杰尔夫突然起身惊呼,“oh my gad!artificial intelligence?!”

    孟谦转过头看了一眼对方,皱了皱眉。

    杰尔夫顿了顿,以为孟谦是没听懂,用奇怪的发音道,“卧槽!!!”

    ...

    而随着杰尔夫的打断,原本都沉浸在孟谦分享中的其他四名技术人员,眼神也都出现了明显的变化...
上一页 目录 下一章
最近更新 刚准备高考,离婚逆袭系统来了 华娱从男模开始 我在直播间窥探天机 重燃青葱时代 港片:你洪兴仔,慈善大王什么鬼 讨逆 盖世神医 舔狗反派只想苟,女主不按套路走! 牧者密续 那年花开1981 1987我的年代 修罗剑神 混沌天帝诀 1979黄金时代 大国军垦 至尊战王 巅峰学霸 女总裁的全能兵王 国潮1980 超级修真弃少
最多阅读 攻玉 刺青 好运时间 慢性沉迷 雪意和五点钟 上瘾 白色口哨 痛仰 仵作惊华 理我一下 黑天 漂亮朋友 洞房前还有遗言吗 顶级诱捕公式 敬山水 俗人回档 攻略病娇男配的正确方法 甜妻 杀死那个白月光 穿书后每天都在被迫撒娇