第12章 猛男(第 4/4 页)
他一边说一边写:“有的人管他叫圈儿,有的人管他叫皮蛋,也有的人也读q但发音不太标准咱们的语音识别系统可能会识别成秋或者扣。”
好家伙,这就“咱们的语音系统”了。
白板上又多了“圈儿”、“皮蛋”、“q”、“秋”、“扣”这么五个词。
陆启讲这五个词依次画上箭头,全部指向原来的那个“q”,转身面向三人:“我希望我们无论识别到这五个词中的哪一个,都会自动映射为q,作为最终的输出结果。”
三人点点头,他们明白了陆启的意思,这个很好理解。
陆启继续道:“我把这个叫做‘关键词’识别,刚才几个就是关键词。我知道语音识别技术目前的难点在于连续语音和海量词汇识别。”他抬头征询了一下王敢先和秦慧明的意见,见两人点头认同便又继续道:“但这个游戏项目完全相反,这是独立的关键词加上完全封闭的环境,只有识别到游戏本身相关的关键词才做出反馈,其他内容则直接略过。”
“比如玩家说‘小老虎’,无论是识别成功还是识别不准确变成了‘小脑斧’或“小老夫”都没关系,因为这里边儿没有关键词,咱们压根不反馈。”
“请问有电脑吗?”陆启从背包里掏出一个u盘。
秦慧明很快从办公间搬过来一台笔记本电脑,陆启插上u盘,点开了一张流程图和一份表格文档。
“这是整个语音识别流程的流程图。”
陆启将流程图放大,其实并不算很复杂,也就二十多个判断节点,但将整个流程的逻辑梳理得非常清楚,从用户语音输入,汇讯系统语音识别,判断是否含有关键词,最终根据这些关键词选出各种牌型的过程展示得一清二楚。
在场的除了陆启又都是程序员,一看便了然于胸。
“这个并不复杂,我们的接口只要稍加改动就行。”王敢先略加思索道:“这个其实主要不是我们这边的工作量,主要是你们自定义的关键词表是不是能够涵盖尽量多的用户说话习惯。”
“对头!”陆启打了个响指,然后切换到那份表格:“这是我罗列的所有关键词,不多,目前我想到的有……”陆启将表格下拉看了眼:“784个,但这个需要我们那边自己就可以编辑直接放到游戏里,因为我后续肯定还会往里面增加不少内容,主要是用户说的东西你们识别成什么,我根据识别结果加进去。”
784个,乍一看似乎有点多,但比起我们平时说话的所有用词,简直沧海一粟,保持在这种三四位数的量级,语音识别准确率将会提升非非非非非常多。
几个人凑前一看,好家伙,一堆什么“对钩”、“尖顺子”、“大鬼”、“王炸”、“四个八”还有各种中文加英文字母的组合,看起来简直像乱码一样的东西。
威猛像重新认识了一遍陆启似的:“这些东西是你昨晚一晚上弄出来的?”
“是啊。”陆启又端起水杯,得,水又没了。
王敢先和秦慧明听见也是一脸难以置信的模样,互相对视了一眼,都听到了对方咽唾沫的声音。
一晚上?难怪看这哥们儿的样子就是刚通宵过,但一晚上就弄出来这些,这都什么工作效率啊,魔核哪儿找的这位,也忒猛了点儿吧。