第七十九章
“现场演示?”周青山哈哈大笑起来,撇撇嘴说道:“就算我是中文系的,也知道一款输⼊法软件的开发周期需要很久。你们公司成立多长时间了?有一个月吗?侯世达你当自己是主角了吧?一晚上就能写出个世界第一的浏览器程序来,哈哈哈哈!”
侯世达淡淡的看了他一眼,心里其实很奇怪。按说帝邮在国內也算排的上号的好大学了,能考上的不可能智商欠费,但怎么生学会里扎堆的都是这么一类人呢?事儿妈、小心眼、没有自知之明,表面上看好像会做人,其实反而让人打心眼里讨厌。
这周青山按说造型不差,放电视剧里起码都能活十分钟。怎么一张嘴,就让人有种他欠揍的冲动…
“哦,周会长还知道自己是中文系的啊?”侯世达呵呵轻笑,头摇道:“那就请你闭嘴,我们软件专业的问题,你算老几?”
“你…”
周青山何曾被人这么抢⽩过,当真是差点没被气的翻⽩眼来。不过看周围同学们的眼神,也都是差不多一样的轻视。
侯世达失望的头摇道:“你什么?以你的智商,我很难和你解释什么叫做测试版的。”
“哈哈哈哈——”
周围传来一阵笑声,众人心中也觉得周青山和侯世达这次<img src="in/jiao.jpg">锋真是找<img src="in/nue.jpg">,他一个文科生和人家专业程序员起腻,真不知道脑袋怎么想的。
周青山被气的脸⾊一阵发⽩,恨恨的点头道:“好,那我就看你怎么把牛⽪吹破。”
侯世达转过⾝来,不再把注意力放在他的⾝上,而是走到了木架旁边。他掀开木架上的第一页纸,第二页纸上面画了一个树状图,就听他说道。
“在展示我们的內部开发测试版之前,我先简要的说一下六耳输⼊法的实现原理吧。”
“这是一幅我们人类负责语言思维的决策树状图,我认为人类的语言并非只是一种信息传递协议,更是认知世界的重要工具。输⼊法若想理解人类的‘语法’,首先得了解人类思考的两大部分——知识和智能。可以说人类所谓的智慧,就是由这两部分构成的。而一直以来的输⼊法,对数据的处理方式,都是用计算机理解的二维表格数据库模式。正是这种和人类思维完全不同的数据处理方式,导致了现在的数据炸爆问题。”
…
侯世达不断的将木架上的⽩纸掀开,从人类思维的模式开始侃侃而谈。
别看未来所谓的智能输⼊法好像遍地开花,于是就觉得这东西非常简单。恰恰相反,识别率越⾼的输⼊法对技术要求就越⾼。尤其是侯世达对六耳输⼊法并不満⾜于实现整句输⼊为止,而是必须在整句输⼊的前提下能够实现至少95%的首次输⼊正确率。
如果只是打出拼音来,然后判断每个词的组成,最后用几个词语组成一句不通的句子,那用微软的智能abc就能做到,用户不过多敲打几下空格而已。但要做到整句输⼊,就是要让用户一次输⼊整个句子,一气呵成。让后面的词语能够<img src="in/gen.jpg">据前面的內容、语义进行自动关联,这种对数据的要求,是传统表型数据无法提供的。
人类对语言的处理过程,不是二维结构,而是一种空间坐标形式存在的。要想让计算机实现人类的“联想”能力,就要让数据像人类处理知识一样,具有进行空间排列。若想能够对数据进行分析、归类和查找,就要知道人类的脑海中知识是如何存在的?归<img src="in/gen.jpg">结底,是一个个神经元中的电脉冲。而神经元肯定不是二维结构,而是所有脑细胞组成的三维结构。
一个神经元被<img src="in/ji.jpg">活之后,会向它附近所有的神经元发<img src="in/she.jpg">一束电脉冲。一个神经元发<img src="in/she.jpg">的电脉冲不⾜以<img src="in/ji.jpg">活另一个神经元,但如果一个神经元在一个单位时间內有多个电脉冲抵达,那就会被<img src="in/ji.jpg">活,这就是人类思考的过程。
智能输⼊法中用户输⼊的每一个词,都会向后面的其他词语添加一个阈值。当后面某个词的阈值突破临界点之后,就可以进⼊备选的范围之內。而这个备选数据库,就是解决信息炸爆问题的关键。因为它是一个三维矩阵形式的数据库,通过knn近邻算法,就能实现非常⾼的选择准确率。
尤其是通过这种算法,还能对词库里没有出现过的新词,经过几次训练之后就实现机器学习。这一点对无法穷尽人类词语的词库来说,意义特别重大。
然而这些侯世达的同学们,谁也没有想过原来数据还能有三维的组织形式!这对他们来说,不啻是打开了一扇新天地的大门!
不仅是下面的同学们听的目眩神<img src="in/mi2.jpg">、如痴如醉,就连周青山⾝边几个⾼材生,听的都目光炯炯有神。
或者应该说,正因为他们都是学校里的⾼材生,对侯世达说的这些理论上的东西,理解的反而更加深⼊!
虽然侯世达说的真就是“泛泛而谈”并没有对这些原理在软件上的应用方式多说。但在场的所有专业同学,都能在冥冥之中感觉到,这些知识将开启一个新的时代!
哪怕是平常上课的时候,再怎么不老实的生学,这时候都在全神贯注的听讲。如果在场的有他们的专业课老师,非得被气的吐⾎不可。这帮小兔崽子们,上教授、讲师的课,该觉睡
觉睡、该讲悄悄话就讲悄悄话,何曾这么用心过?
但此时这里不是宽敞明亮的大教室,而是有些昏暗、嘲<img src="in/shi.jpg">的食堂,上面讲课的不过一个和他们一样的生学,却偏偏听的津津有味。
这可不是咄咄怪事吗?
“好了,关于我这个项目的大概原理,今天就讲到这里。下面请同学们体验一下,我们六耳输⼊法的测试版。”
侯世达讲了半天,将木架上的⽩纸翻到了最后一页。这页纸上什么內容也没有,但见他走到面前的第一排餐桌上,打开了桌子上的投影机。
一道七彩的光束打在了纸上,原来这最后一页竟然被当做了投影幕墙使用。投影机将画面投<img src="in/she.jpg">在⽩纸上,上面分明是一台计算机的桌面,桌面上此时已经打开了一个界面相当丑陋的软件。
“侯同学,能问一下你们的软件目前完成度达到了多少吗?”食堂里有人举手提问道。
“大概55%吧,我们最近正在加快开发进度,相信再有几周时间就能完成这款输⼊法的开发了。”
“主要技术问题已经都解决了?”
侯世达走到与投影机连接的电脑前,头也不抬的边<img src="in/cao.jpg">作电脑,边说道:“是的,已经解决了80%的关键技术节点,目前最大的工作內容是建立初始词库。”
“由于我们的初始词库还在修正中,所以目前的整句准确率不太⾼,只有73%左右。”
“超过70%,这是半成品?”这次就连班长寒武都忍不住动容了,他能当上班长当然不可能不学无术。别说是超过70%的识别率,目前市场上连一款超过50%的都没有!就这个识别率,推出市场都已经没有问题了。
侯世达无辜的点点头,笑道:“我们的目标是让拼音输⼊的准确率达到95%,否则可算不上是⾰命<img src="in/xing.jpg">的进步。”
食堂里随着他这句话陷⼊了短暂的安静“⾰命<img src="in/xing.jpg">的进步”啊,这是多少软件专业生学的梦想?生学们都是有些浪漫幻想的,除了钱,谁不想让自己在这个世界上留下一段传说?而一款⾰命<img src="in/xing.jpg">进步的软件,⾜以让一个人的名字,留在计算机历史上了。
“谁能借我一本书?随便什么书都行。”
“用我的吧。”
旁边有同学递过来一本书,侯世达顺手翻开一页,看也没看就照着上面的某一段敲打起键盘来。
“当他走到门口的时候,公主叫住了他,恩莱科以为公主发了善心赦免了他的罪行,哪里知道公主只是对他说道:‘恩莱科你要注意,千万别露出你男人的嗓音,那是你唯一会露出马脚的地方,千万别再出丑啊,如果你再出丑,你的人生可就完蛋了,好自为之吧!’”
咦,好奇怪的內容。侯世达看着这段文字有点眼<img src="in/shu.jpg">,但想不起来究竟在哪里看到过了。
不过这段文字基本没有什么生僻字,前后文的逻辑也比较简单,侯世达几乎没有进行过第二次选择,轻而易举的就把它打了出来。
和智能abc不同的那种使用体验,让在场的所有人都看直了眼。没有不断敲打空格,也不用费神去选词。只要侯世达的拼音打出来,输⼊框下面就不断地刷新出一整句话来。就算前面有的词语选择错误,但当一整句话输⼊完毕,前面的错误自己就已经进行了更改。
这种宛若行云流⽔的感觉,轻而易举的就服征了在场所有人的心。