第七十九章
“現(xiàn)場演示?”周青山哈哈大笑起來,撇撇嘴說道:“就算我是中文系的,也知道一款輸入法軟件的開發(fā)周期需要很久。你們公司成立多長時間了?有一個月嗎?侯世達你當自己是YY小說主角了吧?一晚上就能寫出個世界第一的瀏覽器程序來,哈哈哈哈!”
侯世達淡淡的看了他一眼,心里其實很奇怪。按說帝郵在國內(nèi)也算排的上號的好大學了,能考上的不可能智商欠費,但怎么學生會里扎堆的都是這么一類人呢?事兒媽、小心眼、沒有自知之明,表面上看好像會做人,其實反而讓人打心眼里討厭。
這周青山按說造型不差,放電視劇里起碼都能活十分鐘。怎么一張嘴,就讓人有種他欠揍的沖動……
“哦,周會長還知道自己是中文系的啊?”侯世達呵呵輕笑,搖頭道:“那就請你閉嘴,我們軟件專業(yè)的問題,你算老幾?”
“你……”
周青山何曾被人這么搶白過,當真是差點沒被氣的翻白眼來。不過看周圍同學們的眼神,也都是差不多一樣的輕視。
侯世達失望的搖頭道:“你什么?以你的智商,我很難和你解釋什么叫做測試版的。”
“哈哈哈哈——”
周圍傳來一陣笑聲,眾人心中也覺得周青山和侯世達這次交鋒真是找虐,他一個文科生和人家專業(yè)程序員起膩,真不知道腦袋怎么想的。
周青山被氣的臉色一陣發(fā)白,恨恨的點頭道:“好,那我就看你怎么把牛皮吹破。”
侯世達轉(zhuǎn)過身來,不再把注意力放在他的身上,而是走到了木架旁邊。他掀開木架上的第一頁紙,第二頁紙上面畫了一個樹狀圖,就聽他說道。
“在展示我們的內(nèi)部開發(fā)測試版之前,我先簡要的說一下六耳輸入法的實現(xiàn)原理吧。”
“這是一幅我們?nèi)祟愗撠熣Z言思維的決策樹狀圖,我認為人類的語言并非只是一種信息傳遞協(xié)議,更是認知世界的重要工具。輸入法若想理解人類的‘語法’,首先得了解人類思考的兩大部分——知識和智能。可以說人類所謂的智慧,就是由這兩部分構(gòu)成的。而一直以來的輸入法,對數(shù)據(jù)的處理方式,都是用計算機理解的二維表格數(shù)據(jù)庫模式。正是這種和人類思維完全不同的數(shù)據(jù)處理方式,導致了現(xiàn)在的數(shù)據(jù)爆炸問題。”
……
侯世達不斷的將木架上的白紙掀開,從人類思維的模式開始侃侃而談。
別看未來所謂的智能輸入法好像遍地開花,于是就覺得這東西非常簡單。恰恰相反,識別率越高的輸入法對技術(shù)要求就越高。尤其是侯世達對六耳輸入法并不滿足于實現(xiàn)整句輸入為止,而是必須在整句輸入的前提下能夠?qū)崿F(xiàn)至少95%的首次輸入正確率。
如果只是打出拼音來,然后判斷每個詞的組成,最后用幾個詞語組成一句不通的句子,那用微軟的智能ABC就能做到,用戶不過多敲打幾下空格而已。但要做到整句輸入,就是要讓用戶一次輸入整個句子,一氣呵成。讓后面的詞語能夠根據(jù)前面的內(nèi)容、語義進行自動關(guān)聯(lián),這種對數(shù)據(jù)的要求,是傳統(tǒng)表型數(shù)據(jù)無法提供的。
人類對語言的處理過程,不是二維結(jié)構(gòu),而是一種空間坐標形式存在的。要想讓計算機實現(xiàn)人類的“聯(lián)想”能力,就要讓數(shù)據(jù)像人類處理知識一樣,具有進行空間排列。若想能夠?qū)?shù)據(jù)進行分析、歸類和查找,就要知道人類的腦海中知識是如何存在的?歸根結(jié)底,是一個個神經(jīng)元中的電脈沖。而神經(jīng)元肯定不是二維結(jié)構(gòu),而是所有腦細胞組成的三維結(jié)構(gòu)。
一個神經(jīng)元被激活之后,會向它附近所有的神經(jīng)元發(fā)射一束電脈沖。一個神經(jīng)元發(fā)射的電脈沖不足以激活另一個神經(jīng)元,但如果一個神經(jīng)元在一個單位時間內(nèi)有多個電脈沖抵達,那就會被激活,這就是人類思考的過程。
智能輸入法中用戶輸入的每一個詞,都會向后面的其他詞語添加一個閾值。當后面某個詞的閾值突破臨界點之后,就可以進入備選的范圍之內(nèi)。而這個備選數(shù)據(jù)庫,就是解決信息爆炸問題的關(guān)鍵。因為它是一個三維矩陣形式的數(shù)據(jù)庫,通過KNN近鄰算法,就能實現(xiàn)非常高的選擇準確率。
尤其是通過這種算法,還能對詞庫里沒有出現(xiàn)過的新詞,經(jīng)過幾次訓練之后就實現(xiàn)機器學習。這一點對無法窮盡人類詞語的詞庫來說,意義特別重大。
然而這些侯世達的同學們,誰也沒有想過原來數(shù)據(jù)還能有三維的組織形式!這對他們來說,不啻是打開了一扇新天地的大門!
不僅是下面的同學們聽的目眩神迷、如癡如醉,就連周青山身邊幾個高材生,聽的都目光炯炯有神。
或者應該說,正因為他們都是學校里的高材生,對侯世達說的這些理論上的東西,理解的反而更加深入!
雖然侯世達說的真就是“泛泛而談”,并沒有對這些原理在軟件上的應用方式多說。但在場的所有專業(yè)同學,都能在冥冥之中感覺到,這些知識將開啟一個新的時代!
哪怕是平常上課的時候,再怎么不老實的學生,這時候都在全神貫注的聽講。如果在場的有他們的專業(yè)課老師,非得被氣的吐血不可。這幫小兔崽子們,上教授、講師的課,該睡覺睡覺、該講悄悄話就講悄悄話,何曾這么用心過?
但此時這里不是寬敞明亮的大教室,而是有些昏暗、潮濕的食堂,上面講課的不過一個和他們一樣的學生,卻偏偏聽的津津有味。
這可不是咄咄怪事嗎?
“好了,關(guān)于我這個項目的大概原理,今天就講到這里。下面請同學們體驗一下,我們六耳輸入法的測試版。”
侯世達講了半天,將木架上的白紙翻到了最后一頁。這頁紙上什么內(nèi)容也沒有,但見他走到面前的第一排餐桌上,打開了桌子上的投影機。
一道七彩的光束打在了紙上,原來這最后一頁竟然被當做了投影幕墻使用。投影機將畫面投射在白紙上,上面分明是一臺計算機的桌面,桌面上此時已經(jīng)打開了一個界面相當丑陋的軟件。
“侯同學,能問一下你們的軟件目前完成度達到了多少嗎?”食堂里有人舉手提問道。
“大概55%吧,我們最近正在加快開發(fā)進度,相信再有幾周時間就能完成這款輸入法的開發(fā)了。”
“主要技術(shù)問題已經(jīng)都解決了?”
侯世達走到與投影機連接的電腦前,頭也不抬的邊操作電腦,邊說道:“是的,已經(jīng)解決了80%的關(guān)鍵技術(shù)節(jié)點,目前最大的工作內(nèi)容是建立初始詞庫。”
“由于我們的初始詞庫還在修正中,所以目前的整句準確率不太高,只有73%左右。”
“超過70%,這是半成品?”這次就連班長寒武都忍不住動容了,他能當上班長當然不可能不學無術(shù)。別說是超過70%的識別率,目前市場上連一款超過50%的都沒有!就這個識別率,推出市場都已經(jīng)沒有問題了。
侯世達無辜的點點頭,笑道:“我們的目標是讓拼音輸入的準確率達到95%,否則可算不上是革命性的進步。”
食堂里隨著他這句話陷入了短暫的安靜,“革命性的進步”啊,這是多少軟件專業(yè)學生的夢想?學生們都是有些浪漫幻想的,除了錢,誰不想讓自己在這個世界上留下一段傳說?而一款革命性進步的軟件,足以讓一個人的名字,留在計算機歷史上了。
“誰能借我一本書?隨便什么書都行。”
“用我的吧。”
旁邊有同學遞過來一本書,侯世達順手翻開一頁,看也沒看就照著上面的某一段敲打起鍵盤來。
“當他走到門口的時候,公主叫住了他,恩萊科以為公主發(fā)了善心赦免了他的罪行,哪里知道公主只是對他說道:‘恩萊科你要注意,千萬別露出你男人的嗓音,那是你唯一會露出馬腳的地方,千萬別再出丑啊,如果你再出丑,你的人生可就完蛋了,好自為之吧!’”
咦,好奇怪的內(nèi)容。侯世達看著這段文字有點眼熟,但想不起來究竟在哪里看到過了。
不過這段文字基本沒有什么生僻字,前后文的邏輯也比較簡單,侯世達幾乎沒有進行過第二次選擇,輕而易舉的就把它打了出來。
和智能ABC不同的那種使用體驗,讓在場的所有人都看直了眼。沒有不斷敲打空格,也不用費神去選詞。只要侯世達的拼音打出來,輸入框下面就不斷地刷新出一整句話來。就算前面有的詞語選擇錯誤,但當一整句話輸入完畢,前面的錯誤自己就已經(jīng)進行了更改。
這種宛若行云流水的感覺,輕而易舉的就征服了在場所有人的心。