馬占凱-----Sogou輸入法之父
2005年,本科剛畢業、在太原壹家國企做機械設計的馬占凱找到了壹種省力的方法:寫東西時,如果輸入法不能直接打出所需詞語,他不願意去輸入法的詞表 裏壹頁壹頁尋找想敲的字,而是在搜索框裏輸入相應的拼音(比如:zhoujielun),獲得搜索引擎相應的提示(“您要找的是不是:周傑倫”),由此復 制粘貼。
這名沒有任何計算機背景,但每天可能使用百余次搜索的年輕人,曾經自己猜測出壹套解釋:搜索引擎有壹個人工整理的巨大詞 庫。但稍微刨根問底之後,他發現,搜索引擎充分利用了用戶輸入的關鍵詞,每當某個關鍵詞的搜索量達到壹定的數目,比如幾百萬次,那麽這個關鍵詞就自動被收 入搜索引擎的詞庫。換言之,用搜索引擎來生成壹個常用詞的巨大詞庫,花費極小。 這讓馬占凱隱隱覺得,讓搜索引擎來做輸入法大有可為。
如果當時他認識任何輸入法業內人士,他的想法會被無情打擊:誰還會在2005年進入輸入法行業呢?早在1980、1990年代,微軟就相繼收購了智能 ABC和微軟拼音,捆綁在Windows操作系統之中。此後還有壹些來自民間程序師的作品,到2005年,這幾乎已經成為壹個寡頭壟斷的領域:智能 ABC、紫光拼音、拼音加加和微軟拼音占據了輸入法市場的90%。
理論上,所有這些產品都具備充分的改進空間。它們都是由人工整理詞庫,成本高且效果不好,很多詞不能及時被收入詞庫。占市場第壹位的紫光拼音,甚至2003年到2006年初沒有推出壹個升級版本。
但商業的力量阻止了改善的動力。輸入法是壹個叫好不叫座的產品。盡管中國的用戶不可避免使用到它,但是卻無法靠它取得收入。於是,輸入法領域的狀態是:不斷有人看到市場需求,不斷有人做出解決了某些問題的新產品,卻沒有人能堅持長期而頻繁的升級和維護過程。
從某種程度上說,馬占凱改變了這壹切。如今,他已是搜狗輸入法的產品經理,他創意和設計的輸入法,為搜狐提供了壹個接觸廣泛用戶的新通道:8月底第11 版輸入法推出,新產品將和用戶賬戶綁定,通過同壹賬戶可以在不同電腦上使用自己的個性化輸入法。於是,輸入法和博客壹起,成為整個搜狐產品的入口,將為帶 動其新聞、社區等產品產生積極效用。
更重要的是,自QQ旋風般占據四億網民的桌面開始,客戶端軟件就展示了其巨大的想象空間。而輸入法是客戶端中粘性大、使用頻率高的軟件之壹,比如,紫光拼音2005年的下載量就僅次於騰訊的QQ,約為2到3億。
雞肋
在中國科技業商業化程度不高時,輸入法曾是創新最密集的領域——除了拼音、五筆,還有自然碼等數十種相關產品。
早在1980年代末,哈工大的壹位博士生王曉龍就研發出了壹款支持整句輸入的輸入法系統,後來為微軟所收購,成為微軟拼音。早期,輸入法領域還有“中文 之星”所提供的新拼音輸入法,以及後來同樣被微軟收購的智能ABC。“中文之星”留給很多人的記憶已經淡薄,然而這款讓計算機識別中文的產品,其開發者包 括新浪奠基人王誌東,以及後來的拼音加加的創始人廖恒毅。
在這些基礎之上,1996年,名噪壹時的黑馬輸入法推出。其開發者王勵 在聯想漢卡待了三年多,在中文處理上積累了豐富經驗。那時,這個技術愛好者因為聯想要安排其去做管理職位而離開聯想,加入黑馬飛騰科技有限公司,主導起校 對技術的開發,並抽時間開發出了“黑馬神拼”。
直到前不久搜狗和谷歌的爭端激烈之時,中國最著名的博客之壹王小峰還在其博客上稱贊使用多年的黑馬神拼質量之高,引發了外界對黑馬的關註。
王勵把黑馬輸入法歸為是有別於五筆的字輸入、智能ABC及搜狗輸入法等的詞輸入的第三代輸入法,在整句輸入上準確率很高。黑馬拼音的句庫來自報紙、文學 作品等成文的文字內容,並有自動學習功能,既杜絕了錯詞的出現,又具有相當高的智能化水平。不過,黑馬輸入法也有壹個致命的弱點:體積大,有400多兆, 不利於傳播。
但在當時互聯網連接不暢情況下,這倒不成為問題。依靠光盤銷售,黑馬神拼給黑馬公司帶來了意料之外的收入。直到今天,黑馬采取的仍然是這種銷售模式。
不過,2001年,考慮到競爭對手是強大的微軟、輸入法又無法提供企業所需要的資金,王勵放棄在輸入法上的繼續更新,把精力集中到了黑馬的文字校對業務,只留下黑馬神拼2001版和壹些輸入法底層技術作為銷售和合作之用。
而因為找不到合適輸入法使用、幹脆自己開發了拼音加加的廖恒毅,也壹度因為每月上百元的註冊費無法支撐,而停止了開發和更新。
當然,這些人也並非沒有嘗試過尋找商業化途徑讓輸入法增值,不過僅僅停留在個人站長式的經營方式上。比如,廖恒毅曾將拼音加加的首頁放置了壹個百度的搜 索框,進而和百度合作分成。後來,廖恒毅幹脆把首頁設成了壹個類似hao123.com那樣的導航頁面,這樣壹來,他便能每月從中獲得 10萬元左右的收入,這才結束了停止更新的日子。
“融資上市是壹個機會,不過我只是壹個資深技術人員,過程太復雜,無法把握。”王勵表示。
於是,這些輸入法的創始人們,幾乎都只把輸入法作為壹個“副業”,自己卻不約而同的投入企業軟件這個“離錢更近”的領域。
這就使得2005年中,作為壹個互聯網行業的門外漢,馬占凱有機會憑借壹個資深互聯網用戶的體會、拿著對輸入法產品的重新定義敲開了搜狐的大門:體積小,容易在互聯網上傳播;能敲打出熱門詞語;有壹個專門的團隊運作,更新快。
尋找伯樂
那時是馬占凱工作壹周年,他終於忍受不了國有企業的沈悶與緩慢而辭職,懷揣著從親友那裏借來的錢,只身來到北京,起初的目的是為了學些技能,再找工作。
在北京,撲面而來的,是互聯網的熾熱:壹時間,李開復離開微軟來到谷歌中國、雅虎與阿裏巴巴簽訂收購協議、百度即將上市前景看好!這讓輸入法的創意在馬的腦海中重新升起。
百度上市前半個小時,馬占凱趴在電腦前,按照網上的客服郵箱給百度寫電子郵件,簡要闡釋了輸入法的創意:把百度搜索默認的拼音提示都納入字庫中,再加上在線同步升級數據庫的功能,互聯網上的熱詞馬上就能出現在輸入法的詞庫中。
發出去之後,馬坐立不安地等待回復,在腦子裏又搜索了壹遍,生怕遺漏任何會引起別人的註意的建議。第二天中午,馬又補充了壹封信,加上在輸入法中集成百 度搜索和桌面搜索功能的提議。然而,幾天下來,不斷刷新郵箱的他只收到百度的壹封例行回復,無任何進壹步商談或合作意向。
馬不甘心,在又發去幾封郵件仍石沈大海之後,決定轉投搜狐。這壹次,馬等來了迅速而且熱情洋溢的回復,搜狐的人表示對此很有興趣,約馬占凱三天之後到辦公室壹談。
這三天的等待時間,馬占凱並沒有浪費。他全神貫註的待在電腦前,不斷使用搜索引擎、閱讀相關理論,想為來之不易的面試做足準備。於是,三天之後,在去搜 狐前,他把這三天的成果事先發了過去——30 頁的文檔,其中包括上萬字的搜索筆記、200個靈感點和100個小創意。
這種對搜索引擎的熟悉和產品思維為馬占凱順利贏得了第二份工作,成為搜狐的產品經理。
馬決定繼續去遊說搜狐公司副總裁王建軍。為了使自己更具有說服力,他統計了QQ和輸入法在各大下載網站上的下載量,並逐個分析了輸入法這個領域的競爭對手,把這些做成兩份 PPT。其顯示: QQ有約5億次下載,而輸入法的下載量是2到3億次。 第二次看完PPT之後,王明確:壹定要做。
事實上,輸入法的開發,與搜狐的戰略轉移有很大關系。 1998年,張朝陽仿效雅虎的網頁目錄模式建立搜狐,進入大而全的門戶運作。然而,2003年左右,這種內容主導的思路產生了動搖。讓搜狐有切膚之痛的關鍵在於:在諸多重要產品上,如搜索、即時通訊等,搜狐都因為技術不如對手而落後甚遠。
不久之後,搜狐建立研發中心,主要是在搜索領域加強技術研發,即研制搜狗搜索引擎。壹則從長遠來看,搜索是互聯網發展的壹個重要方向。二則搜索本身技術 含量較高,研發出來的技術也可以輻射到搜狐的其他產品領域。早期,研發中心甚為保密,並未和搜狐在同壹辦公樓,也沒有門牌標識。由於與網易研發中心同處壹 樓,張朝陽每次去時都要拉低帽沿,生怕被對方員工認出。
即便采取此般暗渡陳倉之道,挑戰仍然顯而易見:百度的技術已經積累4年之久,搜狗能依靠什麽突破口迎頭趕上?
正在搜狐高管們為這件事情頭疼的時候,輸入法的創意擺在了眼前。“輸入法的開發,是搜狗的搜索技術發展過程中結出的壹個果實,同時也可以提高搜狗的品牌形象。”搜狐技術副總裁王小川告訴《環球企業家》。
王小川正是統籌輸入法開發的技術小組的負責人。在收購紫光拼音不成的情況下,2005年10月,壹個幾人組成的小組開始進行技術上的摸索,直到 2006年6月5日搜狗輸入法第壹個版本發布,首階段工作持續了八個月。
事實上,因搜狗的搜索引擎的使用量不高,當時拼音提醒和糾錯功能都還沒有實現,因此在詞庫整理和篩選並不容易。
除了搜索關鍵詞之外,“詞庫運動”還幾乎動用了整個搜狐的資源。比如,開發人員從go2map.com處要到地理信息名詞列表,從搜狐音樂搜索得到歌曲和歌手名稱列表,從體育頻道獲得體育明星和賽事名詞列表?跨部門的合作耗費了諸多精力和時間。
另外,由於詞語來源於互聯網,和黑馬神拼等相比,搜狗要解決的壹個重要問題是錯詞。搜狗每周會發布壹份錯詞報告,糾正詞庫中的錯誤。正因此,在第壹版推出之後的十個月裏,搜狗輸入法幾乎壹個月就推出壹個新版本,不斷的糾正詞庫錯誤,提高準確率,並添加壹些吸引用戶的小功能,比如輸入法皮膚、自定義詞庫。
於是,這個新興的輸入法壹經推出,馬上獲得了預期的效果,迅速出現在無數人的桌面上,取代了原本紫光們的位置。
谷歌輸入法則更進壹步,其能跟網絡賬戶綁定。也就是說,無論妳在任何電腦上,登錄妳的個人賬戶,便能使用妳已熟練操作的詞庫。同時,谷歌的“壹鍵搜索”則讓搜狗員工嘆息品牌效應的威力。
馬占凱稱,自己最初的創意裏也包括“壹鍵搜索”,即在輸入法框上集成搜索。它被討論數次,壹直擱置未實行的原因,在於搜狗為避免被誤認為“流氓軟件”的謹慎考慮,“這會影響用戶體驗,也不能帶來太多搜索量”,馬認為。
業內有人士稱,在技術領域,搜狗和谷歌輸入法的技術能力都不強,並不如黑馬和微軟。但搜狐和谷歌在易用性上的突破,讓它們暫時成功。
在壹篇總結性質的PPT中,馬占凱寫道:在gmail之前大家以為email就是這樣了,在搜狗輸入法之前大家以為輸入法就是這樣了,中國互聯網領域很多都沒有開始商業化運作,機會還很多。
對於輸入法而言,商業化運作剛剛開始,成功也有多種可能性。