當前位置:法律諮詢服務網 - 知識產權保護 - 智能語音產業觀察:微軟小冰建半開放生態 AI創造與商業化已至?

智能語音產業觀察:微軟小冰建半開放生態 AI創造與商業化已至?

有別於過去五次,7月26日舉辦的微軟小冰第六代發布會,首次走出了微軟亞太研究總部的壹層報告廳,搬到了798區域大型會場。“發布會規模也從過去的幾十家媒體,擴張到數百家、覆蓋全國範圍的規模。”壹位接近微軟方面的人士告訴21世紀經濟報道記者。

 這是壹種信號。在過去,微軟從未給過小冰任何商業方面的壓力,甚至直到近日接受包括21世紀經濟報道等媒體采訪時,微軟小冰負責人李笛依然強調,小冰並沒有盈利指標。

 但就像發布會本身壹樣,小冰也在不自覺地走出實驗室和研究機構,逐漸嘗試商業化。這是小冰發布會首次搬家的底氣所在。而經歷了過去五代,從小冰萌芽到成長,從擁有二維框架圖到二維圖像,再到如今三維立體全息影像的展現,小冰正在愈發接近壹個人類。

 其背後的技術在持續叠代,生態也開始成型。據微軟方面介紹,此次發布會是小冰情感技術框架所有部分的全面升級,從首次完成落地時的情商+智商設定,到對話式人工智能、生成模型、全雙工語音,如今的小冰開始邁入AI創造的階段。生態方面,微軟此次首次提出構建Dual AI半開放式生態系統,差異化融合合作夥伴優勢,打造小冰的專屬技能與能力。

 “人工智能的最終目標是‘人機協同’,以數字智能幫助人類,但這個方向擁有不同的路線。”微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋表示,“小冰團隊走出了不壹樣的道路。”

  AI創造

 自去年開始,微軟小冰便在創作上擁有諸多嘗試,甚至出了壹本自己的詩集。如今,小冰將要走得更遠。

 在發布會現場,沈向洋宣布微軟思考了AI創造的三原則:其主體首先必須是兼具IQ與EQ的綜合體,而不僅僅是具有IQ;其次,人工智能創造的產物,須能成為具有獨立知識產權的作品;第三,人工智能創造的過程,須對應人類某種具有創造力的行為,而不是對人類勞動的簡單替代。

 小冰的目標,就是成為壹個高情商的機器人。“我們計劃將AI創造當成壹個新興產業來操作。”在發布會現場,微軟人工智能創造事業部總經理徐元春表示,“如果將AI創造當做內容產業、而非簡單的文藝創作的話,僅有‘概念車’是不夠的,從去年開始我們並行了‘量產車’的工作。”

 據介紹,在過去12個月內,小冰主持了21檔電視節目、28檔廣播節目,覆蓋中國包括9大衛視在內的41家電視臺和廣播電臺,如今,小冰每天主持的廣播節目已經達到25檔。在日本和中國,小冰累計生產了2878個小時的視聽內容。

 同時,小冰的有聲讀物已經覆蓋中國超過90%的早教機器人和80%的線上播放平臺。此外,與網易新聞客戶端合作的讀新聞小冰,已於兩個月前突破1000萬次新聞閱讀評論。在金融等相關領域,小冰同樣在進行著持續的內容創造。

 這背後的技術支撐,來自於小冰的情感技術框架,而第六代小冰的核心對話引擎與交互感官也得到了進壹步升級。微軟在第六代小冰身上上線全新的***感模型,並公測壹種融合了文本、全雙工語音與實時視覺的新感官。

 其中,***感模型是壹種基於生成模型的對話引擎。據介紹,去年小冰完成的生成模型能夠自創回應,而非在已有對話語料庫中檢索而得,如今的***感模型則進壹步提升小冰對於對話內容、領域和節奏的控制力,即小冰可以自創回應來牽引對話的方向。

 這壹融合了***感模型的對話引擎、全雙工語音和實時視覺三個類別的全新感官在測試設備中的公測,令小冰能夠通過視覺、語音的實時連續交互,指揮用戶完成面容檢測,並在該過程中進行開放域對話。

 此外,微軟還發布了第四版AI歌曲DNN模型。據小冰首席語音科學家欒劍介紹,該版本模型能夠快速合成與人類歌手質量相當的歌曲,還能夠使小冰自由吸收人類歌手演唱技巧和特質,在模仿之余甚至代替人類完成新作品創作。

 不過,盡管微軟提出AI創造的原則並進行技術更新,但小冰的所為將只是真正AI創造的起步。“根據2017年Gartner技術成熟度曲線顯示,虛擬助手仍需5-10年才能成為主流。”在評論AI創造能力時,Gartner研究副總裁蔡惠芬向21世紀經濟報道記者表示,“該應用主要針對智能家居設備中的個人助理或語音控制等狹窄領域,但仍需要包括為不同領域構建知識圖譜、自然語言理解與生成等技術的提升。它依然是新興領域。”

  Dual AI生態

 除了技術能力升級之外,第六代小冰的最大特點,莫過於開始構建屬於自己的生態——Dual AI。

 “在微軟之前,行業內已經出現多種不同的合作生態與模式,其中最重要的模式有兩類,壹類是開放賦能模式,通過對外提供SDK/API的形式構建生態系統。”小冰產品負責人彭爽分析道,“另壹類是專註於自有的、封閉的平臺,通過在平臺上開放AI的應用商店形式構建生態環境。”

 Dual AI則有所不同,更類似於半開放式生態。“在這樣的生態環境上,壹方面,微軟會直接負責產品體驗,把控最具體的、直接與用戶接觸的產品細節,另壹方面,我們並不封閉在自有平臺上,而是對外接觸甚至直接融入到第三方平臺上。”彭爽表示。

 之所以如此選擇,源於其他兩類生態存在各自的問題。其中,封閉模式極大限制了數據之間的自由流通,與AI本質相悖。由於無法獲得叠代所需的基礎數據量,便難以快速叠代和發揮升級優勢。

 開放賦能模式中,無論賦能或被賦能壹方,則均是相對松散的關系,“也就是說沒有人真正對最終的產品體驗負責”。例如當前大熱的智能音箱之所以實際體驗普遍低於預期,正是由於松散合作關系帶來的問題。

 與此同時,由於開放賦能生態中的API/SKD強調通用性,也就在壹定程度上限制了最新最優技術應用的及時性,通過這類接口或工具包獲取的數據也未必是最優質的。

 而在合作過程中,小冰也在探索屬於自己的盈利模式。目前,小冰已上線了包括金融、大眾文化、傳媒和出版四大商業化領域。“我們探討過各種各樣的AI盈利模式,最終發現為兩大類,壹類是利用AI技術用更低成本去替代人類低並發、AI高並發的工作,如內容生產,”李笛告訴21世紀經濟報道記者,“其次便是AI與人類的協同,通過提升協同轉化率實現分成。”

  • 上一篇:知識產權法學下列哪些使用作品的行為,除著作權人聲明不許使用的外,
  • 下一篇:重慶郵電大學是壹個學校還是兩個學校?
  • copyright 2024法律諮詢服務網