登入 到處走走
友友's blog
http://fiefie123.ublog.com.tw
友友
加入好友
傳紙條
願望本
禮物盒

我加入的村莊

網誌分類
網誌最新回應 展開
今日人氣:8
累積人氣:2686
RSS訂閱

[開站日期] 2009-08-08
關健字未來十年展望之下一代搜索技術  
2010-01-08 10:50:04
 │  人氣:15  │  心情:
關健字未來十年展望之下一代搜索技術
總結歷史是為了更好地預測未來。IT技術經過多年發展,特別是網路技術的進步,使得IT技術已經深入社會的各個角落,改變了生產力、社會關係、消費理念乃至人們的生活方式。

伴隨Web 2.0的發展,人們可以隨時隨地用任何設備實現資訊交互。越來越多的消費者開始頻繁使用IT技術,IT應用的普及速度甚至超過了企業IT技術更新的速度。這種趨勢將對企業活動及消費行為產生巨大影響,被稱為“產消逆轉”現象。通過IT手段使企業提升顧客的體驗價值,是很多企業在競爭中能夠脫穎而出的重要原因。對於企業來說,必須進行合適的IT投資,關鍵字廣告才能在未來的競爭中取勝。那麼如何對現有IT技術進行客觀定位,把握未來重要技術的發展趨勢,並根據對技術趨勢的預測來進行適合的IT投資成為企業非常關心的問題。

我們在此選取了六大重要技術領域,對其未來的發展方向做出判斷,希望能對企業決策和個人消費帶來有益説明。本文參考了北京軟體與資訊服務業促進中心翻譯的《IT導航圖2009版》一書。該書由日本野村綜合研究所技術調查部所著,在全球IT領域具有廣泛影響。北京軟體與資訊服務業促進中心胡青華主任認為,在IT技術沒有興盛以前,我們所處的是工業經濟時代。隨著IT技術的發展,尤其是互聯網的興盛,我們已經進入光速、無重量的資訊經濟時代。因此,對未來技術的預判就顯得更加重要。

技術趨勢

在互聯網時代,包括檔、圖像、語音、動畫、視頻、虛擬世界等在內的資料呈指數級增長,搜索技術顯得越來越重要。

以往,搜索服務都是依據輸入的關鍵字,列出符合關鍵字的資訊。未來,全新的搜索服務模式將出現。

搜索技術的評測指標主要有兩種:適合率和再現率。適合率指搜索結果中符合要求的資料比例,可以通過減少非適合資料提高這一比例。再現率指在所有應該列出的適合資料中,實際檢索出的適合資料所占的比例,可以通過減少檢索遺漏提高這一比例。

未來,搜索技術將朝著三個方向發展:包括聯想在內的語義搜索,檢索圖像、語音、動畫內容的感性搜索,通過傳感技術搜索現實世界物件的現實挖掘。

對於語義搜索,各家搜尋引擎服務商的定義並不相同。一般來說,語義搜索是指搜尋引擎能夠“讀懂”線民鍵入的符合語法習慣的句子。2008年8月,微軟收購了一家語義搜索服務商Powerset。微軟目前正式推出的新型搜尋引擎Bing就整合了Powerset的語義搜索技術。

CNNIC 2009年3月公佈的調查報告顯示,對搜索結果不滿意的網友比例為35%,40%的使用者會在第一次鍵入關鍵字廣告的基礎上修正關鍵字,72%的使用者認為搜索結果非常淩亂。使用者如果想在互聯網海量資訊中快速、簡便地尋找到自己想要的資訊而不受干擾,需要搜索技術對檢索者的想法進行臆測。

目前,人們看到的搜索結果都是參考文獻,而不是最終的答案。這是現有搜索技術最大的問題。但是,已經有一些產品能夠對垃圾資訊進行最初級的人為摒除,比如百度知道。當一個人提問之後,經過一個或多個人的回答關鍵字廣告,此人就可以找到自己所需要的資訊。另外,各大廠商也在致力於實現真正的人機對話。以PowerSet和WolframAlpha為代表的問答式精准搜索近來受到廣泛關注。

GazoPa是一家成立于2008年的圖像搜尋引擎供應商。它提供的搜索圖像服務的特色在於,可以提取圖像中商品的形狀、顏色等資訊。以往的圖像搜索採用的方法是,給圖像資料賦予標籤等文本資料,當輸入的關鍵字與文本資料相匹配時,圖像就會被檢索出來。但是,使用者使用GazoPa提供的服務,被搜索的圖像不具備文本資訊,也可能被搜索到。

GazoPa使用的是基於圖像內容的檢索(Content-based Image Retrieval,CBIR)技術。這種技術能夠對圖像的顏色、紋理、佈局進行分析並檢索。CBIR是基於內容檢索(CBR)的一種技術。CBR中包括了對動態視頻、音訊等其他形式多媒體資訊的檢索技術。

新商機

隨著語音辨識技術、自然語言處理技術的逐步成熟,搜索服務商通過語音會話形式提供的階梯型檢索服務將逐漸深入生活。例如,人們可以通過手機在移動互聯網中搜索附近的飯店,而人工合成的聲音會問“你喜歡吃什麼”或“義大利菜怎麼樣”之類的問題。

如上所述,網站將成為企業與客戶溝通的重要管道,而搜索服務的品質將成為關鍵因素。使用者在選擇服務提供者時,除了關注價格和功能指標外,或許會更加關注服務商能否長期提供當地語系化的服務。

引用URL(0筆)
回應(0筆)
姓 名
E-mail
U R L
回 應
  請輸入右邊圖片的數字