2009年9月30日

9/28 課前閱讀心得:the future of web information retrieval.

文章:Langville, A.N., & Meyer, C.D.(2009).Chap.13:the future of web information retrieval. Google’s PageRank and Beyond: The Science of Search Engine Rankings, Princeton University Press.
  • 透過網路檢索來獲得資訊是現在人掌握資訊的重要方式,然而網路上的資訊非常多,如何讓使用者能最有效率地獲得最有效的資訊便成為努力的方向。這篇文章是在探討網路資訊檢索未來可能的研究方向,包含了spam、personalization、clustering、intelligent agents、privacy and censorship、library classification schemes、data fusion這八個主題。
  • 利用搜尋引擎檢索資料時,搜尋引擎會將關鍵字與網站彼此間的內容作相關資料比對,再由瀏覽器呈現,而搜尋引擎最佳化(SEO: search engine optimization)是指讓網頁更容易被搜尋引擎接受,也就是更容易被檢索到。另外,網頁排名(PageRank),它可以用來推測一個網頁品質的好壞,其運算的方式是網頁之之間相互超連結的計算,當A網頁在自己的網頁中提供了B網頁的超連結,就代表投了B網頁一票。PageRank也影響了檢索結果,因為通常使用者只會瀏覽檢索到的前面幾個網頁,因此,如何讓自己的網頁能夠出現在前面的位置,是許多網頁擁有者追求的,當然,這是有方法的。
  • 網路的個人化服務就是“have it your way”,可以選擇個人喜好的類別,讓使用者更方便到喜好資訊;也可記錄瀏覽網頁的相關資訊,那個時間瀏覽了那些網頁,順序是如何,以便使用者回頭找之前的資料;也有推薦系統,告訴使用者看了此網頁的人還看了那些網頁,像網路書店即是,它會告訴你買了這本書的人還買了那些書,應用在行銷上挺不錯的。
    網路上的群組可以把同類別的資訊集合在一起,如此一來,想要獲得此資訊的使用者即可進入此群組快速且較精確地得到資訊,並且可以提問討論。
  • 網路上的社群對於資訊的交流幫助很大,因為他在網頁上撰寫的內容,若不是被搜尋引擎列在前面的網頁排名,那就比較沒機會被看到,但在社群中,資料集中在某主題上,可見度當然也就提高了。
  • 最後有提到google的電子書計畫,掃描了百萬本圖書上線供檢索,引發出版社對於版權問題的提出。我覺得如果像此計畫所說,人們能夠檢索到那本書裡頭有他所需要的資訊,這樣可以讓資訊流通率更高,有什麼不好嗎?知識不就是為了讓需要的人獲得的嗎?也許還有其他方面是我沒考慮到的吧!

文章全文:google books

沒有留言: