2009年10月12日

10/12課前閱讀心得:Metadata

文章:Elings, M.W., & Waibel, G. (2007) Metadata for all: descriptive standards and metadata sharing across libraries, archives and museums. First Monday,12(3).

看這篇文章前,先看了XXC在部落格裡對Metadata的介紹,知道Metadata的定義、目的、種類、功能、要素、限制以及其與編目的關係…等等。Metadata最簡單的說法就是”資料的資料”;一個東西,你把它作描述,這些描述資料就是Metadata,以圖書館線上公用目錄為例,你所查到一本書的書目資料(書名、作者、出版者、出版年、頁數……等等)即是,它代表了那本書,而”替代物(surrogate)”也是Metadata的特性之一。

在圖書館方面,Metadata和編目的概念是差不多的,但是Metadata 運用了網路技術(例如:XML),也更強調標準化和互通性,因此能夠不侷限於圖書館使用,可以應用在其他領域。在秋聲的部落格中有提到RDA(Resource Description & Access)是新一代的編目規則,是以FRBR(Functional Requirements for Bibliographic Records)為模型基礎去設計的,這個編目規則將可能改變以往圖書館的編目方式,館員面臨這樣的新知不知道會有何反應呢?

Metadata的出現,讓許多資料能夠在網路上被找到,因此能獲得此資料的相關資訊,當然它不是完美的,就像藍文欽教授提出Metadata的「無力論」,即是針對Metadata無法做到的事情而發展出來的。我們的確無法完全知道使用者想得到的是資料的那些資訊?我們提供的資料又是使用者需要的嗎?這些資料對使用者產生什麼意義?不同的資料需要不同的資料項目…。如何讓Metadata對使用者產生了解資料的幫助、讓建置者能夠分享類似的資料,以及Metadata在不同領域的通用性,這些都是值得去把它做好的


參考資料:
 Metadata
http://www.xxc.idv.tw/dokuwiki/doku.php/metadata , XXC@Note。

 RDA的推行與OCLC的態度 http://soundoffall.blogspot.com/2009/01/rdaoclc.html ,秋聲blog。

2009年10月9日

10/9 課後心得:書目計量學-citaion

這次請到H老師來課堂上演講,H老師的研究領域是資訊檢索、資訊行為,近幾年才投入書目計量學的領域,而今天要談的主題就是有關書目計量學的。

P老師先談到web of science
"Web of Science (簡稱 WOS) 為美國 Thomson Reuters 於 1997 年間建置之網際網路版引用文獻索引資料庫系統,提供使用者理、工、醫、農、人文、及社會科學等各學科領域之文獻書目、作者摘要、及引用文獻等資料。該系統收錄期刊超過 10,000 種,每週更新其內容,每年提供超過 110 萬筆書目及2300 萬筆引用文獻資料。本資料庫特有之文獻間相互引用關係檢索,不但提供研究人員更完整之研究參考資訊,更可依循前人研究軌跡,進一步瞭解同儕及競爭對手之研究。"

----------------------------------------------------------------------

書目計量學
信息計量學
科學計量學
網路計量學

-----------------------------------------------------------------------------


「你覺得引文代表什麼?」
「如果說引文代表品質你認同嗎?」是啊~該認同的。難道你會去找品質較差的文章來當作引文嗎?


citation(引文)代表了
  1. relative(相關性)
  2. evaluation(評估)
從引文可以得知一個領域的研究概況。

-------------------------------------------------------------------------
書目計量學的三大定律:

布拉德福定律(Bradford's Law):發現經常被引用的論文出自少數期刊,這些經常有論文被引用的期刊稱之為核心期刊,其與邊際期刊之數量呈現1:a:a平方的關係,亦即有報酬率遞減的現象。換言之,特定學科之最相關文獻集中於少數的核心期刊之中。此結果可作為圖書館在做館藏發展和館藏評鑑時的依據,在館藏發展時,應先將核心期刊列為優先採訪的對象,若有剩下預算,再依序進行邊際期刊的購買;在館藏評鑑時,則可根據該館在各學科當中收錄了多少核心期刊,來評斷其館藏品質優劣。

洛特卡定律(Lotka's Law):發現發表n篇論文的作者總數,是發表一篇論文作者總數的n平方分之一,也就是所謂的「洛特卡倒平方率」;另外,只發表一篇論文的作者總數,約是全部作者總數的60%。本定律可用來評估某學科領域內,不同作者生產能力、學術地位等。

齊普夫定律(Zipf's Law):又稱為「字詞分佈定律」,研究在文獻中詞頻和排名之間的關係。發現字詞的使用次數(f)與字詞的使次數排名(r)之乘積,會等於一常數C。此定律可應用於資訊檢索,使用低頻詞與中頻詞作為控制詞彙,得以提高檢索效益。

------------------------------------------------------------------------

H老師剛發表了"2009世界大學科研論文質量評比"
還有2009華人四地世界大學科研論文質量評比分析

目前的世界大學排名報告有下列三者:

  1. 上海交通大学高等教育研究院所作的2008世界大學學術排名
  2. 英國泰晤士報2009世界大學排名
  3. 2009世界大學科研論文質量評比 
          ※2009世界大學科研論文質量評比指標:其中使用了「h指數」(h-index),是在2005年由Hirsh提出,定義為一個人在其所有學術文章中有N篇論文分別被引用了至少N次,他的H指數就是N,可用於評估研究人員的學術產出數量與學術產出水平。(維基百科)
        
 三個所依據的指標是不同的,而指標其實就已經決定了名次。

在看評比時,要用不同的角度去解釋結果,每一個都有他的意義,多個評比系統的存在是更客觀也是好的。

老師說排名的意義在quick and dirty,可以很快的看出好壞卻又有不是完全準確的。(因為要考慮的因素很多)。在2009世界大學科研論文質量評比的部分,將學術分成六大領域,讓結果更正確,像是生物醫學領域容易有新文章的發表,若不分領域則排名會往前。

另外就是,東方人很喜歡排名,幾乎每個孩子從小就被問你考第幾名?
好像有了排名才會求進步,這也是受到文化的影響吧!
但是排名出來了後,總是會有人抱怨結果不正確~


在搜集到一大堆的數據資料後,老師說難的不是整理這些資料,而是權威檔的建立,這也是在進行此研究最重要的事,當然,圖資的專業就在這裡啦~
----------------------------------------------------------------------

最後老師提到"通訊作者"和"第一作者"在評比時的分數也會不一樣,到底是誰比較大呢?
我們這些天真的研學術界菜島多認為第一作者較大,你覺得呢?
嘿嘿~原來學術界也有BLACK的一面....

以下摘自新聞
"在「李政道論文選集」中一篇名為「破壞了的宇稱」文章中,也提到兩人關係惡化的原因。文章寫到兩人交惡的一個重要原因,是楊振寧向李政道要求,兩人獲得諾貝爾獎的論文題目、宣布得獎者名字以及領獎時,楊振寧的名字都要排在李政道前面。"

you know?

-----------------------------------------------------------------------------------
英國泰晤士報今天公布2009世界大學排名,台大排95名。
教育部高教司長何卓飛表示,這顯示5年500億頂尖大學計畫發揮效益,在進行第四年時有一所大學進到百大。教育部長吳清基則說,「好,還要更好!」今天更宣布要再推動第二期頂尖大學「5年500億」計畫,但改採「領域」補助,鼓勵各大學發展特色 。(摘自大學排名 台大擠進全球百大)


 相關閱讀:
世界大學排名/指標不同
2009年臺灣ESI論文統計結果
引用分析與學術評鑑

2009年10月5日

10/9 課前閱讀心得:期刊影響因素和學術評鑑

文章:Seglen,P.O.(1997). why the impact factor of journals should not be used for evaluating research? British Medical Journal,314(7079),498-502.

這篇文章是在探討期刊的影響因素和學術評鑑的問題,期刊的影響因素是否就代表了學術評鑑的好壞呢?首先介紹索引資料庫(Citation Index),是將引用文獻和被引用文獻輸入到資料庫而編製成的。Science Citation Index(SCI)-科學引用文獻索引資料庫即是其中一種,其他還有SSCI,EI等等。

期刊的影響因素是否就代表了學術評鑑的好壞呢?若依期刊影響因素來作學術評鑑會產生許多問題,也就是說所呈現出來的評鑑結果並非能真正代表它的情況。以下提出幾點說明:
1.期刊影響因素並不代表單篇文章的影響力。
2.非引用的文章也被放入引用資料庫中。
3.自我引用有可能是為了誇大其影響力。
4.較長的文章會引用較多文獻,並且具較高的期刊影響因素。
5.研究領域的文獻是迅速即過時的。
6.書本類型未被包含在資料庫的引用資源中。
7.領域中僅有較少期刊的,其影響力會變大。

除了舉例的七點之外,文中還有提到其他的因素都是在說期刊影響作學術評鑑的問題。
這裡說明一下JCR(期刊引用報告)對Impact Factor(IF)的定義:其為某期刊二年前出版文章總數在某一特定年平均被引用的次數。亦即第一年與第二年出版的文章,在第三年被引用的總數,除以第一年與第二年出版文章的總數。因為這樣的定義,每年的出版文章數,都會影響IF。另外,如果期刊的IF高,但是有可能是被別的領域所引用的,這也和一個領域的動態發展相關。像是在圖資領域,從以前只研究圖書館文獻,逐漸加入資訊、網路、程式等等,就可能引用到資工資管領域的文獻。

我認為學術評鑑若用期刊影響因素作依據的話,簡單來看,似乎期刊被引用次數愈多就愈有影響力,但其中所包含的影響因素太多了,不同領域不一定適用,還有引用者本身是否正確的引用文章內容,也是要把關的。最不好的就是,為了提升學術評鑑的結果,一群人合作互相引用文獻,這似乎沒什麼意義吧!
如何想出一個最正確也最客觀的方法來作評鑑,成為要探討的問題。


文章全文:http://www.bmj.com/cgi/content/extract/314/7079/497