第一次對 arXiv 網站有點印象的,是在
lukhnos 那邊瞄到一篇 OpenVanilla 論文時,突然對這篇論文的展示處感到好奇:“arXiv”?這是什麼怪地方啊?
最近讓我再度注意到 arXiv(有人稱之為「預印本文獻庫」)的機緣,就是剛出爐的菲爾茲獎得主 Perelman,他的獲獎成就:解決龐加萊猜想,當初(2002
年)也是選擇發表在 arXiv。拜菲爾茲獎之賜,arXiv
頓時聲名大噪,最近索性將 Perelman 的這三篇論文擺在顯眼的位置以方便慕名而來的人下載。
在 ptt PhD 的「菲爾茲獎的兩位數學家」討論串裡,提到更多有趣的事。其中關於
arXiv 的概況,網友 Immanuel 說道:
這… 應該念物理、數學的人都知道的地方吧 @@
雖然不是每一個人都會把論文先丟在這邊,但至少也有 50-60%
的比例了。
在論文寫好後,被期刊正式接受發表前,先把它丟在 arXiv,這樣你的東西是什麼時候作出來的就會有一個公認的紀錄(以後要吵這個理論是誰先弄出來的也好友個憑藉)。一方面放
arXiv
也比較容易接觸到比較多讀者(因為不用錢就可以看),有些教授在寫
publication 的時候,後面也會放一個 arXiv 連結可以免費下載。
它還有讓你知道科學最前線的功能:這麼多人把文章放到
arXiv
上,每天瀏覽一下也可以知道現在最熱門的研究題目是什麼。雖然不是說每個作者都是大師,但至少也多半是教授、博士後、研究生等等的學術領域人員,文章也多
半是準備要投出去的,正確度絕對比什麼科學新聞高多了(當然困難度也…)。
這… 念 CS
的人不見得都知道吧… :Q
或許是 CS
領域的正式及非正式資訊交流場域多得太多了吧,相形之下,arXiv
就比較沒那麼突出。
雖然 arXiv 是發軔自高能物理界,但既然它也庫存了 CS
領域,我就站在 CS
本位來評論一下它的表現吧。以現階段的規模及細膩度觀之,自然遠遠不及
IEEE、ACM 等歷史悠久的官方組織所架的數位典藏網站,和 Goolar Scholar、CiteSeer、CiteULike
等網站相比也顯得稚嫩簡陋(同僚評註的欠缺弱化更
是令人遺憾),但本質已略具 Web 2.0
精神,如果介面設計上更能活絡參與者的互動,對於學術社群的需求有更細緻周全的考量,應該滿有潛力的。只不過在台灣這種迷信
SCI/SSCI/EI 的大環境,事前主動投稿到 arXiv
者恐怕不會太多,恐怕只是做為一個事後的備份倉庫。
更多關於 arXiv 的介紹:
在前述的「菲爾茲獎的兩位數學家」討論串裡,也提到像
Perelman
之類特立獨行的學術界人士之逸聞。竊想,這類希罕人種就更不可能出現在台灣這種學術環境了……\r
特立獨行其一、Perelman
作者: vonnewman (灰色腦細胞) 看板: PhD
標題: [資訊] 菲爾茲獎的兩位數學家\r
時間: Sat Sep 2 16:00:10 2006
今年的數學最高榮譽有四個人獲獎,其中一位
Terence Tao
相信不少人已從新聞報導知道,這人就是那種典型的天才少年:21
歲拿到博士,24 歲當教授,30
歲成為學術領域世界頂尖大師。
另外一位比較少被報導,但是台灣的媒體稍微有提過:佩爾雷曼
Grisha Perelman,解決了龐加萊猜想,我也稍微有印象。
但是,更讓人好奇的是這位老兄怪異的行為,跟現在世界學術界似乎完全脫了節。首先,他的證明不是登在重要期刊上,而是預印本文獻庫
(http://arxiv.org/)。第一次聽到有這地方,可以直接把論文放上去,不須經過審查。
更意外的是,他老兄的結果被其他學者確認之後,照大多數學術研究人員的反應,當然是投到最有名的期刊。
他卻不願意接受 Nature 和 Science
的邀請。台灣如果有人上了這兩期刊,馬上就上新聞,被稱為台灣之光云云,這老兄卻不當一回事。
就連拿到菲爾茲獎,他居然還不想去領!台灣要是哪天出了個菲爾茲獎的學者,馬上就會被當成英雄看待(跟台灣無關的
Terence Tao 都被大幅報導了)。
學術界的人或許不是很愛錢,但是,我想很少人能拒絕學術上的名位吧?很多老師為何升到教授還一直做研究,恐怕還是比較在乎能得一些名位、出席
conference,一堆人對你投注尊敬崇拜的眼神。
這位俄國數學家似乎完全不在乎,紐約時報把他稱是 “a new math mystery”。因為他的同事和朋友甚至聯絡不到他,在這個大多數學術工作者都汲汲於追求發表,希望能發表在一流期刊,進而當什麼講座、主席、院士這些頭銜或名位的年代,居然還有人像個隱士一樣,不僅是
math mystery,我倒覺得根本已是整個學術的 mystery。
關於龐加萊猜想,也是菲爾茲獎得主的數學家丘成桐也宣稱和兩位學者解決這問題,當然是大肆宣揚一番了,還有人質疑為何不登在更有名的期刊。
相較之下,佩爾雷曼還真是個怪人。
看到丘成桐的最後這篇報導,不禁令我想到《康特的難題》書中的情節……(詳見〈研究方法與論文寫作書單〉一文)
特立獨行其二、Veinott
作者: Tisrat (Be a Businessman!) 看板: PhD
標題: Re: [資訊] 菲爾茲獎的兩位數學家\r
時間: Sun Sep 3 14:19:48 2006
比較跩的像是這位:Arthur F. Veinott。
雖然領域不同 (該位大師是 optimization 方面的),他的特色就是成名後不再投稿期刊,一輩子可能只有十幾篇頂級期刊文章;但他對
optimization 有卓越的貢獻,要出個 50
到上百都不成問題。所有他的著作都只寫在他的上課講義裡,所以只有他的學生真正得到精華。
他是 Founding Editor of Mathematics of Operations Research,MOR
是該領域的夢幻期刊。
他的一輩子以教學生跟編講義為樂,老人家可不跟這些蠢不拉幾的期刊編輯跟審稿者浪費時間。(不像我們,期刊編輯跟審稿者可不跟我們這些蠢不拉幾的投稿者浪費時間。唉..)
這樣的學者,在台灣的升等制度之下,還能如此瀟灑嗎?
New Yorker 上的文章,關於 Poincaré, Perelman,以及丘成桐:應該是沒有問題的。實際上,你在 arXiv 上也可以看到有 CS
的選項,有一些理論計算機領域的精英也會將草稿事先發表在其上。
另一個在理論計算機科學上頗重要的則是 ECCC - The Electronic
Colloquium on Computational Complexity (應該算是另一種 e-Print)
有不少都是先發表在這裡然後才投到期刊,像是 The PCP
Theorem by gap amplification, Proc. of 38th STOC, pp. 241-250, 2006.
原先就放在 ECCC ’2005 上.
你在 arXiv 搜尋 FOCS or STOC 也可以看到一些……但是 CS
下的其他子領域我就不清楚了….
應該是沒有問題的。實際上,你在 arXiv 上也可以看到有 CS
的選項,有一些理論計算機領域的精英也會將草稿事先發表在其上。
另一個在理論計算機科學上頗重要的則是 ECCC - The Electronic
Colloquium on Computational Complexity (應該算是另一種 e-Print)
有不少都是先發表在這裡然後才投到期刊,像是 The PCP
Theorem by gap amplification, Proc. of 38th STOC, pp. 241-250, 2006.
原先就放在 ECCC ’2005 上.
你在 arXiv 搜尋 FOCS or STOC 也可以看到一些……但是 CS
下的其他子領域我就不清楚了….
而且,像 arXiv,作者是可以把自己的文章撤下來的,再加上又沒有
peer-review,基本上他的定位就是『預印本』,而不是電子出版。
但是我們可以做一個簡單的類比,如果其他領域的研討會,不接受
Technical Report,我想大概就不會接受 pre-print 了吧。
TCS 對 novelty
的看法,我猜是因為它驗證起來比較有理論架構上的明確性,可以透過數學歸納或演繹來證明;有很多領域的
conference 本身除了著作權問題,還要替自己 peer review
的品質背書。更重要的是,如果某領域承認某 technical report
的品質,那麼往往會轉變成「一稿多投」的問題,除非最後投到
conference 的版本與 pre-print 或 technical report
版相差甚多。於是,就我自己的情況來說,階段性成果我會放在
arXiv 上,但投到 conference
的東西仍然要大改。說起來那種強調 novelty 的 conference,人們最怕的是放上
pre-print
的點子被別人看到之後搶先把實驗做完或是做出更好的結果。有時候同一個領域的不同
conference 風格也完全不一樣,像 SIGIR 就比 WWW 更像 Journal。
拿 arXiv
和其他老前輩相比較,或許立足點有點不公平,但以使用者角度來看,使用者只會在意合不合用,不太會管它的歷史及後台。
BarrosH 提到「IEEE、ACM
本身是資電領域最大的學術社群,他們經營的學術資料庫和
arXiv
的立意並不相同」,我同意;但對我來說,前者提供的「規模及細膩度」(我文中提過)是我非常在意的,尤其是在做文獻回顧及檢索時。這一點沒做好,就會大大
降低對我的吸引力。