加载中…
正文 字体大小:

转载:近代漢語研究網絡資源綜述

(2010-02-28 23:52:04)
标签:

杂谈

分类: 备忘
近代漢語介于古代漢語與現代漢語之間,只有在大的語言曆史背景下,才能考察出其在漢語轉型時期語言的發展變化規律。因此,從時間上來說,對它的研究 要涉及到古代漢語、近代漢語和現代漢語。又由于語言學研究是一個很複雜的工作,它又是與文字學、訓估學、音韻學、方言學等學科緊密聯系在一起的。語言學的 研究,不僅要充分利用已有傳統的豐富的語料資源和研究成果,更要積極吸收信息時代先進的網絡資源。電腦科技的進步帶動了知識網絡的傳播,各種知識資源得到 了最大程度的共享。以下就我所搜集到的(大家熟悉的除外)有關語言學研究的網絡資源做一個簡單的分類綜述。

一、專門網站

1、近代漢語語料庫詞頻統計:http://elearning.ling.sinica.edu.tw/jindai.html

    該語料庫是中央研究院創立的專門網站。近代漢語語料庫詞頻統計提供近代漢語詞頻信息。我們可依據詞頻統計提供的訊息得知詞語的數量與頻率,從而幫助我們瞭 解此時期的詞語使用情況。有四個查詢功能,即查閱詞頻排序、查閱個別詞的頻率、查閱個別頻率的詞、查閱累積詞頻。查閱詞頻排序:輸入數字以查詢指定詞頻排 序範圍之間的詞,數字越大頻率越小。例如輸入數字1和10,就是使用者要查詢排序從第1到第10之間所有的詞。查閱個別詞的頻率:輸入要查詢的詞以查詢該 詞的頻率,標記可有可無。當沒有標記時,則顯示出該詞所有詞性的詞頻。如果要查特定詞性的詞頻,可加上標記,比如:“工作(Na)”,表示查詢名詞的詞 頻,系統會排除其他詞類,只留下名詞。查閱個別頻率的詞:輸入要檢索的詞頻數字,系統會顯示同樣頻率的所有的詞。查閱累積詞頻:可查詢累積頻率的覆蓋率, 最常出現的詞百分比越低。

    與此類似的還有:“上古漢語語料庫詞頻統計”http://elearning.ling.sinica.edu.tw/guhanyu.html和“現代漢語語料庫詞頻統計”http://elearning.ling.sinica.edu.tw/CWordfreq.html,他們與“近代漢語語料庫詞頻統計”相比,除文本範圍不同之外,詞頻統計介面與功能都相同。

2、北大CCL語料庫:http://ccl.pku.edu.cn/YuLiao_Contents.Asp

    此語料庫是北京大學漢語語言學研究中心開發和維護的,是純學術性非盈利網站。以交流語言學研究經驗,傳播語言學研究成果,推動語言學研究和發展爲宗旨。包括現代漢語語料庫http://ccl.pku.edu.cn:8080/ccl_corpus/index.jsp?dir=xiandai、古代漢語語料庫http://ccl.pku.edu.cn:8080/ccl_corpus/index.jsp?dir=gudai和漢英雙語語料庫http://ccl.pku.edu.cn:8080/ccl_cecorpus/index.jsp?dir=chen,但漢英雙語語料庫目前僅對北大校內用戶開放。

    北大CCL語料庫檢索系統的主要功能與特色有:⑴、支持複雜檢索表達式(比如不相鄰關鍵字查詢,指定距離查詢等等)。⑵、支持對標點符號的查詢(比如查詢 “?”,可以檢索語料庫中所有疑問句)。⑶、支持在“結果集”中繼續檢索(對于複雜的查詢要求,可以嘗試通過多次查詢完成,即利用“在結果中查找”功能, 逐次逼近檢索目標。)。⑷、用戶可定制查詢結果的顯示方式(如左右長度,排序等)。⑸、用戶可從網頁上下載查詢結果(查詢結果以txt文件形式保存到本地 磁盤上。每句之後會注明該句的出處、作者、路徑等信息。)。⑹、有強大的過濾功能,通過指定過濾項中的author(作者),name(篇 名),path(文件路徑),type(文章類型),用戶可以縮小查詢語料的範圍。比如想查詢唐代語料中“給”的使用情況,可以在查詢表達式中輸入 “path:唐給”(“path:唐”跟關鍵字“給”之間需有空格隔開)。想查詢“老舍”先生的文章中“A來A去”的用法,在查詢表達式中輸入 “author:老舍,pattern:A來A去”即可。

3、中央研究院近代漢語標記語料庫:http://dbo.sinica.edu.tw/Early_Mandarin/

    此語料庫是“中央研究院古漢語語料庫”的一個次語料庫。“中央研究院古漢語語料庫”為中央研究院語言研究所應漢語史研究需求而建構的語料庫。語料庫建構始 於1990年,可依是否經過斷詞及加標詞類而分成兩類,即未加標的素語料庫以及有標注的標記語料庫。目前語料庫所蒐集的語料已含蓋上古漢語(先秦至西 漢)、中古漢語(東漢魏晉南北朝)、近代漢語(唐五代以後)大部分的重要語料;在標記語料庫方面,上古漢語及近代漢語都已有部分語料完成標注的工作,並視 結果逐步提供上線檢索。“中央研究院近代漢語標記語料庫”WWW版於二○○一年十一月首次開放供各界使用。目前提供《紅樓夢》、《金瓶梅》、《平妖傳》、 《水滸傳》、《儒林外史》、《醒世姻緣》、《西遊記》、《關漢卿戲曲集》、《元刊雜居三十種》、《永樂大典戲文三種》等十部古典文獻語料線上檢索。在查詢 功能方面,可以在顯示詞項及其詞類的同時,顯示例句的出處,便於歷史語法的研究者使用;在斷詞標類的憑準方面,也有其特色,在此不多贅述。除此還有:

⑴、上古漢語標記語料庫:http://old_chinese.ling.sinica.edu.tw/

    此資料庫是“中央研究院古漢語語料庫”的一個次語料庫。

⑵、現代漢語標記語料庫:http://dbo.sinica.edu.tw/ftms-bin/kiwi1/mkiwi.sh

    此語料庫是專門針對語言分析而設計的,每個文句都依詞斷開,並標示詞類。語料的蒐集也盡量做到現代漢語分配在不同的主題和語式上,是現代漢語無窮多的語句中一個代表性的樣本。

4、中文詞彙網絡:http://cwn.ling.sinica.edu.tw/

    此資料庫目的是在提供完整的中文詞義區分資料,在實際的應用上,這個資料庫可望成為中文語言處理與知識工程不可或缺的基底架構。藉著累積了三年多的研究成 果,他們對詞義區分定義,與詞義表達方式,漸次做了修正,內容以中頻詞為主,共有5600個詞形,13160個詞義。但由於還不夠完善,可惜有些詞在數據 庫中不能查到。

5、漢語詞彙學網:http://218.193.49.104:8080/(S(0q5kxoyl54pv5lev0xgoihj4))/default.aspx

    該網站是由廈門大學中文系主辦的一個比較專業的詞彙學網站。主要分學術會議、學術著作、論文列表、專家學者、科研課題、碩博士導航和資料交流幾個部分。此網站現在還處于初步建設階段,也僅就所開辟的欄目建立了一個大體的框架,還有待于進一步的建設和改進。

6、中文句結構樹資料庫:http://treebank.sinica.edu.tw/

    “中文句結構樹資料庫”包含了6個檔案,61087個中文樹圖,361834個詞,是中央研究院詞庫小組從中央研究院平衡語料庫中,抽取句子,經由電腦剖 析成,結構樹並加以人工修正、檢驗後的所得的成果。在中文句結構樹中標示了中文句語意和語法的訊息。目前開放網上檢索及資料移轉,以供學者專家在中文句 法、語意關系研究慘考之用。另有1000個句結構樹開放下載。只不過使用者需要向學會提出申請付款才能使用。

7、漢語網:http://www.hanyuyanjiu.cn/

    該網站資料豐富,涉及面廣。主要版塊有:語音、詞彙、語法、語用、現當代漢語、近代漢語、古代漢語、文摘、資源下載等,還有唐宋詞在線檢索、成語查詢、《中國語文》檢索及在線投稿等。主頁下面的語言學相關網址導航有很多語言學方面的網址。

8、南開大學語言比較數據庫:http://www.nankaiyuliaoku.com/index.html

    該系統的語言材料是南開大學語言學科師生田野調查獲取的漢語各方言、各民族語言的第一手資料,每一詞條的詞義注有英文翻譯,可以同時進行某詞語的各語言語 音比較,以及與漢語上古、中古音的比較。該數據庫有兩個版塊:中國語言語料數據庫和漢語古音比較手冊。進入“中國語言語料數據庫”,在搜索框中輸入漢字, 比如“家”,即可搜到與“家”意思相關的各民族的詞語,並且都配有其實際讀音、詞性及英譯文。還可以用手拖動詞條到“詞條比較”對其進行專門的比較。進入 “漢語古音比較手冊”,在搜索框中輸入漢字,即可查出漢字的上古韻部,上古、中古擬音和反切等。並且在這個頁面上還有“常見字中古音對照表”和“常見字上 古韻諧聲表”,方便查詢使用。

9、遠程登錄圖書館數據庫:http://library.wustl.edu/

    如能聯網,可用遠程登錄到http://library.wustl.edu/,可以找到世界上主要圖書館,然後再用ftp(File Transfer Protocol,文件傳遞協議)的程序,進入個別圖書館。

 

二、論壇、博客

1、複旦中文論壇:http://chinese.fudan.edu.cn/forum/

    本壇是複旦大學中文系和語文所的官方論壇。此論壇的學術中心版塊有“漢語言文字學”欄目,下又設方言學、中國語言學史、漢語史、音韻學、訓估學、文字學、 語源學子欄目。在論壇中可以向名師請教疑難問題和閱讀優秀學術論文,可以得到一些學術會議信息和優秀課程信息以了解最新學術動態。

2、北大中文論壇:http://www.pkucn.com/index.php

    北大中文論壇致力于做中國最好的中文學術論壇,內容豐富,語言和緩,兼容並蓄。他們把自己開發出來的語料庫拿來讓社會免費共享。版面分很多版塊,涉及中文 的各個學科,如古典文獻學、漢語語言學、語音學、漢語詞彙學等。“學術論壇”版塊和“專題討論區”版塊的內容學術研究價值最大。論壇中有原創作品,也有對 某一問題的集體討論。從他們的討論中可以發現新的研究思想和方法,對我們的研究會有啓發。

3、南京大學文學院學術論壇:http://chin.nju.edu.cn/smf/

    南京大學文學院的論壇也不錯,內容也相當豐富。重要的版塊有學術討論區、專題討論區、課程討論區、電腦與網絡技術討論區、班級天地等。每一個版塊都有更細 緻的分類,其中的語言學及應用語言學、漢語言文字學、中國古典文獻學等對我們的學習都有很大的幫助。有時也有一些學術會議簡介等,為我們了解學術動態提供 了窗口。

4、諾貝爾學術資源論壇:http://bbs.ok6ok.com/?u=184838

    該論壇方便查閱國內外文獻資料。論壇分很多版塊,語言學方面的知識集中于“文史哲學”版塊。雖然此論壇也需要注冊才能使用,但它不像有些論壇,查個資料需要很高的威望或積分,諾貝爾對新人是一來就送1威望,馬上妳就能在論壇得到大量的國內外文獻資料了。

5、湘裏妹子學術論壇:http://www.xlmz.net/

    該論壇是由國內外學者、博士等先進的管理團隊共同管理的,以語言學爲主的學術交流平台。它彙集了海內外大量學術資源,同時還設有紀錄片、文藝、佛道禅學、精神分析學等特色欄目。其中的現代漢語區、漢語方言區是語言文字學研究的寶貴資料來源。

6、語料庫語言學在線論壇:http://www.corpus4u.org/

    是一個比較專業的語言學論壇,內容豐富,有很強的學術慘考價值。版面有公告(比如約稿通知)、理論探討(比如語言學理論前言的探討)、專題研究、語料庫檢索、標注與工具開發、特別關注、友情論壇等版塊。

7、張義的語言學博客http://blog.stnn.cc/pczy2001/Efp_Blog.aspx

    張義是華中科技大學語言學及應用語言專業已畢業研究生。他的博客內容豐富,專業性強,分以下幾個版塊:漢語研究動態、他山之石、我的塗鴉、漢語研究資源、 漢語研究軟件下載、圖片等。博客中有一些他自己和轉載別人的論文,有語言學先進輔助工具的介紹,還可以下載各種語言研究工具。“我的鏈接”還可以鏈接到很 多有用的語言學網站。遺憾的是此網站已經很久沒有更新了。

三、語料庫

1、中華五千年:http://www.zh5000.com/

    中華五千年網是一家以中華文史爲基石,傳播中國文明的綜合性大平台。中華五千年網旗下有十二大主要欄目:中國傳統文化、中華工藝品、中國國家地理、探索發 現、國學經典、中華人物、中國美術、中華圖庫、中華書友會、視覺中華、中華論壇、專題。“中華傳統文化”內容豐富,涉及到了中國建築、中國佛教、道教、中 國儒學、中國文學、中國戲曲、中國文字等。“國學經典”藏書豐富全面,分經部、史部、子部、集部和其他五部分,可在線閱讀,也可下載。此網站可獲得豐富的 語言學文獻資料。

2、漢達文庫(收費):http://www.chant.org/

    本站由漢達文庫所製作,其目的在於將中國古代全部傳世及出土文獻加以校訂、整理,並收入電腦資料庫,然後通過各種媒體出版,為研究工作者、教育界以及大眾 提供一重要學術工具與文化寶庫。漢達文庫包括:甲骨文、金文、竹簡帛書、先秦兩漢、魏晉南北朝、類書。界面設置簡單明瞭,使用起來方便快捷。“功能演示” 版塊有對功能及使用方法的詳細說明,在此不再贅述。但是此網站是收費的,必須先登記成為會員才能使用。為方便用戶在登記為漢達文庫註冊用戶前對文庫有一初 步認識,文庫特設為期三十天的免費漢達文庫試用版。只不過試用版資料庫內容約為整體的百分之十。

3、中央研究院曆史語言研究所明清檔案工作室:http://archive.ihp.sinica.edu.tw/mct/(有時此網頁打不開或打不開首頁,可在百度中輸入“中研院史語所明清檔案工作室”,點擊第壹個條目即可)

    中央研究院歷史語言研究所民初輾轉購買,藏“內閣大庫檔案”。由所屬“明清檔案工作室”執行整理作業。此所所藏內閣大庫檔案原件時間遠溯至明代,下抵清 末,內容多样而豐富,是研究明清的歷史、語言等不可忽視之重要典藏。“相關檢索工具”中還有很多相關資料,十分珍貴。在“明清檔案百科”版塊中可查詢所需 資料,輸入關鍵字即可。此資料庫分清代公文書、清代行政體制、六部成語三個版塊。通過這些資料不僅可以了解歷史,更為我們研究當時的語言提供了第一手權威 資料。

4、遼金元拓片數位典藏:http://rub.ihp.sinica.edu.tw/lcyrub/

    本站為中央研究院歷史語言研究所製作。傅斯年圖書館藏有遼金元拓片約2000幅,其中以元代拓片占絕大多數,約1400幅;遼、金拓片各為160、450 幅。內容涵蓋了墓誌、墓碑、刻經、造像、題名、詩詞、道教、佛教、聖旨、令旨、法旨等等,豐富多彩。遼金元三代以契丹、女真、蒙古語為國語,國語與漢語通 行並用,因而遼金元三代文獻既有漢文書寫者,亦有契丹、女真、蒙古文書寫者。傅圖所藏非漢語拓片數目雖然不多(約200幅),卻是目前罕見的拓本,是研究 中古音韻和遼金元語言相當珍貴的史料。

    有兩種查詢,即簡單查詢和進階查詢,查到的拓片有相應的介紹,如題名、年代、高廣、語文、刻立地點等,精確詳細。“相關網站”里有豐富的資料資源,拓片資源有:中國國家圖書館——碑帖菁華http://res4.nlc.gov.cn/index_jstp.jsp?channelid=75013,中國碑帖拓片網http://www.gjj.cc/url/3603.htm,中央研究院歷史語言研究所——拓片典藏知識暨網絡應用http://rub.ihp.sinica.edu.tw/等;遼金元研究網站有:中國社會科學院歷史研究所——隋唐五代宋遼金元史研究室http://ich.cass.cn/Article_Show2.asp?ArticleID=261,遼金史研究http://www.liaojinhistory.com/,宋遼金元學會 http://www.humanities.uci.edu/eastasian/SungYuan/等。

 

四、其他相关

1、疑難字查詢網:http://www.haosystem.com/

    打不出的漢字,不管是疑難字、生僻字、冷僻字、簡體字、繁體字、繁難字,幾乎一切漢字字庫中存在的字在這個網站上都可以免費找到。按漢字的構成成份查詢是 此網站的最大特點,將漢字拆分進行查詢,可以不用考慮順序。如“翀”可輸入“羽中”或“習中習”甚至“中習”均可。查到字後,點擊該漢字,系統會自動複制 該漢字,這樣用戶就可以在當前的文件中,用“粘貼”即可將該漢字粘貼到所需要的位置上。同時,系統會在本窗口內自動顯示該漢字的詳細信息,比如此字的筆 畫、筆順拼音編碼、五筆編碼等。在《管錐編》校對過程中一直找不到的漢字“[转载]近代漢語研究網絡資源綜述”,在漢字拆分框中輸入“廣、吾”,即能找到。

2、漢字古文字字體演變:http://web.hku.hk/~jwilam/chinese/change.htm

    本資料庫整合了甲骨文、金文、楚帛書、小篆、隸書等字形,操作簡單,只需將關鍵字輸入檢索,即可得到該字行體之演變過程。但是使用本資料庫必須滿足系統要 求:已直接載入或已安裝中央研究院“漢字構形資料庫”,以載入中研院甲骨文、中研院金文、中研院楚系簡帛文字、北師大說文小篆等四種字型;下載並載入“教 育部隸書 ”。如果輸入關鍵字后顯示的都是楷書,原因是系統未載入以上字型或所載入的古文字電腦字型未收錄。

3、校對網:http://www.jiaodui.com/

    從無紙化校對和校對標准版塊中我們可以了解一些提高校對效率方面的知識和解決一些經常見到的文字問題。在語言文字版塊中可以得到比較專業的語言文字知識。

4、象牙塔:http://xiangyata.net/history/index.htm

    該網站頁面設置古樸大方、清潔清晰,內容豐富多采。像其他網站一樣設有幾個版塊:論文選刊、動態綜述、書評書訊論著索引、學術資源、專題研究、史林雜識、 國史探微論壇。雖然是曆史學網站,但文史哲不分家,每個版塊中都有對語言文字研究有用的資料。對本人來說,其最有用的還是它的資料檢索、網站推薦、期刊目 錄、論著索引、文史應用軟件與工具這幾個部分,具體的不多贅述。

5、綜合網上漢語辭書:http://web.hku.hk/%7Ejwilam/chinese/pedia.htm

    此網站最重要的特點是將多種辭書綜合起來,使用方便。

    形義版塊包括:甲骨文、字源考釋、說文解字、段注說文解字、康熙字典、异体字字典、漢典、国学辞典、中國哲學書電子化計劃、古汉语语料库、近代汉语语料 库、现代汉语平衡语料库、中文词汇网络、字体演变。聲韻版塊包括:上古音查询、中古音查詢、古今音韻檢索系統、古今字音对照查询系统、韻鏡汉字古今音检索 系统、粤音音韵集成。

    有關語言學的網絡資源豐富多彩,但由於能力有限,盡數尚相差甚遠,敬請不吝賜教,謝謝!

0

阅读 评论 收藏 转载 喜欢 打印举报
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有