News & Events
Topic: 學術研討會 - 文本內容理解研究與領域知識工程
|
Posted - 16/03/2009 : 15:42:41
City University of Hong Kong Dep
中文、翻譯及語言學系
學術研討會
文本內容理解研究與領域知識工程 講者
穗志方博士 北京大學 Date: 二零零九年三月二十四日(星期二)
Time: 下午 4:30 - 6:00
Venue: 香港城市大學 教學樓藍區七樓B7603室 (Revised)
摘要
第一部分:文本內容理解的資料基礎
本部分將介紹北京大學計算語言所正在建立的大規模、高品質、多層次的綜合型語言知識庫系統。針對北大計算語言所已建成的語言知識資源,進行規範、完善、擴展與深化。以《現代漢語語法資訊詞典》與“大規模基本標注語料庫”為核心,實現語法到語義的拓展,詞彙到概念的拓展,語義到語用的拓展,通用領域到專業領域的拓展,句子向篇章的拓展,漢語到英語、日語等語言的拓展。包括:多語言概念詞典、大規模詞義標注語料庫、現代漢語詞語的概率語法屬性描述以及大規模成語庫等。最終建成具有國際先進水準、規模大、品質高的以漢語為核心的綜合型語言資源和知識庫系統。在此過程中研究語言知識庫建設相關的基礎理論及知識描述體系、自動化的語言知識庫建設方法,研製面向語言知識庫建設的關鍵技術,並構建相應的支撐工具與平臺,為提高語言知識庫建設的自動化提供有力支撐。
第二部分:基於自然語言處理的領域知識工程
利用自然語言處理技術對現有的知識資源進行深入的挖掘,以實現對知識的更充分的利用。核心思想是:利用人工智慧、自然語言分析以及文本挖掘技術匯總、分析、挖掘和整合現有的多領域、多類型、多來源知識資源。在此基礎上實現智慧化和人性化的知識服務,打造知識服務精品。主要研究內容包括:基於知識元的知識描述體系的建立、基於自然語言處理的內容加工平臺的設計與開發、包括術語提取、概念學習與概念關聯式結構自動生成的一體化知識加工流程以及知識服務的實現。
講者簡介
穗志方 :女。北京大學資訊科學技術學院計算語言研究所,博士,副教授。1998年6月於北京大學電腦系獲博士學位;1998年7月-2000年7月,於北京大學信息科學技術學院從事博士後研究工作;2000年9月根據香港政府“輸入優秀人才計劃”應聘于香港科技大學科技創新中心任職研究員;2002年3月至今,在北京大學資訊科學技術學院計算語言學研究所從事科研和教學工作。十多年來一直從事自然語言處理方面的研究。作為課題負責人完成的科研學專案有:國家自然科學基金專案、北京市自然科基金專案、國家新聞出版集團科研專案。作為技術骨幹,協助課題負責人俞士汶教授進行國家973專案“數位內容理解的理論與方法”的課題之一“文本內容理解的資料基礎”的研究。
~ All Are Welcome ~
|
|
|
Enquiry: LTenquiry@cityu.edu.hk