51网站,51网站在线观看推荐免费播放直播足球|51往期内容每日大瓜_51无码人妻精品1国产动漫私藏

荀恩東

發(fā)布日期: 2012-07-03 瀏覽次數(shù): 信息來源:人事處

荀恩東,博士,教授,博士生導(dǎo)師,北京語言大學(xué)信息科學(xué)學(xué)院院長,語言智能研究院院長,教育部新世紀(jì)優(yōu)秀人才,中國計算機(jī)學(xué)會名詞專委會副主任,中國標(biāo)準(zhǔn)化研究院特聘研究員,主要從事自然語言語言處理、計算機(jī)輔助語言學(xué)習(xí)技術(shù)研究和開發(fā)工作。2001年~2003年通過'香港引入優(yōu)秀人才計劃',在香港科技大學(xué)工作。發(fā)表研究論文數(shù)十篇,主持多項國家863計劃和國家自然科學(xué)基金項目,承擔(dān)多項部委和公司合作的項目。


教育經(jīng)歷

博士 | 1999.7 | 哈爾濱工業(yè)大學(xué)

碩士 | 1996.7 | 哈爾濱工業(yè)大學(xué)

學(xué)士 | 1993.7 | 哈爾濱工業(yè)大學(xué)

工作經(jīng)歷

助理工程師 | 沈陽飛機(jī)設(shè)計研究所 | 1990.07-1993.03

工程師 | 黑龍江省水利勘測設(shè)計院 | 1993.07-1994.09

副研究員 | 微軟亞洲研究院 | 1999.07-2001.11

資深研究員 | 香港科技大學(xué)創(chuàng)業(yè)公司 | 2001.11-2003.11

教授 | 北京語言大學(xué)信息科學(xué)學(xué)院 | 2003.11至今

研究方向

自然語言處理、基于漢語大數(shù)據(jù)語言知識抽取、漢語句法語義分析、語言資源建設(shè)。

承擔(dān)項目

1.國家社科基金重點項目(16AYY007)“大數(shù)據(jù)背景下漢語語塊數(shù)據(jù)庫建設(shè)與應(yīng)用研究”(2016);


2.國家自然科學(xué)基金面上項目(61170162) “漢字書寫規(guī)范性表征與評判”(2012-2015);


3.國家自然科學(xué)基金面上項目(60973062 ) “基于生成樹庫分析與生成一體化機(jī)器翻譯模型研究”(2010-2012)


4.國家自然科學(xué)基金面上項目(60573184 )“非母語寫作水平計算機(jī)自動評測技術(shù)研究”(2006)


5.國家自然科學(xué)基金面上項目(62076038 )“中文意合圖的表征與生成方法研究”(2020) 59萬 2021.01 - 2024.12


6.國家語委2019年重點項目(ZDI35-114)面向漢語語義計算的意合圖語法研究與資源建設(shè)  (2020.1-2012.12) 15萬


7.工信部重大人工智能揭榜任務(wù)  2019年




科研項目成果

1.中文句法語義分析系統(tǒng)


研發(fā)面向人工智能應(yīng)用的自然語言理解解決方案,基于漢語的意合性,搭建具有高魯棒性、高正確率和線速計算復(fù)雜度的中文句法語義分析系統(tǒng)。該系統(tǒng)針對漢語句法結(jié)構(gòu)特點,首次提出以“意合圖”為基礎(chǔ)融合多源知識的圖結(jié)構(gòu)語義-知識表示框架;確定采用塊依存語法與語義分析核心算法框架,實現(xiàn)了以符號計算制導(dǎo)的機(jī)器學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)多策略融合計算模型自動生成意合圖;本系統(tǒng)獲取語言知識建立在TB級別以上的漢語分析大數(shù)據(jù),可基于現(xiàn)有系統(tǒng)快速搭建適用于領(lǐng)域需求的示范應(yīng)用平臺。


2.BCC漢語語料庫


該語料庫被評為“教育部改革開放40周年高校科技進(jìn)步重大成就獎”。BCC語料庫總字?jǐn)?shù)約 150 億字,包括:報刊(20 億)、文學(xué)(30 億)、微博(30 億)、科技(30 億)、綜合(10 億)和古漢語(20 億)等多領(lǐng)域語料,是可以全面反映當(dāng)今社會語言生活的大規(guī)模語料庫。BCC漢語語料庫,總字?jǐn)?shù)約 150 億字,包括:報刊(20 億)、文學(xué)(30 億)、微博(30 億)、科技(30 億)、綜合(10 億)和古漢語(20 億)等多領(lǐng)域語料,是可以全面反映當(dāng)今社會語言生活的大規(guī)模語料庫。http://bcc.blcu.edu.cn/


3.卡片漢語網(wǎng)站


該網(wǎng)站支持漢語老師快速地制作生動活潑的教學(xué)課件,每個課件由多張交互式的多媒體卡片組成。


4.漢字字形計算系統(tǒng)


該系統(tǒng)以學(xué)習(xí)漢字書寫的學(xué)生為研究對象,采用數(shù)字媒體處理、模式識別、機(jī)器學(xué)習(xí)等信息技術(shù),對漢字書寫正確性和規(guī)范性的自動評測進(jìn)行基礎(chǔ)理論和應(yīng)用技術(shù)方面的研究。其目標(biāo)是實現(xiàn)計算機(jī)輔助的、無人值守的漢字書寫教學(xué)和評測。


8.非母語寫作水平計算機(jī)自動評測技術(shù)


研究非母語學(xué)生作文的計算機(jī)評測系統(tǒng)的技術(shù),以非母語教學(xué)中中介語語料庫為訓(xùn)練語料, 建立寫作水平計算機(jī)自動評測數(shù)學(xué)統(tǒng)計模型和基于Internet網(wǎng)絡(luò)的寫作水平自動評測原型系統(tǒng)。


8.專利云服務(wù)


為專利審查和專利服務(wù),建立基于互聯(lián)網(wǎng)的云服務(wù),可以對中文專利全數(shù)據(jù)進(jìn)行檢索,知識挖掘,專利分類等。


獲獎

1.北語BCC在線語料庫系統(tǒng) “改革開放40周年高校科技創(chuàng)新重大成就 2018年12月


專利

1.脫機(jī)手寫漢字的筆畫還原方法及裝置  授權(quán)公告日:2017.06.06




報告

1.基于意合圖的深度語義理解與落地應(yīng)用   CNCC2020 技術(shù)論壇


2.采用組塊依存文法生成漢語意合圖    CNCC2019 技術(shù)論壇


3.語言智能的核心是語義理解 CCF-GAIR 2020,主旨報告


4.語言智能應(yīng)用技術(shù)與人才培養(yǎng)  2020全球智博會,AI+教育論壇


5.面向人工智能的語言資源研發(fā)的理論和方法 人工智能產(chǎn)品應(yīng)用會議


社會服務(wù)項目

1.面向新聞生產(chǎn)的語言智能(新華社)


針對新聞領(lǐng)域行業(yè)痛點,項目組與新華社成為戰(zhàn)略合作伙伴,利用句法語義分析系統(tǒng)開展面向新聞生產(chǎn)的語義資源加工工作,滿足新華社新聞大數(shù)據(jù)管理、熱點發(fā)現(xiàn)、事件鏈、信息流構(gòu)建、輔助寫作、智能檢校等需求。


2.面向知識產(chǎn)權(quán)保護(hù)的智能服務(wù)系統(tǒng)(中國專利信息中心)


基于句法語義分析系統(tǒng),利用人工智能核心語言智能技術(shù),打造“面向知識產(chǎn)權(quán)保護(hù)的智能服務(wù)系統(tǒng)”,對專利智能檢索、自動分類、申請書撰寫、形式審查、分級管理、智能檢測知識產(chǎn)權(quán)侵權(quán)風(fēng)險等方面展開合作研究。


3.北京語言文化數(shù)字博物館


是國內(nèi)第一個面向語言文化而研發(fā)的開放式數(shù)字博物館。作為社會公共文化資源,內(nèi)容涉及北京方言、北京口傳文化、北京話土語圖典、北京話詩文吟誦、北京地名文化、北京名園楹聯(lián)匾額、北京三山五園御制詩、北京話研究歷史文獻(xiàn)等北京語言文化資源,不僅是人們了解認(rèn)識北京語言文化的重要窗口,也是搶救、整理、保護(hù)正在迅速變化的北京語言類非物質(zhì)文化遺產(chǎn)的重要平臺,在非遺保護(hù)、文化宣傳、社會教育、學(xué)術(shù)研究等方面都具有重要作用。


論文

1.Chengwen Wang, Endong Xun. Research on the Recognition of Chinese Autonomous,Verbs Based on Semantic Selection Restriction and Natural Annotation Information. CLSW 2017


2.Gao Jianfeng, Xun Endong , TREC-9 CLIR experiments at MSRCN 2001 the 9 Text Retrieval Conference


3.Gaoqi Rao, Meng Dai, Endong Xun. Study on the Effectiveness of the Regulations for Chinese Words with Variant Forms Based on a Long-Span Diachronic Corpus. CLSW 2016


4.Gongbo Tang, Gaoqi Rao, Dong Yu, Endong Xun. Can We Neglect Function Words in Word Embedding? NLPCC/ICCPOL 2016


5.Xun Endong ,Extract Chinese Term definition from database and Internet 2003 the 6th East Asia Forum on Terminology


6.Xun Endong ,Huang hangning, A unified statistical model for identification of English baseNP,ACL,2000


7.Xun Endong, Decision Tree Based Rule Processing in Machine Translation,The Second International Conference on Multimodal Interface,1999


8.Xun Endong. A New Rule Processing Method Based on Decision Trees,高技術(shù)通訊(英文版),1999


9.黃志娥, 謝佳莉, 荀恩東. HSK自動作文評分的特征選取研究,計算機(jī)工程與應(yīng)用 ,2014 (06)


10.蔣碧蓉, 程永紅, 王海濤,荀恩東.國家標(biāo)準(zhǔn)文檔結(jié)構(gòu)化置標(biāo)[J].標(biāo)準(zhǔn)科學(xué),2014(04)


11.劉穎濱, 孫燕南, 荀恩東. 一種基于三維空間信息的字形匹配方法[J].北京大學(xué)學(xué)報(自然科學(xué)版),2016,52(01)


12.錢揖麗, 荀恩東, 宋柔. 基于SLM的二叉樹在語音停頓預(yù)測中的應(yīng)用[J].計算機(jī)工程,2006(19)


13.錢揖麗, 荀恩東. 基于標(biāo)點信息和統(tǒng)計語言模型的語音停頓預(yù)測模式識別與人工智能 ,2008 (04)


14.錢揖麗, 荀恩東. 基于分類回歸樹CART的漢語韻律短語邊界識別,計算機(jī)工程與應(yīng)用 ,2008 (06)


15.錢揖麗, 荀恩東. 基于最大熵模型的漢語短語間停頓識別[J].計算機(jī)工程與應(yīng)用,2008(17)


16.饒高琦, 修馳, 荀恩東. 語料庫自然標(biāo)注信息與中文分詞應(yīng)用研究(英文),北京大學(xué)學(xué)報(自然科學(xué)版) ,2013 (01)


17.饒高琦, 于東, 荀恩東. 基于自然標(biāo)注信息和隱含主題模型的無監(jiān)督文本特征抽取[J].中文信息學(xué)報,2015,29(06)


18.唐共波, 于東, 荀恩東. 基于知網(wǎng)義原詞向量表示的無監(jiān)督詞義消歧方法[J].中文信息學(xué)報,2015,29(06)


19.王海峰, 李生, 趙鐵軍, 楊彥, 荀恩東, 張民. 漢英雙向機(jī)器翻譯系統(tǒng)BT863的研究與實現(xiàn)[J].情報學(xué)報,1997(05)


20.王潔, 荀恩東. 兼類詞排岐的一種方法 2004 第二屆全國學(xué)生計算語言學(xué)研討會論文集


21.許勇, 荀恩東, 賈愛平, 宋柔. 基于互連網(wǎng)的術(shù)語定義獲取系統(tǒng),中文信息學(xué)報 , 2004 (04)


22.顏偉, 荀恩東. 基于WordNet的英文詞語相似度計算 2004 第二屆全國學(xué)生計算語言學(xué)研討會論文集


23.于東, 荀恩東. 基于Word Embedding語義相似度的字母縮略術(shù)語消歧,中文信息學(xué)報 ,2014 (05)


24.虞寧翌, 饒高琦, 荀恩東. 文言信息的自動抽取:基于統(tǒng)計和規(guī)則的嘗試[J].中文信息學(xué)報,2015,29(06)


25.荀恩東, 蔡萌, 李生, 趙鐵軍. TDPSOLA文語轉(zhuǎn)換技術(shù)和建立漢語音節(jié)單元庫的研究[J].計算機(jī)科學(xué),1998(06)


26.荀恩東, 李生, 趙鐵軍. 基于漢語二元同現(xiàn)的統(tǒng)計詞義消歧方法研究[J].高技術(shù)通訊,1998(10)


27.荀恩東, 李晟. 采用術(shù)語定義模式和多特征的新術(shù)語及定義識別方法,計算機(jī)研究與發(fā)展 ,2009 (01)


28.荀恩東, 呂曉晨, 安維華, 孫燕南. 面向書寫教學(xué)的手寫漢字圖像筆畫還原[J].北京大學(xué)學(xué)報(自然科學(xué)版),2015,51(02)


29.荀恩東, 錢揖麗. 應(yīng)用二叉樹剪枝識別韻律短語邊界,中文信息學(xué)報,2006(03)


30.荀恩東, 饒高琦,肖曉悅, 臧嬌嬌.大數(shù)據(jù)背景下BCC語料庫的研制[J].語料庫語言學(xué),2016,3(01)


31.荀恩東, 宋柔. 非母語寫作水平自動評測,2006, 哈佛大學(xué)漢語書面語研討會


32.荀恩東, 顏偉. 基于語義網(wǎng)計算英語詞語相似度,情報學(xué)報,2005(01)


33.荀恩東, 趙鐵軍, 李生. BT863-Ⅱ英漢機(jī)器翻譯中譯文選擇方法[J].情報學(xué)報,1999(02)


34.荀恩東,李生,匹配樹和決策樹方法識別英語句子中的BaseNPs,計算機(jī)研究與發(fā)展,1999


35.荀恩東,李生,英漢機(jī)器翻譯中基于目標(biāo)語同現(xiàn)的詞義消歧方法,情報學(xué)報,1999


36.臧嬌嬌, 荀恩東. 基于BCC的離合詞離析形式自動識別研究[J].中文信息學(xué)報,2017,31(01)


37.張文靜,張惠蒙,楊麟兒,荀恩東. 基于Lattice-LSTM的多粒度中文分詞[J].中文信息學(xué)報,2019,33(01):18-24.


38.面向句法結(jié)構(gòu)的文本檢索方法研究,馬路遙, 夏博, 肖葉, 荀恩東  電子學(xué)報  2020, Vol. 48  Issue (5): 833-839


39.三元搭配視角下的漢語動詞語義角色知識庫構(gòu)建 王誠文、錢青青、邢丹、李夢、饒高琦、荀恩東    中文信息學(xué)報2020 


40. 基于大規(guī)模語料庫的現(xiàn)代漢語動賓搭配知識庫構(gòu)建    王貴榮、饒高琦、荀恩東         中文信息學(xué)報2020  


41.基于篇章的漢語句法結(jié)構(gòu)樹庫構(gòu)建[J]. 盧露,矯紅巖,李夢,荀恩東.  自動化學(xué)報,2020


42.一種基于三維空間信息的字形匹配方法[J]. 劉穎濱,孫燕南,荀恩東. 北京大學(xué)學(xué)報(自然科學(xué)版),2016,52(01):81-88.


43.數(shù)字人文視角下的金庸文本挖掘研究. 邰沁清,夏恩賞,饒高琦,荀恩東. 《數(shù)字人文[西1] 》


44.中文文本蘊含類型及語塊識別方法研究, 于東, 軟件學(xué)報,2020年12期


45.大數(shù)據(jù)背景下BCC語料庫的研制[J]. 荀恩東,饒高琦,肖曉悅,臧嬌嬌. 語料庫語言學(xué),2016,3(01):93-109+118.


46.文言信息的自動抽取:基于統(tǒng)計和規(guī)則的嘗試[J]. 虞寧翌,饒高琦,荀恩東. 中文信息學(xué)報,2015,29(06):127-134+140.


47.基于自然標(biāo)注信息和隱含主題模型的無監(jiān)督文本特征抽取[J]. 饒高琦,于東,荀恩東. 中文信息學(xué)報,2015,29(06):141-149.


48.面向書寫教學(xué)的手寫漢字圖像筆畫還原[J]. 荀恩東,呂曉晨,安維華,孫燕南. 北京大學(xué)學(xué)報(自然科學(xué)版),2015,51(02):241-248


49.HSK自動作文評分的特征選取研究[J]. 黃志娥,謝佳莉,荀恩東. 計算機(jī)工程與應(yīng)用,2014,50(06):118-122+126.


50.基于Word Embedding語義相似度的字母縮略術(shù)語消歧[J]. 于東,荀恩東. 中文信息學(xué)報,2014,28(05):51-59