清華大學人工智能研究院自然語言處理與社會人文計算研究中心正式成立。這是清華AI研究院設立一周年之際成立的第八個研究中心,由孫茂松教授擔任主任。
2019 年 7 月 1 日,清華大學人工智能研究院自然語言處理與社會人文計算研究中心(以下簡稱中心)成立儀式在清華大學 FIT 樓舉行。清華大學副校長、清華大學人工智能研究院管委會主任尤政院士,清華大學人工智能研究院院長張鈸院士出席成立儀式并共同為中心揭牌。清華大學人工智能研究院院長助理朱軍教授主持成立儀式。
尤政院士致辭
尤政院士在致辭中指出,人類語言是人類智能的本質(zhì)體現(xiàn),更是人工智能技術(shù)當下和未來發(fā)展的戰(zhàn)略制高點。清華大學是國內(nèi)最早開展自然語言處理的單位之一,經(jīng)過四十年的不懈努力,已經(jīng)發(fā)展成國內(nèi)外自然語言處理研究的一方重鎮(zhèn)。中心的成立對于推動清華大學人工智能的深入發(fā)展具有十分重要的意義。自然語言處理與社會科學及人文科學相結(jié)合,具有大跨度學科交叉的性質(zhì),既是人工智能研究本身的積極拓展,也是對傳統(tǒng)學科在人工智能時代的守正出新。希望中心能夠凝聚清華自然語言處理研究力量,加強與人文社科學科的交叉合作,開展具有世界水平的自然語言處理基礎理論研究和關(guān)鍵技術(shù)創(chuàng)新,服務于清華與國家的人工智能發(fā)展戰(zhàn)略。
張鈸院士致辭
張鈸院士代表清華大學人工智能研究院致辭。他指出語言是人類智能的重要標志,機器自然語言理解是人工智能的終極目標。清華大學在自然語言處理方面有著深厚的研究積淀,1978 年成立人工智能與智能控制教研組時,自然語言處理就是其中的重要研究方向之一,在黃昌寧教授領導下迅速發(fā)展成為國內(nèi)領軍的研究單位。新成立的中心將致力于實現(xiàn)自然語言處理與人文社科的深度融合,從語言、社會學、人文學等多個角度理解人類智能的本質(zhì),是研究院人工智能基礎研究的重要組成部分。希望中心再接再厲,在自然語言處理與社會學、人文學的交叉研究上形成特色,引領我國自然語言處理和社會人文計算研究領域的發(fā)展。
清華大學自然語言處理研究方向開拓者黃昌寧教授(左)在成立儀式上
朱軍教授主持儀式
尤政院士與張鈸院士為中心揭牌
中心主任由清華大學人工智能研究院常務副院長孫茂松教授擔任。在成立儀式上,尤政院士和張鈸院士向?qū)O茂松教授頒發(fā)了中心主任聘書。中國中文信息學會原理事長、中國工程院院士倪光南,滑鐵盧大學講座教授、加拿大皇家科學院院士李明,微軟亞洲研究院副院長、國際計算語言學會會長周明,英國帝國理工學院數(shù)據(jù)科學研究所所長、英國皇家工程院院士郭毅可被聘為中心學術(shù)顧問。尤政院士和張鈸院士現(xiàn)場向出席會議的李明院士和周明副院長頒發(fā)了中心學術(shù)顧問聘書。
孫茂松教授被聘為中心主任
李明院士、周明博士被聘為中心學術(shù)顧問
在成立儀式上,李明院士、周明副院長以及清華大學法學院院長申衛(wèi)星教授、清華大學人文學院副院長劉石教授先后發(fā)言,對中心的成立表示衷心祝賀。
申衛(wèi)星教授發(fā)言
劉石教授發(fā)言
中心成立儀式合影
嘉賓合影
成立儀式之后舉行了自然語言處理前沿學術(shù)報告與開源成果發(fā)布會,分別由中心常務副主任劉洋副教授和中心主任孫茂松教授主持。
李明院士做特邀報告
李明院士做了題為《第二代對話機器人》的特邀報告。報告指出缺乏理解能力、缺乏學習能力、被動地“人云亦云”是第一代聊天機器人的主要缺陷,其原因在于目前的深度學習技術(shù)還不具備理解和使用人類語言所必需的概念抽象和邏輯推理能力。他認為實現(xiàn)理解和學習是第二代聊天機器人的主要目標,機器人只有通過自動學習和社會參與才能獲得不斷地成長,從而具備更強的運用人類語言的能力。
周明博士做特邀報告
周明博士做了題為《關(guān)于神經(jīng)網(wǎng)絡自然語言處理的思考》的特邀報告。報告對基于神經(jīng)網(wǎng)絡的自然語言處理的研究進展進行了系統(tǒng)地回顧與總結(jié),指出自然語言處理目前面臨著深度學習計算成本高昂、大規(guī)模標注數(shù)據(jù)稀缺、難以實現(xiàn)真正的理解與推理等關(guān)鍵挑戰(zhàn)。他認為未來應當從計算能力、數(shù)據(jù)資源、模型算法、系統(tǒng)應用、人才培養(yǎng)、交叉合作等六個方面進一步推動自然語言處理的發(fā)展。
中心成員劉洋、矣曉沅和劉知遠分別介紹了在數(shù)據(jù)驅(qū)動的機器翻譯、基于深度學習的中文詩歌自動生成系統(tǒng)以及大規(guī)模自然語言預訓練模型等方面的最新研究成果,并發(fā)布了相關(guān)開源工具、數(shù)據(jù)與模型。
劉洋副教授介紹開源成果 THUMT
THUMT 是一個基于深度學習的機器翻譯系統(tǒng)。該系統(tǒng)使用了數(shù)據(jù)驅(qū)動的機器翻譯技術(shù),具備良好的語言無關(guān)性,在具備訓練數(shù)據(jù)的條件下可以迅速為新語種部署系統(tǒng)。本次開源成果公布了在TensorFlow 平臺上開發(fā)的新版本,采用了主流的 Transformer 模型,集成了目前最新的神經(jīng)機器翻譯技術(shù),具有訓練速度快(支持多機多卡并行)、顯存占用低(支持單精度浮點數(shù)計算)、翻譯性能高(與國際機器翻譯開源軟件相比位居前列)、易于可視化分析(支持層級相關(guān)反饋算法)等優(yōu)點。此外還開放了 70萬句對的句級對齊漢英平行語料庫和 4 萬句對的詞級對齊漢英平行語料庫。項目網(wǎng)址:thumt.thunlp.org 在線翻譯系統(tǒng)網(wǎng)址:translate.thumt.cn
THUMT系統(tǒng)網(wǎng)址
THUMT翻譯界面
開源項目網(wǎng)址
矣曉沅博士生介紹開源成果 THUAIPoet
THUAIPoet (九歌)是一個基于深度學習的中文詩歌自動生成系統(tǒng),支持集句詩、絕句、藏頭詩、詞等不同體裁詩歌的在線生成。此次成果發(fā)布開源了系統(tǒng)中的無監(jiān)督風格詩歌生成模型StylisticPoetry 源碼(相關(guān)論文發(fā)表于 EMNLP 2018),能夠在無標注數(shù)據(jù)集上進行任意數(shù)量的風格解耦控制。此外還發(fā)布兩個人工標注的詩歌數(shù)據(jù)集(詩歌質(zhì)量數(shù)據(jù)集和詩歌情緒數(shù)據(jù)集),以及國內(nèi)外詩歌生成相關(guān)的主要論文列表。GitHub 網(wǎng)址:github.com/thunlp-aipoet 九歌 APP 網(wǎng)址:jiuge.thunlp.cn
九歌APP網(wǎng)址
九歌詩詞創(chuàng)作系統(tǒng)界面
GitHub開源網(wǎng)址
劉知遠副教授介紹開源成果 OpenCLaP
OpenCLaP(Open Chinese Language Pre-trained Model Zoo)是一個多領域中文預訓練模型倉庫。通過在多領域大規(guī)模中文文本的預訓練,這些預訓練模型可以在下游任務上進行微調(diào)以提高任務性能。本次開源成果公布了基于法律文本和百度百科千萬級文檔的預訓練模型,支持最大 512 長度的文本輸入適配多種任務需求。未來還將持續(xù)加入更多更強的預訓練模型,如增加更多訓練語料,引入大規(guī)模知識,使用全詞覆蓋策略等。GitHub 網(wǎng)址:github.com/thunlp/OpenCLaP 項目網(wǎng)址:zoo.thunlp.org
OpenCLaP網(wǎng)址
GitHub開源網(wǎng)址
中心是清華大學人工智能研究院設立一周年之際成立的第八個研究中心。中心將緊密圍繞人類語言所體現(xiàn)的人類智能本質(zhì),重點研究魯棒、可解釋的自然語言處理方法與技術(shù),深入探索語言理解與生成技術(shù)在社會人文計算領域的應用,努力建設以中文為核心、覆蓋多種語言、從詞法到篇章的全流程自然語言處理技術(shù)框架與計算平臺,力爭產(chǎn)出以智能創(chuàng)作、智能語言學習、智能教育、智能司法為代表的有國際影響力和重大民生意義的社會人文計算研究成果。
本中心的前身是清華大學計算機系自然語言處理課題組,早在上個世紀七十年代末就在黃昌寧教授的帶領下從事自然語言處理研究工作,是國內(nèi)開展相關(guān)研究最早、深具影響力的科研單位,同時也是中國中文信息學會(全國一級學會)計算語言學專業(yè)委員會的掛靠單位,孫茂松教授現(xiàn)任該專業(yè)委員會的主任。
-
人工智能
+關(guān)注
關(guān)注
1791文章
47282瀏覽量
238534 -
清華大學
+關(guān)注
關(guān)注
2文章
69瀏覽量
17855 -
自然語言處理
+關(guān)注
關(guān)注
1文章
618瀏覽量
13561
原文標題:清華成立自然語言處理與社會人文計算研究中心,孫茂松教授擔任主任
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論