hello大家好,我是大學(xué)網(wǎng)網(wǎng)小航來為大家解答以上問題,計算機語言學(xué)就業(yè)前景,計算語言學(xué)前景廣闊很多人還不知道,現(xiàn)在讓我們一起來看看吧!
(資料圖)
計算語言學(xué)是用計算機研究和處理自然語言的一門新興交叉學(xué)科。在近年推進新文科建設(shè)的背景下,計算語言學(xué)及其相關(guān)應(yīng)用日益引起關(guān)注。計算語言學(xué)領(lǐng)域相關(guān)學(xué)者在接受本報記者采訪時表示,計算語言學(xué)方興未艾,應(yīng)用廣泛,前景廣闊。
橫跨文理工三大學(xué)科領(lǐng)域
計算語言學(xué)是橫跨語言學(xué)、數(shù)學(xué)和計算機科學(xué)的交叉學(xué)科。它同時涉及文科、理科和工科三大領(lǐng)域,具有跨學(xué)科的性質(zhì)。學(xué)者在從事計算語言學(xué)研究時不僅要具備語言學(xué)知識,還要具備數(shù)學(xué)和計算機科學(xué)方面的知識。教育部語言文字應(yīng)用研究所研究員馮志偉告訴記者,面對信息網(wǎng)絡(luò)時代的新要求,不少語言學(xué)家都在努力學(xué)習(xí)計算機自然語言處理技術(shù),不斷更新知識再學(xué)習(xí),成為兼通語言學(xué)、數(shù)學(xué)和計算機科學(xué)的新一代語言學(xué)家。
北京大學(xué)是計算語言學(xué)研究的重鎮(zhèn)。談到當前計算語言學(xué)前沿時,北京大學(xué)計算語言學(xué)研究所所長王厚峰向記者表示,近20多年來,統(tǒng)計與機器學(xué)習(xí)方法在自然語言處理中占據(jù)主導(dǎo)地位。無論是統(tǒng)計方法,還是機器學(xué)習(xí)方法,其基礎(chǔ)都是數(shù)據(jù)。因此也可以說,20多年來,自然語言處理主要是由數(shù)據(jù)驅(qū)動的。近幾年深度學(xué)習(xí)的發(fā)展進一步強化了數(shù)據(jù)的作用,特別是對無標注語言數(shù)據(jù)的使用。在深度學(xué)習(xí)的大框架下,出現(xiàn)了一些有代表性的技術(shù),如預(yù)訓(xùn)練語言模型的出現(xiàn)。
計算語言學(xué)已經(jīng)開始廣泛應(yīng)用。馮志偉以機器翻譯為例介紹說,當前國際上計算語言學(xué)研究在機器翻譯方面取得了很大成就,機器翻譯經(jīng)歷了基于規(guī)則的機器翻譯、統(tǒng)計機器翻譯、神經(jīng)機器翻譯等階段,目前正在實用化和商品化,機器翻譯已經(jīng)從學(xué)者的夢想變成了現(xiàn)實。
發(fā)揮優(yōu)勢促進學(xué)科融合
隨著近年來人工智能、數(shù)字人文、大數(shù)據(jù)等領(lǐng)域的快速發(fā)展,以及新文科建設(shè)的需要,各地學(xué)術(shù)機構(gòu)結(jié)合各自學(xué)科優(yōu)勢,推進研究工作,紛紛構(gòu)建了計算語言學(xué)和自然語言處理相關(guān)領(lǐng)域的學(xué)術(shù)新機構(gòu)新平臺。如2019年6月成立的北京語言大學(xué)語言智能研究院,2019年7月清華大學(xué)人工智能研究院創(chuàng)建的自然語言處理與社會人文計算研究中心。
王厚峰介紹了當前他們的新研究。其一是跟蹤與改進,如在預(yù)訓(xùn)練模型方面,盡量融入多模態(tài)的信息,包括結(jié)構(gòu)化知識。其二是模型效率的改進。在當前的深度學(xué)習(xí)框架下,訓(xùn)練復(fù)雜度非常高,如何降低復(fù)雜度是需要研究的問題。其三是加強以中文為核心的語言知識挖掘研究。
在北京語言大學(xué)教授宋柔看來,目前語言學(xué)和語言工程還存在脫節(jié)的現(xiàn)象,要促進語言學(xué)和語言工程的深度融合,加強攜手協(xié)作建立語言知識體系。
清華大學(xué)中文系教授劉石和清華大學(xué)計算機科學(xué)與技術(shù)系教授孫茂松展開學(xué)術(shù)合作,提出了構(gòu)建“中國古典知識庫”的設(shè)想。劉石目前正在承擔(dān)的國家社科基金重大項目“基于大數(shù)據(jù)技術(shù)的中國古代文學(xué)經(jīng)典文本分析與研究”,在古典詩歌分詞及知識圖譜工作中,運用計算語言學(xué)和自然語言處理技術(shù),自動實現(xiàn)針對古典詩歌文本的詞匯抽取、分詞和關(guān)聯(lián)分析,并上線“古典詩歌知識圖譜”。
經(jīng)驗主義方法與理性主義方法結(jié)合
如何進一步推進研究,王厚峰表示,我國學(xué)界在相關(guān)方面基本屬于跟蹤研究,還需要有創(chuàng)新型研究。其中尤其缺乏針對中文的計算研究,中文有很多自身的特點,今后需要結(jié)合中文特點開展相關(guān)研究。
馮志偉認為,目前,在計算語言學(xué)研究中,深度學(xué)習(xí)方法成為了主流方法,幾乎被應(yīng)用于計算語言學(xué)研究的所有領(lǐng)域。這是一種基于語言大數(shù)據(jù)的經(jīng)驗主義方法,語言規(guī)則受到忽視。深度學(xué)習(xí)應(yīng)當與語言學(xué)研究結(jié)合起來,基于語言大數(shù)據(jù)的經(jīng)驗主義方法應(yīng)當與基于語言規(guī)則的理性主義方法結(jié)合起來,相互促進,相得益彰,這樣才能推動計算語言學(xué)的進一步發(fā)展。
來源:中國社會科學(xué)網(wǎng)-中國社會科學(xué)報 作者:曾江
歡迎關(guān)注中國社會科學(xué)網(wǎng)微信公眾號 cssn_cn,獲取更多學(xué)術(shù)資訊。
本文就為大家講解到這里,希望對大家有所幫助。
關(guān)鍵詞: