-
全國(guó)首個(gè)古籍大語言模型發(fā)布:智能作詩、精確翻譯、自動(dòng)標(biāo)點(diǎn)…
據(jù)南京農(nóng)業(yè)大學(xué)網(wǎng)站消息,12月2日,該校信息管理科學(xué)系王東波教授研究團(tuán)隊(duì)在北京發(fā)布“荀子”古籍大語言模型?!败髯印惫偶笳Z言模型是在國(guó)家社科基金重大項(xiàng)目“中國(guó)古代典籍跨語言知識(shí)庫構(gòu)建及應(yīng)用研究”的支持下,聯(lián)合中華書局古聯(lián)公司推出的專門進(jìn)行古籍處理與研究的智能工具。該模型包含《四庫全書》在內(nèi)的絕大多數(shù)傳世古籍文獻(xiàn),擁有超過20億字的大型語料庫。
“荀子”古籍大語言模型以古籍智能化研究為目的,為古籍智能處理而設(shè)計(jì),在推動(dòng)我國(guó)古籍研究與保護(hù)工作創(chuàng)新發(fā)展、提高中華傳統(tǒng)文化傳承的效率與質(zhì)量、實(shí)現(xiàn)大語言模型與古籍處理的深度融合上提供重要支撐。該模型作為開源公益研究成果已在GitHub、ModelScope等網(wǎng)站發(fā)布,用戶可免費(fèi)下載部署使用。
據(jù)介紹,王東波教授研究團(tuán)隊(duì)在南京農(nóng)業(yè)大學(xué)高算力基礎(chǔ)設(shè)施支持下,持續(xù)10年深耕古籍文獻(xiàn)數(shù)字化研究,同時(shí)依托中華書局提供的應(yīng)用場(chǎng)景,在古籍開源大語言模型上實(shí)現(xiàn)AI人工智能垂直細(xì)分領(lǐng)域的全國(guó)首創(chuàng)。
該開源模型包括兩個(gè)部分:基座模型XunziALLM與對(duì)話模型XunziChat。
其模型亮點(diǎn)包括:智能標(biāo)引,能夠?qū)偶械膬?nèi)容進(jìn)行高質(zhì)量主題標(biāo)引,幫助研究人員快速了解文章主題;
信息抽取,能夠自動(dòng)從古籍中抽取關(guān)鍵信息,如人物、事件、地點(diǎn)等,大大節(jié)省了信息整理時(shí)間;
詩歌生成,能夠根據(jù)給定的主題或關(guān)鍵詞,自動(dòng)生成符合語法規(guī)則和韻律要求的古詩,為詩詞愛好者提供創(chuàng)作靈感;
高質(zhì)量翻譯,對(duì)于難以理解的古籍文獻(xiàn),能夠進(jìn)行精準(zhǔn)的現(xiàn)代文翻譯,幫助研究人員更好地理解原文含義;
閱讀理解,能夠?qū)o出的古文文本進(jìn)行分析解釋,實(shí)現(xiàn)對(duì)古籍文本的自動(dòng)閱讀;
詞法分析,可以完成古籍文本的自動(dòng)分詞和詞性標(biāo)注,有效提升研究效率;
自動(dòng)標(biāo)點(diǎn),可以快速完成古籍文本的斷句和標(biāo)點(diǎn),提升使用者對(duì)古籍文本的閱讀體驗(yàn)。
此外,同時(shí)發(fā)布的基座模型,用戶也可以根據(jù)自己的需求,使用本地的訓(xùn)練語料微調(diào)“荀子”基座模型,使其在古籍下游處理任務(wù)上取得更優(yōu)越的處理性能。
- 責(zé)任編輯: 范維 
-
“雪龍2”號(hào)完成卸貨任務(wù)離開羅斯海新站
2023-12-13 09:03 南極探險(xiǎn) -
國(guó)家科學(xué)技術(shù)獎(jiǎng)提名辦法發(fā)布,嚴(yán)重失信將進(jìn)“黑名單”
2023-12-12 15:15 -
比太陽亮1萬億倍!這一大國(guó)重器取得關(guān)鍵進(jìn)展
2023-12-11 21:46 科技前沿 -
國(guó)內(nèi)首次應(yīng)用!效率提高三倍以上
2023-12-11 09:19 -
文昌發(fā)射場(chǎng)正建設(shè)規(guī)劃新一代載人登月火箭發(fā)射工位
2023-12-10 14:16 航空航天 -
長(zhǎng)征系列運(yùn)載火箭第500次飛行!遙感三十九號(hào)衛(wèi)星成功發(fā)射
2023-12-10 10:39 航空航天 -
長(zhǎng)循環(huán)柔性金屬電池取得重大技術(shù)突破
2023-12-09 17:52 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
抽水蓄能電站用上“國(guó)產(chǎn)大腦”!核心系統(tǒng)不再受制于人
2023-12-09 14:23 科技前沿 -
朱雀二號(hào)遙三運(yùn)載火箭發(fā)射成功
2023-12-09 08:23 航空航天 -
打破壟斷,關(guān)鍵材料自主可控!能源領(lǐng)域已成功應(yīng)用
2023-12-08 16:15 能源戰(zhàn)略 -
“業(yè)界最先進(jìn)”?AMD與英偉達(dá)正面交鋒
2023-12-07 15:03 人工智能 -
科技部:將研究形成時(shí)速600公里高速磁浮試驗(yàn)線方案
2023-12-07 11:51 科技前沿 -
“雪龍2”號(hào)和“天惠”輪抵達(dá)羅斯海新站,將開展卸貨作業(yè)
2023-12-07 11:51 南極探險(xiǎn) -
最有希望超越GPT-4的模型來了
2023-12-07 11:03 -
又一國(guó)之重器!世界最深、最大的極深地下實(shí)驗(yàn)室投入科學(xué)運(yùn)行
2023-12-07 07:17 科技前沿 -
“正與美國(guó)政府合作,確保中國(guó)特供芯片出口”
2023-12-06 17:51 中美關(guān)系 -
我國(guó)首次海上遠(yuǎn)距離機(jī)動(dòng)發(fā)射,捷龍三號(hào)有哪些新突破?
2023-12-06 15:12 -
新一代國(guó)產(chǎn)超算系統(tǒng)“天河星逸”發(fā)布
2023-12-06 13:19 科技前沿 -
全球首座第四代核電站在山東投產(chǎn)
2023-12-06 10:21 科技前沿 -
AI僅用17天獨(dú)自創(chuàng)建41種新材料,速度和精確性遠(yuǎn)超人類
2023-12-04 09:06 人工智能
相關(guān)推薦 -
被逼急了,格陵蘭島總理:是時(shí)候獨(dú)立了 評(píng)論 71美媒直呼:啥都能威脅國(guó)家安全,美國(guó)完全走偏了 評(píng)論 100司機(jī)留信曝光:同胞們醒醒吧,美國(guó)快病死了! 評(píng)論 263“沒想到拜登竟會(huì)如此對(duì)待盟友!” 評(píng)論 214事關(guān)中國(guó)FK-3,塞爾維亞:這是一個(gè)“里程碑” 評(píng)論 169最新聞 Hot
-
被逼急了,格陵蘭島總理:是時(shí)候獨(dú)立了
-
美媒直呼:啥都能威脅國(guó)家安全,美國(guó)完全走偏了
-
“到2030年,中國(guó)本土數(shù)學(xué)家將能引領(lǐng)世界”
-
密謀推翻馬爾代夫總統(tǒng)?印度回應(yīng)
-
域外調(diào)查惹惱國(guó)際奧委會(huì),“2034鹽湖城冬奧會(huì)有點(diǎn)懸”
-
欲爭(zhēng)奪歐洲最大電動(dòng)車市場(chǎng),但英國(guó)國(guó)內(nèi)阻力不小
-
土耳其喊話歐盟:他不干,我干
-
“沒想到拜登竟會(huì)如此對(duì)待盟友!”
-
司機(jī)留信曝光:同胞們醒醒吧,美國(guó)快病死了!
-
特朗普炮轟:英國(guó)犯下了大錯(cuò)!
-
盧卡申科:計(jì)劃訪華,事關(guān)未來
-
特朗普“封口費(fèi)”案將于1月10日宣判,“但不會(huì)入獄”
-
“美國(guó)沒能改變中國(guó)”,布林肯一聽急了…
-
事關(guān)中國(guó)FK-3,塞爾維亞:這是一個(gè)“里程碑”
-
“中國(guó)真出手怎么辦?企業(yè)緊張研判…”
-
以己度人?“中方為了談判籌碼”
-