-
全國(guó)首個(gè)古籍大語(yǔ)言模型發(fā)布:智能作詩(shī)、精確翻譯、自動(dòng)標(biāo)點(diǎn)…
據(jù)南京農(nóng)業(yè)大學(xué)網(wǎng)站消息,12月2日,該校信息管理科學(xué)系王東波教授研究團(tuán)隊(duì)在北京發(fā)布“荀子”古籍大語(yǔ)言模型?!败髯印惫偶笳Z(yǔ)言模型是在國(guó)家社科基金重大項(xiàng)目“中國(guó)古代典籍跨語(yǔ)言知識(shí)庫(kù)構(gòu)建及應(yīng)用研究”的支持下,聯(lián)合中華書局古聯(lián)公司推出的專門進(jìn)行古籍處理與研究的智能工具。該模型包含《四庫(kù)全書》在內(nèi)的絕大多數(shù)傳世古籍文獻(xiàn),擁有超過20億字的大型語(yǔ)料庫(kù)。
“荀子”古籍大語(yǔ)言模型以古籍智能化研究為目的,為古籍智能處理而設(shè)計(jì),在推動(dòng)我國(guó)古籍研究與保護(hù)工作創(chuàng)新發(fā)展、提高中華傳統(tǒng)文化傳承的效率與質(zhì)量、實(shí)現(xiàn)大語(yǔ)言模型與古籍處理的深度融合上提供重要支撐。該模型作為開源公益研究成果已在GitHub、ModelScope等網(wǎng)站發(fā)布,用戶可免費(fèi)下載部署使用。
據(jù)介紹,王東波教授研究團(tuán)隊(duì)在南京農(nóng)業(yè)大學(xué)高算力基礎(chǔ)設(shè)施支持下,持續(xù)10年深耕古籍文獻(xiàn)數(shù)字化研究,同時(shí)依托中華書局提供的應(yīng)用場(chǎng)景,在古籍開源大語(yǔ)言模型上實(shí)現(xiàn)AI人工智能垂直細(xì)分領(lǐng)域的全國(guó)首創(chuàng)。
該開源模型包括兩個(gè)部分:基座模型XunziALLM與對(duì)話模型XunziChat。
其模型亮點(diǎn)包括:智能標(biāo)引,能夠?qū)偶械膬?nèi)容進(jìn)行高質(zhì)量主題標(biāo)引,幫助研究人員快速了解文章主題;
信息抽取,能夠自動(dòng)從古籍中抽取關(guān)鍵信息,如人物、事件、地點(diǎn)等,大大節(jié)省了信息整理時(shí)間;
詩(shī)歌生成,能夠根據(jù)給定的主題或關(guān)鍵詞,自動(dòng)生成符合語(yǔ)法規(guī)則和韻律要求的古詩(shī),為詩(shī)詞愛好者提供創(chuàng)作靈感;
高質(zhì)量翻譯,對(duì)于難以理解的古籍文獻(xiàn),能夠進(jìn)行精準(zhǔn)的現(xiàn)代文翻譯,幫助研究人員更好地理解原文含義;
閱讀理解,能夠?qū)o出的古文文本進(jìn)行分析解釋,實(shí)現(xiàn)對(duì)古籍文本的自動(dòng)閱讀;
詞法分析,可以完成古籍文本的自動(dòng)分詞和詞性標(biāo)注,有效提升研究效率;
自動(dòng)標(biāo)點(diǎn),可以快速完成古籍文本的斷句和標(biāo)點(diǎn),提升使用者對(duì)古籍文本的閱讀體驗(yàn)。
此外,同時(shí)發(fā)布的基座模型,用戶也可以根據(jù)自己的需求,使用本地的訓(xùn)練語(yǔ)料微調(diào)“荀子”基座模型,使其在古籍下游處理任務(wù)上取得更優(yōu)越的處理性能。
- 責(zé)任編輯: 范維 
-
“雪龍2”號(hào)完成卸貨任務(wù)離開羅斯海新站
2023-12-13 09:03 南極探險(xiǎn) -
國(guó)家科學(xué)技術(shù)獎(jiǎng)提名辦法發(fā)布,嚴(yán)重失信將進(jìn)“黑名單”
2023-12-12 15:15 -
比太陽(yáng)亮1萬(wàn)億倍!這一大國(guó)重器取得關(guān)鍵進(jìn)展
2023-12-11 21:46 科技前沿 -
國(guó)內(nèi)首次應(yīng)用!效率提高三倍以上
2023-12-11 09:19 -
文昌發(fā)射場(chǎng)正建設(shè)規(guī)劃新一代載人登月火箭發(fā)射工位
2023-12-10 14:16 航空航天 -
長(zhǎng)征系列運(yùn)載火箭第500次飛行!遙感三十九號(hào)衛(wèi)星成功發(fā)射
2023-12-10 10:39 航空航天 -
長(zhǎng)循環(huán)柔性金屬電池取得重大技術(shù)突破
2023-12-09 17:52 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
抽水蓄能電站用上“國(guó)產(chǎn)大腦”!核心系統(tǒng)不再受制于人
2023-12-09 14:23 科技前沿 -
朱雀二號(hào)遙三運(yùn)載火箭發(fā)射成功
2023-12-09 08:23 航空航天 -
打破壟斷,關(guān)鍵材料自主可控!能源領(lǐng)域已成功應(yīng)用
2023-12-08 16:15 能源戰(zhàn)略 -
“業(yè)界最先進(jìn)”?AMD與英偉達(dá)正面交鋒
2023-12-07 15:03 人工智能 -
科技部:將研究形成時(shí)速600公里高速磁浮試驗(yàn)線方案
2023-12-07 11:51 科技前沿 -
“雪龍2”號(hào)和“天惠”輪抵達(dá)羅斯海新站,將開展卸貨作業(yè)
2023-12-07 11:51 南極探險(xiǎn) -
最有希望超越GPT-4的模型來(lái)了
2023-12-07 11:03 -
又一國(guó)之重器!世界最深、最大的極深地下實(shí)驗(yàn)室投入科學(xué)運(yùn)行
2023-12-07 07:17 科技前沿 -
“正與美國(guó)政府合作,確保中國(guó)特供芯片出口”
2023-12-06 17:51 中美關(guān)系 -
我國(guó)首次海上遠(yuǎn)距離機(jī)動(dòng)發(fā)射,捷龍三號(hào)有哪些新突破?
2023-12-06 15:12 -
新一代國(guó)產(chǎn)超算系統(tǒng)“天河星逸”發(fā)布
2023-12-06 13:19 科技前沿 -
全球首座第四代核電站在山東投產(chǎn)
2023-12-06 10:21 科技前沿 -
AI僅用17天獨(dú)自創(chuàng)建41種新材料,速度和精確性遠(yuǎn)超人類
2023-12-04 09:06 人工智能
相關(guān)推薦 -
“特朗普不代表所有美國(guó)人,請(qǐng)別報(bào)復(fù)我們州” 評(píng)論 72中柬云壤港聯(lián)合保障和訓(xùn)練中心正式掛牌運(yùn)行 評(píng)論 143美股蒸發(fā)超5萬(wàn)億美元,“95年來(lái)最大政策失誤” 評(píng)論 347美國(guó)人瘋狂囤貨,“中國(guó)電視被買空” 評(píng)論 223最新聞 Hot
-
“特朗普不代表所有美國(guó)人,請(qǐng)別報(bào)復(fù)我們州”
-
中柬掛牌,洪瑪奈感謝中國(guó)
-
特朗普轉(zhuǎn)發(fā)“巴菲特支持特朗普經(jīng)濟(jì)政策”,巴菲特回應(yīng)了
-
演都不演了,特朗普顧問直說:阿根廷得結(jié)束這份中國(guó)協(xié)議,不然…
-
中柬云壤港聯(lián)合保障和訓(xùn)練中心正式掛牌運(yùn)行
-
這一重大科研裝置,成功部署!
-
美媒關(guān)注:辛辣回?fù)籼乩势贞P(guān)稅,中國(guó)媒體用上AI歌曲和短片
-
特朗普再要求降息,鮑威爾:關(guān)稅遠(yuǎn)超預(yù)期,再等等
-
美股蒸發(fā)超5萬(wàn)億美元,“95年來(lái)最大政策失誤”
-
萬(wàn)斯:歐洲最大威脅不是中俄
-
魯比奧辯解:美國(guó)需要回到制造業(yè)時(shí)代
-
在美烏克蘭人限期7日離境?美官方:發(fā)錯(cuò)了
-
美股“血流成河”,特朗普選擇…去打高爾夫球
-
魯比奧告訴北約:特朗普快對(duì)普京沒耐心了
-
美國(guó)人瘋狂囤貨,“中國(guó)電視被買空”
-
美股三大股指收盤暴跌,納指進(jìn)入熊市
-