DeepSeek版“常州文化學霸”這樣煉成
“陸小曼在常州住過哪兒?”“蘇軾結交了哪些常州籍朋友?”“孟河醫(yī)派在明清有多火爆?”2月26日,常州圖書館發(fā)布的AI大語言模型CZLIB 2.0變身“常州文化學霸”,樂此不疲地回答著大家的提問。這是江蘇首個由公共圖書館基于DeepSeek自主研發(fā)的地方文化大語言模型,將為地方文化的研究、傳播與創(chuàng)新注入全新活力,同時也標志著公共圖書館領域的人工智能融合實踐邁入新階段。
相較于通用AI工具,CZLIB 2.0以“垂直深耕文化”為特色?!叭绻麑⑵胀ˋI比作學生,這個模型就是‘常州文化學霸’,以往查資料就像‘大海撈針’,有了模型就變成學霸‘精準投喂’?!背V菔袌D書館館長錢竑這樣比喻。
常州大學漢語言文學專業(yè)大四學生金明對此深有感觸,他在趕論文時需要了解關于明代金壇人高遷的資料,便求助普通版本的DeepSeek,不料蹦出了一堆不相干的內容:“浙江仙居縣高遷古鎮(zhèn)”“高遷在古漢語中意為升遷,如《詩經》中‘遷于喬木’……”這令金明哭笑不得,而在常州圖書館的AI大語言模型中,他直接檢索出明代高遷的生平事跡和著作,連同文獻的出處也一并顯示。
“常州文化學霸”是如何煉成的?錢竑告訴記者:“DeepSeek的反饋主要依賴訓練數據的質量和數量,如果數據不完整,就會導致輸出錯誤的結果?!?024年6月,常州圖書館就啟動了常州地方文化大語言模型的研發(fā)工作。如今有了DeepSeek的助力,加上圖書館內海量地方文獻、古籍善本、歷史檔案等資料支撐,誕生的CZLIB 2.0在結果輸出上自然更為精準。
錢竑介紹,常州圖書館匯集了古籍、民國文獻典藏、地區(qū)史志、常州地方報紙等各類地方文獻,其中很多文獻在市場上流通量少,很少被外網收錄。近年來,常州圖書館圍繞特色館藏,構建了一個龐大且多元的常州地方文化數據庫。目前,該數據庫已收錄中吳遺韻專題片、常州地方報紙、常州家譜、地方志、常州名流、老字號傳人口述史等九大系列。
常州地方文化大語言模型研發(fā)的第一步,便是充分發(fā)揮圖書館的資源優(yōu)勢,讓大模型“猛啃教材”,館員把地方文獻、古籍善本、歷史檔案等海量文獻以及圖書館自建數據庫全“喂”進“知識寶庫”。這些資料既包括常州從春秋時期淹城的建立到近代民族工業(yè)崛起數千年的歷史,又涵蓋常州梳篦、留青竹刻等巧奪天工的傳統(tǒng)技藝,還囊括了燦若星辰的地方名人和數以萬計的地名資料。
在全面收集資料的基礎上,常州圖書館運用當下最前沿的訓練算法,對DeepSeek模型進行優(yōu)化。常州圖書館技術部主任、項目負責人孫寧介紹,本地化部署了DeepSeek大模型,在輸入大量的本地文化數據的基礎上,還邀請地方研究機構、資深學者為其“開小灶”,以保證內容權威性和專業(yè)性。
如何讓沉睡的館藏資源精準對接讀者需求、重新煥發(fā)生機,一度是擺在圖書館人面前的難題。AI技術的發(fā)展為圖書館開展地方文化服務提供了新機遇。在錢竑看來,CZLIB 2.0是人工智能技術與常州地方文化深度融合的實踐,本質上是一座聯通歷史、服務當下、連接未來的數智橋梁。它不僅能吸引更多人參與到地方文化的保護傳承中來,也讓古老的文化在數字時代煥發(fā)出新的生機。
記者 周 嫻
江蘇蘇訊網版權及免責聲明:凡本網注明“來源:XXX(非江蘇蘇訊網)”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。 如因作品內容、版權和其它問題需要同本網聯系的,本網按規(guī)定給予一定的稿費或要求直接刪除,請致電025-86163400 ,聯系郵箱:724922822@qq.com。