国产精品视频免费观看www_国产一区二区在线观看免费_精品视频在线免费看_国产欧美在线观看免费

中國網(wǎng)首頁

首頁  >   向young云  >

專家:加強數(shù)字中文建設需從三個維度重塑發(fā)展格局

2025-04-01 09:07

來源:中國網(wǎng)

分享到:
鏈接已復制
字體:

中國網(wǎng)4月1日訊(記者 劉佳)20世紀中文信息處理技術(shù)解決了漢字進電腦、上網(wǎng)絡的歷史性問題,迎來從“鉛與火”到“光與電”的革命。時至今日,人工智能技術(shù)快速發(fā)展,中國如何加強數(shù)字中文建設,從而推動中文信息處理技術(shù)創(chuàng)新發(fā)展?

在教育部3月31日舉行的新聞發(fā)布會上,中國網(wǎng)記者就此提問北京大學王選計算機研究所所長湯幟。他認為,要聚焦關鍵垂直領域建設語料基礎設施,構(gòu)建支持大模型訓練的高質(zhì)量中文數(shù)據(jù)集,同時形成“技術(shù)突破—場景落地—生態(tài)繁榮”的良性循環(huán)。

中國網(wǎng)記者現(xiàn)場提問。中國教育報記者 張勁松/攝

20世紀80年代,王選院士的團隊發(fā)明激光照排技術(shù),并結(jié)合漢字的編碼標準,突破了中文數(shù)字化的空間限制,讓承載中華文化的中文在全球互聯(lián)網(wǎng)空間獲得新生。當前,大語言模型技術(shù)對大規(guī)模高質(zhì)量語料提出前所未有的需求,賦予了數(shù)據(jù)中文化新的歷史內(nèi)涵和使命任務。中文信息處理技術(shù)的發(fā)展從以往解決漢字輸入輸出的基礎性問題,進階到當先釋放語言文字數(shù)據(jù)要素價值的全方位突破。

湯幟認為,加強數(shù)字中文建設需從三個維度重塑發(fā)展格局,推動中文信息處理技術(shù)發(fā)展進入新階段:即從重要資源轉(zhuǎn)化到數(shù)據(jù)要素價值;從廣泛存在聚焦到關鍵領域應用;從基礎支撐提高到賦能全局發(fā)展。

湯幟表示,新形勢下,語言文字將實現(xiàn)從“靜態(tài)符號”向“動態(tài)數(shù)字資產(chǎn)”,從“信息載體”向“生產(chǎn)要素”的轉(zhuǎn)型,要重點推動語料庫、數(shù)據(jù)標注與評價等標準的研制,支持文本生成與理解、語言翻譯、情感分析等各種任務。

語言文字“日學而不察、日用而不覺”,廣泛存在于社會生產(chǎn)各個方面。新形勢下,語言文字將實現(xiàn)從符號存儲到智能建模的質(zhì)變,要聚焦關鍵垂直領域建設語料基礎設施,構(gòu)建支持大模型訓練的高質(zhì)量中文數(shù)據(jù)集。

當前,人工智能技術(shù)發(fā)展迅速,語言文字信息處理技術(shù)創(chuàng)新應用正經(jīng)歷從“GB2312字符集”到“萬億參數(shù)大語言模型”的范式變革。湯幟強調(diào),新形勢下,語言文字將實現(xiàn)與信息技術(shù)的深度融合,要形成“技術(shù)突破—場景落地—生態(tài)繁榮”的良性循環(huán),打造數(shù)字化引領品牌,有力服務教育發(fā)展、助力科技創(chuàng)新、賦能文化傳承、推動產(chǎn)業(yè)升級、促進社會進步。

編審:張艷玲 王月博

主站蜘蛛池模板: 遂昌县| 五家渠市| 大方县| 交城县| 六安市| 石门县| 麻江县| 开鲁县| 格尔木市| 吉安县| 城固县| 渭南市| 红原县| 安溪县| 彝良县| 武宣县| 伊川县| 康马县| 科尔| 双牌县| 濮阳市| 岑巩县| 唐海县| 永嘉县| 于田县| 曲周县| 乌拉特中旗| 普兰县| 万盛区| 沛县| 九龙城区| 界首市| 普兰店市| 海伦市| 临西县| 开平市| 穆棱市| 弋阳县| 温宿县| 蓬溪县| 东乡县|