妈妈的绣感7,把腿开大点我添添你SB,灭火女警2法版,被多人道具调教玩弄NP

中国网首页

首页  >   向young云  >

专家:加强数字中文建设需从三个维度重塑发展格局

2025-04-01 09:07

来源:中国网

分享到:
链接已复制
字体:

中国网4月1日讯(记者 刘佳)20世纪中文信息处理技术解决了汉字进电脑、上网络的历史性问题,迎来从“铅与火”到“光与电”的革命。时至今日,人工智能技术快速发展,中国如何加强数字中文建设,从而推动中文信息处理技术创新发展?

在教育部3月31日举行的新闻发布会上,中国网记者就此提问北京大学王选计算机研究所所长汤帜。他认为,要聚焦关键垂直领域建设语料基础设施,构建支持大模型训练的高质量中文数据集,同时形成“技术突破—场景落地—生态繁荣”的良性循环。

中国网记者现场提问。中国教育报记者 张劲松/摄

20世纪80年代,王选院士的团队发明激光照排技术,并结合汉字的编码标准,突破了中文数字化的空间限制,让承载中华文化的中文在全球互联网空间获得新生。当前,大语言模型技术对大规模高质量语料提出前所未有的需求,赋予了数据中文化新的历史内涵和使命任务。中文信息处理技术的发展从以往解决汉字输入输出的基础性问题,进阶到当先释放语言文字数据要素价值的全方位突破。

汤帜认为,加强数字中文建设需从三个维度重塑发展格局,推动中文信息处理技术发展进入新阶段:即从重要资源转化到数据要素价值;从广泛存在聚焦到关键领域应用;从基础支撑提高到赋能全局发展。

汤帜表示,新形势下,语言文字将实现从“静态符号”向“动态数字资产”,从“信息载体”向“生产要素”的转型,要重点推动语料库、数据标注与评价等标准的研制,支持文本生成与理解、语言翻译、情感分析等各种任务。

语言文字“日学而不察、日用而不觉”,广泛存在于社会生产各个方面。新形势下,语言文字将实现从符号存储到智能建模的质变,要聚焦关键垂直领域建设语料基础设施,构建支持大模型训练的高质量中文数据集。

当前,人工智能技术发展迅速,语言文字信息处理技术创新应用正经历从“GB2312字符集”到“万亿参数大语言模型”的范式变革。汤帜强调,新形势下,语言文字将实现与信息技术的深度融合,要形成“技术突破—场景落地—生态繁荣”的良性循环,打造数字化引领品牌,有力服务教育发展、助力科技创新、赋能文化传承、推动产业升级、促进社会进步。

编审:张艳玲 王月博

全飞秒手术2024价目表| 女生频道| 放荡的女兵伦理2| 人妻无码| 第9节 妈妈女儿齐上阵| 免费看网站在线观看人数在哪直播| 《丽贝卡的秘密》| 日大B舒服还是小B舒服呢| 玩物(N)笔趣阁二狗| 国产 欧美一区二区三区| 白丝脚上的浓浓的精华液能用吗| 战马在线观看| 马配人能配进去吗| 公交车上被蹭水后多久自然恢复| 欧美精品99久久久啪啪| 粗大的蘑菇头刮得又红又肿怎么办 | 女教师2免费观看全集电视剧 | 女性私密紧致情趣玩具| 河莉秀电影| 性做爰全过程免费看| 久久久久精品| 《菊内留香》双男主| 跳舞| 涂了春药的奶头被众人抡H漫画| 美柚| 二叶草M码与欧洲码的区别| 女生干多了腿中间会变宽吗| 公翁晚上吃我奶头子| 看片| 《伦敦空姐美版2023》| 法国《监狱伦理3》| 《初次深交流》韩剧| 免费观看已满十八岁电视剧姐弟| 久久久久久久久AH毛H| 女朋友的妹妹ID| 用毛笔刷尿孔不准尿出来怎么办| 廉江市第二中学| 美女和帅哥一起努力生产豆浆| 《头等舱:特殊待遇》免费观看| 5人轮换免费观看电视剧最新| 第-次和公翁做爰又大又粗