国际首个简牍字符检测与识别数据集正式发布
简牍是中国古代重要记录媒介,因材料脆弱及埋藏环境影响,字符模糊、缺损、布局复杂,人工识别困难。现有文献数字化技术在甲骨文等领域取得突破,但在简牍字符识别方面缺乏高质量数据集,限制了深度学习应用。近日,西北师范大学联合甘肃简牍博物馆推出国际首个面向深度学习任务的简牍字符检测与识别大规模数据集——DeepJiandu数据集,这标志着简牍智能计算研究取得重要进展,为简牍文献的智能研究与保护提供基础,推动数字人文领域的创新与发展。该工作由西北师范大学简牍研究院、甘肃省简牍智能计算与数字人文工程研究中心张强教授团队具体开展,上海中西书局、甘肃文化出版社提供相关数据资源,西南大学参与数据验证试验工作,本研究相关论文发表于国际期刊《科学数据》。DeepJiandu数据集包含7,416张图像,标注99,852个字符,涵盖2,242个类别。团队结合简牍专家释文成果对图像进行字符标注,数据集充分考虑了简牍字符的残损、异形字、多种布局等复杂场景,具备......阅读全文
国际首个简牍字符检测与识别数据集正式发布
简牍是中国古代重要记录媒介,因材料脆弱及埋藏环境影响,字符模糊、缺损、布局复杂,人工识别困难。现有文献数字化技术在甲骨文等领域取得突破,但在简牍字符识别方面缺乏高质量数据集,限制了深度学习应用。近日,西北师范大学联合甘肃简牍博物馆推出国际首个面向深度学习任务的简牍字符检测与识别大规模数据集——Dee
python的数据类型:字符串(一)
之前讲到,字符串的定义就是把一些字符序列用引号引起来。例如:s = 'abc'上面这行代码的执行过程:先创建一个字符串对象,并初始化里面字符串的值为'a', 'b', 'c'的序列,再把指针s指向这个对象。如下图所示:字符串的序列操作我们知道字符串内部是一个字符序列。作为序列,我们可以用下标来索引。
python的数据类型:字符串(二)
描述:split函数用分隔字符str把字符串拆分成若干个子字符串。num指定拆分多少次,若没有指定次数,则为全部拆分。返回值:拆分后的子字符串列表(下一次我们将要学习列表)。例如:s = 'I am learning python'list1 = s.split(' ') # list1 = [
C++之字符串类学习总结(二)
三、字符串与数字的转换:标准库中提供了相关的类对字符串和数字进行转换字符串流类(sstream)用于string的转换相关头文件istringstream字符串输入流ostringstream字符串输出流1、方法使用string---数字数字---string代码示例:输出结果:2、字符串循环右移比
C++之字符串类学习总结(一)
一、回顾c语言对字符串的实现:一般我们在c语言要实现对字符串操作的话,一般是采用字符数组或者一组函数来实现的,为啥这样做呢,那是因为c语言里面根本就没有字符串类型的关键字;而且c语言也支持自定义类型,所以更加无法获得字符串类型。为了解决这个问题,在c++中,引入了自定义类型,而且可以通过类来完成对字
西北师大简牍学术资源数据共享平台上线
近日,西北师范大学举行简牍学术资源数据共享平台上线发布会。相关与会领导和特邀嘉宾共同为“西北师范大学简牍学术资源数据共享平台”揭牌上线。据了解,简牍学学术资源数据共享平台的上线,将大数据、人工智能等前沿信息科技与传统文化有机结合,极大地提高了简牍研究的效率和精确度,将有效助力简牍学一流学科发展。会后
一站式观展!甲骨、简牍、敦煌遗书、明清档案集结亮相
甲骨文上的“兔”字什么样?乾隆帝在元旦(正月初一)开笔时都写下过什么样的新年愿望?康熙帝遗诏里写明了“传位十四子”还是“传位于四子”吗?在即将到来的兔年春节里,公众可以去国家典籍博物馆一饱眼福,观赏与此相关的珍贵古文献。 1月14日,“二十世纪初中国古文献四大发现展”将在国家典籍博物馆开始
湖南临武渡头古城遗址出土近万枚吴简
原文地址:http://news.sciencenet.cn/htmlnews/2023/12/514648.shtm12月21日,国家文物局召开第四季度例行新闻发布会,通报了陕西省宝鸡市下站遗址、陕西省西咸新区北城村墓地、湖北省荆州市秦家咀墓地、湖南省郴州市渡头古城遗址等四项“考古中国”重大项目重
梅兵代表:完善中文字符集,推动传统文化数字化传播
“数字时代,文字信息传播高度依赖于字符集这一基础支撑平台。”全国人大代表、华东师大党委书记梅兵说,“由于当前中文字符集建设不足,作为传统文化基本载体的历史文献在数字化传播中存在障碍,直接影响了优秀传统文化弘扬。”梅兵认为,字符集中古文字缺位,造成最具历史厚度的中华文化资源的网络盲区。作为中国传统文化
“东西合璧”,2所师范大学签署战略合作协议
原文地址:http://news.sciencenet.cn/htmlnews/2023/9/509542.shtm9月27日,东北师范大学与西北师范大学战略合作协议签约仪式在兰州举行。东北师范大学校长徐海阳,西北师范大学党委书记贾宁、校长王占仁,甘肃省教育厅副厅长白江平出席仪式。徐海阳和王占仁代表
国家图书馆115岁生日快乐!中华优秀传统文化典籍展开展
9月9日,在建馆115周年之际,国家图书馆特别策划的“亘古巨制 煌煌文脉——中华优秀传统文化典籍展”开幕,并于9月10日面向公众开放。本次展览由国家图书馆联合国内8家图书馆、博物馆,粹选传世善本与出土文献,包括甲骨、简牍、石刻、善本等多种类型,同时展示“中华古籍保护计划”“中华传统文化百部经典”等
CID是代表什么东西
CID 是 Customer IDentity 的简称,简单来说就是手机的平台版本. CID紧跟IMEI存储在手机的OTP(One TimeProgrammable)芯片中. CID 后面的数字代表的是索尼爱立信手机软件保护版本号,新的CID不断被使用,以用来防止手机被非索尼爱立信官方的维修程序拿来
著名历史学家蒋福亚逝世,享年87岁
澎湃新闻记者从首都师范大学获悉,著名历史学家、杰出的教育工作者、首都师范大学历史学院退休教授蒋福亚先生,因病于2024年9月30日下午在北京逝世,享年87岁。蒋福亚生于1938年6月2日,江苏武进人,中国共产党党员。1962年研究生毕业于山东大学历史系,师从王仲荦先生。同年开始在北京师范学院历史系工
输入输出函数解析
输入输出input输入函数input函数:获取用户输入,保存成一个字符串。重要的话,说两遍,input函数的返回值是一个字符串类型。哪怕你输入的是个数字1,返回给你的只会是字符串“1”,而不是 整数1 。从上面两个例子中,大家也可以发现了,我输入的值不管是什么,类型都是字符串。type是py
打印机的分类
按原理分 打印机按数据传输方式可分为串行打印机和并行打印机两类。 按照打印机的工作原理,将打印机分为击打式和非击打式两大类。 串式点阵字符非击打式打印机 主要有喷墨式和热敏式打印机两种。①喷墨式打印机。应用最广泛的打印机。其基本原理是带电的喷墨雾点经过电极偏转后,直接在纸上形成所需字形。其
多序列比的概念
把两个以上字符序列对齐,逐列比较其字符的异同,使得每一列的字符尽可能一致,以发现其共同的结构特征的方法称为多序列比对。多序列比对问题是双序列比对问题的推广。
力推“4+1”个学科冲击A类!这一省公布支持名单
日前,有网友在人民网领导留言板咨询甘肃省属高校新一轮“双一流”建设情况,甘肃省教育厅随后给予答复。 答复中透露,为进一步推动省属高校优势学科加快建设国家一流学科,甘肃省决定实施省属高校国家一流学科突破工程,制定《甘肃省属高校国家一流学科突破工程建设方案》,方案正在同省发改委、省财政厅、省科技厅
详解PCB电路板多种不同工艺流程
本文主要介绍:单面电路板、双面板喷锡板、双面板镀镍金、多层板喷锡板、多层板镀镍金、多层板沉镍金板;这几种电路板不同的工艺流程做详细的介绍。 1、单面板工艺流程 下料磨边→钻孔→外层图形→(全板镀金)→蚀刻→检验→丝印阻焊→(热风整平)→丝印字符→外形加工→测试→检验。 2、双面板喷锡板工艺
乳品喷码多功能视觉检测应用案例
食品安全问题一直是一个备受重视的问题,它关系到人们的健康和生命的安全,关系到本国食品在国际市场上的竞争力以及国际形象,关系到食品行业能否健康稳定的发展。乳品作为食品行业的代表性产品,安全问题更应该引起高度重视。近年来,多次看到乳品安全问题相关报道,造成消费者对乳品的信任大打折扣。 如何才能
单片机串行口介绍(一)
串行口是单片机与外界进行信息交换的工具。■ 8051单片机的通信方式有两种:并行通信:数据的各位同时发送或接收。串行通信:数据一位一位次序发送或接收。参看下图:串行通信的方式包括异步通信和同步通信。异步通信它用一个起始位表示字符的开始,用停止位表示字符的结束。其每帧的格式如下:在一帧格式中,
嵌入式硬件通信接口协议UART:快速使用串口及应用3
2. ANSI C标准中有几个标准预定义宏:__LINE__:源代码中的行号(字符串形式)__FILE__:当前*.c源码文件的文件名(字符串形式)__DATE__:编译日期(字符串形式)__TIME__:编译时间(字符串形式)__STDC__:当要求程序严格遵循ANSI C标准时该标识被赋值为
让电子小制作更简单--教你如何看懂电路图(一)
一张电路图通常有几十乃至几百个元器件,它们的连线纵横交叉,形式变化多端,初学者往往不知道该从什么地方开始,怎样才能读懂它。其实电子电路本身有很强的规律性,不管多复杂的电路,经过分析可以发现,它是由少数几个单元电路组成的。好象孩子们玩的积木,虽然只有十 来种或二三十种块块,可是在孩
微型打印机的注意事项
上介绍了几种不同打印机的优缺点,但是可能大家选购的时候仍然会有很多疑问,下面谈谈在打印机选购中需要注意的其他事项。 一、打印字符集:用户需要的字符集可能并不完全一样,有的只需要数字,有的需要英文,有的需要汉字,选购的时候要注意需要的字符集。 二、外形尺寸及重量:如果是放在固定地方的打印机,那
人类里程碑式的进步:脑机交互
如果史蒂芬霍金能活到今天的话,2021年5月12日或许对他来说会是个特别振奋人心的日子。从最早的拼写卡到用一根手指打字,直至病情恶化到只能用脸颊的一块肌肉来控制电脑,一分钟完成2个字。他一定会感到沮丧和无助吧,但无论如何,最顶级的人机交互技术曾专门为他研发,这是他走过的时代。但他又是不幸的,如果
Python基础语法
标识符所谓的标识符就是对变量、常量、函数、类等对象起的名字。首先必须说明的是,Python语言在任何场景都严格区分大小写!也就是说A和a代表的意义完全不同python对于表示标识符的命名有如下规定:第一个字符必须是字符表中的字符或者下划线例如,a,abc,_id,等都是可以的。但是例如开头的是PHP
Elasticsearch性能优化指南(十三)
不要使用默认的动态字符串映射默认的动态字符串mappings会将字符串字段索引为文本和关键字。如果您只需要其中之一,则很浪费。通常,id字段仅需要索引为 keyword,而body字段仅需要索引为 text 字段。可以通过在字符串字段上配置显式映射或设置将字符串字段映射为text 或keyword的
CAS号检索注意事项
在搜索框中,可以看到支持CAS号、名称、化学式三种查询方式,当输入什么类型的字符窜为判定输入的是CAS号,并按照字符CAS好方式进行检索!可以参看如下例子。第一、什么也不输入或者只输入空格:将会随机按照CAS号中的头三位数字作为关键词进行检索。第二、输入一个错误的CAS号,如:0000050-0、
各类氨基酸的缩写符合表
各种氨基酸缩写符号氨基酸缩写名称三字符号单字符号丙氨酸AlaA精氨酸ArgR天冬氨酸AspD半胱氨酸CysC谷氨酰胺GlnQ谷氨酸GluE组氨酸HisH异亮氨酸IleI甘氨酸GlyG天冬酰胺AsnN亮氨酸LeuL赖氨酸LysK甲硫氨酸MetM苯丙氨酸PheF脯氨酸ProP丝氨酸SerS苏氨酸ThrT
南京理工大学学生获设计界“奥斯卡”奖
在笔记本电脑的触摸板上,贴上一块数字贴膜,通过自行设定的热键切换,触摸板就能变成数字输入键盘,灵活地进行数字输入和四则运算操作。南京理工大学设计艺术与传媒学院工业设计专业大三男生龚华超用一个名为“触板数字贴膜”的设计,解决了大多数笔记本电脑没有数字小键盘给数字符号输入带来的烦恼。凭借这
AWorks编程:Shell交互界面(二)
2.2 Shell Telnet 工作模式在Shell Telnet工作模式下,Shell 运行于开发板上,开发板需要通过以太网或 Wifi 模块建立的scoket与PC进行通信,此处以以太网举例。使用 Shell Telnet 需要在 aw_prj_params.h 文件中开启以太网设备和shel