《技术标准数字化文档解析规范.docx》由会员分享,可在线阅读,更多相关《技术标准数字化文档解析规范.docx(13页珍藏版)》请在第一文库网上搜索。
1、电网设备技术标准文档解析规范1技术标准数字化解析1.1技术标准解析交付结构定义每个技术标准对应一个文件夹,以标准中文名称命名,包含1个根文件和2个子文件夹,若标准中文名称中含有不能用于保存的特殊字符,命名时将特殊符号去除即可。其中根文件为解析后的json格式文件,命名格式为“标准编号+(单空格)+标准中文名称.json”o若标准名称中含有不能用于保存的特殊字符(例如I),命名时将特殊符号去除即可。示例如下:技术标准名称:Q/GDW1103-2015750kV系统用油浸式变压器技术规范.pdf”解析后命名为:“QGDW1103-2015750kV系统用油浸式变压器技术规范.json”。2个子文件
2、夹为figure和formula。其中,figure文件夹放置技术标准中各图及复杂表格的图片;formula文件夹放置公式图片。所有技术标准文件夹整体打包成“技术标准.tar”。具体结构参见如下示例:标准中文名称/Ifigure/Fig_xxx.pngTable_xxx.pngIformula/Eqxxx.png标准编号+标准中文名称.json1.2 技术标准元数据定义具体标准应当包含标准编号、标准名称、标准英文名称等元数据,具体元数据信息如表2-1:表27技术标准元数据定义表序号英文名中文名是否必须备注1st_code标准编号是2st_name标准名称是3stnameeng标准英文名称是4s
3、t_type标准类型是国际标、国标、行标、企标、团标5stkind标准分类否主标准、从标准、支撑标准6streplace代替标准否7st_relation采用关系否采用其它标准的情况8stpublorg发布单位是存在多个发布单位的情况9st_publ_datc发布日期是10stimpldate实施日期是1.3 技术标准条款元数据定义将技术标准中的前言、引言、目次、编制说明、章节、附录、参考文献等部分定义为条款,条款应当包含条款号、条款标题、条款级别、条款内容4项元数据。其中条款号为本级标题的标题号,没有标题号可以为空(例如前言、目次等);条款标题为本级标题名称;条款级别为本级标题所在文章中对应
4、的标题级别(按1级、2级、3级顺序排序);条款内容是指本条款下的正文内容,不包含本条款下级条款标题及下级条款标题的正文内容,无正文内容则条款内容为空。一般情况下章节中的内容才是具体的技术条款内容,并且存在多级标题的情况(如3,3.1,3.1.1),每一级标题做为一个条款,每一级条款不包含本标题的下级号题及下级标题的内容。示例如下:条款原文:前言8技术性能要求8.7变压器套管8.7.1额定绝缘水平套管额定绝缘水平条款元数据:条款号条款标题条款级别条款内容前言1前言下的正文8技术性能要求18.7变压器套管28.7.1额定绝缘水平3套管额定绝缘水平1.4 技术标准图与公式解析技术标准的图和公式解析以
5、图片形式保存。图片命名规范:对于技术标准中的图,当图在标准中有名称时,应采用“Fig_”+图编号+“,+图名称+“.png”,存储于figure文件夹下;当图在标准中无名称时,采用“Fig+图编号+“.png”,存储于figure文件夹下。公式对应的文件命名格式为“Eq_”+公式编号+png”,存储于formula文件夹下。图名称(和图中下标注的内容一致,包含图儿)或公式名称中若含有不能用于保存的特殊字符时,将特殊字符去除即可。1.5 技术标准表格解析技术标准中表格的解析用HTML的Table实现。其中table标签定义表格,tr定义表格中的行,td定义一行中的若干单元格。对于合并单元格的情况
6、,应使用td的colspan属性或rowspan属性规定单元格可横跨的列数或行数。表格解析后嵌入到条款正文中,保留原始正文结构(包含合并单元格信息)。对于跨页的表格应合成一个表格。对于格式特别复杂、内容无实际业务知识或内容基本不会被搜索或问答涉及到的表格,直接输出为图片,存储于figure文件夹下,命名格式为:当表格有名称时,采用“Table+表编号+表名称+.png;当表格没有名称时,采用“Table,+表编号+png”。表3铜和铜合金母姣的规格单位为亳米1.6 技术标准特殊字符解析对于技术标准中特殊字符(例如、。、。、6)的解析应按照统一特殊字符列表进行表示,特殊字符列表参见附录A。在解析
7、过程中发现未在附录A中时特殊字符时,及时处理并补充到特殊字符列表中。1.7 技术标准特殊格式解析针对标准条款正文中出现的如:61、IM等上下标格式的内容,应采用html的上标注与下标注sub标签进行表示。针对如下原文:式中防稳就侬:IM输出电流波动极限僮;12一一输出电流筌定值.表示示例为:式中8l-稳流精度;IM一输出电流波动极限值;IZ一输出电流整定值。运行效果如下图:图1标准特殊格式解析效果图运行代码式中61-栈流精度;IM一输出电流波动极限值;I-输出电渣整定值式中6:-稳流晴度;输出电流波动极限值;1Z-输出电流整定值。1.8 技术标准引用规范技术标准中存在内部引用和外部引用两种情况
8、。内部引用是指引用当前技术标准中的图、表、附录或其它章节条款的情况,如“不要求用顶层油的计算路径(开关投向左位)。所有的参数已在8.2.2中给出。”;外部引用是指引用其它标准的情况,如“8.0.7.主回路电阻测量按现行国家标准高压开关设备和控制设备标准的共用技术要求GB/T11022规定的直流压降法,采用适于现场使用的回路电阻测试仪测试。”。内部引用图片的情况,采用标签引用相对路径下的图片,如“;内部引用附录或其它章节的情况,采用标签,使用如href=#标题编号。外部应用其它技术标准的情况,采用标签,使用如href=#标准编号;外部应用其它技术标准的条款情况,采用标签,使用如。1.9 技术标准
9、JS0N格式说明解析后的技术标准采用JSON文件+引用图片文件(解析的公式与图)方式存储,其中JSON文件采用UTF-8编码。具体结构如下:st_code:标准编号,st_name”:标准名称“,st_name_cng”:标准英文名称,st_type:标准类型,st_kind:标准分类,st_replace”:代替标准”,st_relation:采用关系”,“st_publ_org”:发布单位“,“stpubldate:发布日期,st_impl_date:实施口期,“st_clauses:#条款列表(cl_num:1,#条款号cl_name:范围,#条款标题,cl_rank,z:1,#条款级别
10、,/cl_content/:z/GB1094的本部分适用于油浸式变压器。它阐述了变压器在不同环境温度和负载条件下的运行对其寿命的影响。注:对于电炉变压器,制造方应向用户咨询特殊负载曲线。#条款内容,采用HTML格式进行内容表示),clnum:3.1,#条款号cl_name:配电变压器,#条款标题cl_rank:2,#条款级别cl_content:三相最大额定容量为2500kVA,单相最大容量为833kVA的电力变压器。),cl_num:3.12,#条款号cl_name:配电变压器产条款标题cl_rank:2,#条款级别cl_content:经过化学处理的纤维素纸,其分解率得以降低。通过局部消除
11、水分形成的媒质(如在氟乙化物中)或通过使用稳定剂(如在胺化物、双氟胺中)来抑制水分形成以减少老化的影响。如果纸的寿命满足了ANSI/IEEEC57.100准则的要求:在110C的密闭管中放置65000h或在按下式给出的其他时间/温度组合下仍保持50%的张力,则可认为纸已得到改性:由于现在使用的热改性化学药品含氮,而在硫酸盐纸浆中没有氮,因此化学改性的程度是通过对处理过的纸中的氮含量进行测定来确定的。当按ASTMD-982进行测量时,热改性纸的含氮量典型值介于1%和4%之间。注:本定义于2003年10月7日由IEEE变压器委员会热改性纸定义工作组批准。,“cl_nunT:“8.3.1”,#条款号cl_name:户外空气冷却式变压器,#条款标题cl_rank”:3,#条款级别“cl_content:”注:关于环境温度,也可见GB1094.2-1996。),(cl_num:8.3.2,#条款号cl_name:变压器在包围体内的环境温度修正,#条款标题cl_rank:3,#条款级别cl_content:注:当包围体对冷却器没有影响时,不必按式(11)进行修正。表5包围体引起的环境温度增加的修正包围体形式安装的变压器台数加到加权环境温度上的修正值/K/p变压器容量/kVA2505007501000自然通风的地下拱顶室lll12131421213141631417