内部标识符指数据元在某特定数据集中的唯一标识代码。采用长度12位的字母数字混合码,含小数点2位。结构见图(1)。
□□□□□ . □□ . □□□
│ │
│ │
│ │
│ └─────数据元顺序号
│
│
│
│
└────────────数据集分类编码
图1 内部标识符结构
图(1)中:
-- 数据集分类编码(DCC):用8位字母数字混合码表示,编码规则见7.2。
-- 数据元顺序号:用3位数字表示,代表数据元在某特定数据集中的序号,从001开始顺序编码。数据元顺序号与数据集分类编码之间加“.”区分。
5.2.2 数据元标识符编码规则
健康档案基本数据集的数据元标识符(DE)采用字母数字混合码,数据元标识符结构为:
数据标识符(DI) _版本标识符(VI)
其中:
a)数据标识符(DI):按照分类法和流水号相结合方式,采用字母数字混合码。按业务领域代码、大类代码、小类代码、顺序号、附加码从左向右顺序排列。结构见图(2)。
□□ □□ □□ .□□□ . □□
│ │ │ │ │
│ │ │ │ │
│ │ │ │ └────── 附加码
│ │ │ │
│ │ │ │
│ │ │ └───────顺序号
│ │ │
│ │ └──────────小类代码
│ │
│ │
│ └─────────大类代码
│
│
└───────────业务领域代码
图2 数据标识符(DI)结构
图(2)中:
-- 业务领域代码:用2位大写英文字母表示。健康档案领域代码统一定为“HR”。
-- 大类代码:用2位数字表示,数字大小无含义。
-- 小类代码:用2位数字表示,数字大小无含义;无小类时则小类代码为00。
-- 顺序号:用3位数字表示,代表某一小类下的数据元序号,数字大小无含义;从001开始顺序编码。顺序号与小类代码之间加“.”区分。
-- 附加码:用2位数字表示,代表一组数据元的连用关系编码;从01开始顺序编码,附加码与顺序号之间加“.”区分。无连用关系的数据元其附加码省略。
b)版本标识符(VI):结构由4部分组成,为“V”+“m..m”+“.”+“n..n”。其中,“m..m”和“n..n”为阿拉伯数字构成,在数学上应是具有意义的正整数。“m..m”表示主版本号,“n..n”表示次版本号。如果数据元更新前后可以进行有效的数据交换,则更新后主版本号不变,次版本号等于当前次版本号加1;如果数据元更新前后无法进行有效的数据交换,则更新后主版本号等于当前主版本号加1,次版本号归0。
5.2.3 数据元名称
数据元名称是精炼表达数据元概念的中文词组或短语,其命名应使用一定的逻辑结构和通用的术语。
完整的数据元名称=对象类术语+特性类术语+表示类术语+(限定类术语)
其中:
-- 对象类术语表示数据元所属的事物或概念。一个数据元需要有一个且仅有一个对象类术语。在健康档案基本数据集中若对象类术语为“本人”,则可酌情省略。
-- 特性类术语是表示数据元的对象类显著的、有区别的特征。一个数据元需要有一个且仅有一个特性类术语。特性类术语是任何一个数据元名称所必需的成分,在数据元概念可以完整、准确、无歧义表达的情况下,其他术语可以酌情简略。
-- 表示类术语描述数据元有效值集合的格式。一个数据元需要有一个且仅有一个表示类术语。当表示类术语与特性类术语有重复或部分重复时,可从名称中将冗余词删除。通用表示类术语见表(2)。
-- 限定类术语用于当需要描述一个数据元使其在特定的相关环境中唯一的时候,由专业领域决定产生。限定类术语是可选的。
表2 通用表示类术语
表示词
| 含 义
|
名称
| 表示一个对象称谓的一个词或短语
|
代码
| 替代某一特定信息的一个有内在规则的字符串(字母、数字、符号)
|
说明
| 表示描述对象信息的一段文字
|
金额
| 以货币为表示单位的数量,通常与货币类型有关
|
数量
| 非货币单位数量,通常与计量单位有关
|
日期
| 以公元纪年方式表达的年、月、日的组合
|
时间
| 以24小时制计时方式表达的一天中的小时、分、秒的组合
|
日期时间
| 完整时间表达格式,即DT15,YYYYMMDDThhmmss的格式。
|
百分比
| 具有相同计量单位的两个值之间的百分数形式的比率
|
比率
| 一个计量的量或金额与另一个计量的量或金额的比
|
标志
| 又称指示符,两个且只有两个表明条件的值,如:是/否、有/无等
|
时长
| 两个时点间的时间长度
|
5.2.4 数据元的表示类属性
5.2.4.1 数据元值的数据类型
“数据元值的数据类型”的描述规则见表(3)。
表3 数据元值的数据类型描述规则
数据元值的
数据类型
| 表示符
| 描 述
|
字符型(string)
| S
| 通过字符形式表达的值的类型。可包含字母字符(a-z,A-Z)、数字字符等。(默认GB 2312 信息交换用汉字编码字符集 基本集)
|
布尔型(boolean)
| L
| 又称逻辑型,采用0 (False) 或1 (True) 形式表示的逻辑值的类型
|
数值型(number)
| N
| 通过“0”到“9”数字形式表示的值的类型
|
日期型(date)
| D
| 采用GB/T 7408-2005数据元和交换格式 信息交换 日期和时间表示法中规定的YYYYMMDD格式表示的值的类型
|
日期时间型(datetime)
| DT
| 采用GB/T 7408-2005 数据元和交换格式 信息交换 日期和时间表示法中规定的YYYYMMDDThhmmss格式表示的值的类型。(字符T作为时间的标志符,说明日的时间表示的开始。)
|
时间型(time)
| T
| 采用GB/T 7408-2005 数据元和交换格式 信息交换 日期和时间表示法中规定的hhmmss格式表示的值的类型
|
二进制(binary)
| BY
| 上述无法表示的其他数据类型,如图象、音频、视频等二进制流文件格式
|
5.2.4.2 表示格式
“数据元值的表示格式”中,字符含义描述规则见表(4),字符长度描述规则见表(5)。
表4 数据元值的表示格式中字符含义描述规则
字符
| 含义
|
A
| 字母字符
|
N
| 数字字符
|
AN
| 字母或(和)数字字符
|
D8
| 采用YYYYMMDD的格式表示,其中,“YYYY”表示年份,“MM”表示月份,“DD”表示日期
|
T6
| 采用hhmmss的格式表示,其中“hh”表示小时,“mm”表示分钟,“ss”表示秒
|
DT15
| 采用YYYYMMDDThhmmss的格式表示,字符T作为时间的标志符,说明日的时间表示的开始;其余字符表示与上同
|
表5 数据元值的表示格式中字符长度描述规则
类别
| 表示方法
|
固定长度
| 在数据类型表示符后直接给出字符长度的数目。
|
可变长度
| 1) 可变长度不超过定义的最大字符数
在数据类型表示符后加 “..”后给出数据元最大字符数目。
2) 可变长度在定义的最小和最大字符数之间
在数据类型表示符后给出最小字符长度数后加 “..”后,再给出最大字符数。
|
有若干字符行
表示的长度
| 按固定长度或可变长度的规定给出每行的字符长度数后加“X” 后,再给出最大行数。
|
有小数位
| 按固定长度或可变长度的规定给出字符长度数后,在“,”后给出小数位数。字符长度数包含整数位数、小数点位数和小数位数。
|