4.4.4、生物体:其数字标识符为〈213〉。
在数字标识符〈213〉之后,应当用中文和拉丁文(拉丁文应当放在中文之后并用圆括号括起来,例如,草履虫种(Paramecium sp.))注明该序列来源的生物名称,即科学命名的生物属种;或者是“人工序列”或“未知”。
4.4.5、序列中特征部分的内容:数字标识符〈220〉-〈223〉。
本节涉及到序列中与特征相关的内容的表述。
在核苷酸序列(数字标识符〈 400〉 )中含有“n”或修饰的碱基的情况下(参见本标准4.4.7节(1)的内容),或者在氨基酸序列(数字标识符〈400〉 )中含有“Xaa”或修饰的氨基酸或不常用的L-氨基酸的情况下(
参见本标准4.4.7节(2)的内容),必须包括下面(1)-(4)项的内容。
在生物体(数字标识符〈 213〉 )是“人工序列”或“未知”的情况下,必须包括下面(1)和(4)项的内容。
在一个序列中有多个特征的情况下,应当按照这些特征在序列中出现的先后次序逐一地表述每个特征。
序列中特征部分的具体内容和数字标识符如下:
(1)特征:其数字标识符为〈220〉。
在数字标识符〈220〉之后,应当是空白。
(2)名称/关键词:其数字标识符为〈221〉。
在数字标识符〈221〉之后,是特征名称或关键词。使用关键词表述特征时,只能使用附录1之表5或表6中列出的关键词来表述。
(3)位置:其数字标识符为〈222〉。
在数字标识符〈222〉之后,应当标明特征的位置,标注的方式为:从特征中的第一个碱基或氨基酸的编号到特征的最后一个碱基或氨基酸的编号,编号圆括号括起来,两个编号中间是“...”,例如:(279)...(389);当序列中使用了多个“n”或“Xaa”时,应当标明它们的所有位置,例如:(80,100,112)。参见附录2的序列表样例。
(4)其它信息:其数字标识符为〈223〉。
在数字标识符〈223〉之后,应当表述序列中与特征有关的其它相关信息。在表述修饰的碱基或修饰的氨基酸时,应该用附录1之表2或表4中给出的符号来表述。
4.4.6、出版公开信息:数字标识符〈300〉-〈312〉。
出版公开信息是非强制性的内容,在序列表和序列表电子文件中,可以包含也可以不包含这些内容。
(1)公开出版信息:其数字标识符为〈300〉
在数字标识符〈300〉之后,应当是空白。
(2)作者:其数字标识符为〈301〉
在数字标识符〈301〉之后,是该文献作者的姓名。
(3)题目:其数字标识符为〈302〉
在数字标识符〈302〉之后,是出版物中该文献的题目。
(4)杂志名称:其数字标识符为〈303〉
在数字标识符〈303〉之后,是公开出版物的杂志名称。
(5)公开出版物的卷号:其数字标识符为〈304〉
在数字标识符〈304〉之后,是公开出版物的卷号。
(6)公开出版物的出版号:其数字标识符为〈305〉
在数字标识符〈305〉之后,是公开出版物的出版号。
(7)页码:其数字标识符为〈306〉
在数字标识符〈306〉之后,是该文献的起始-终止页码。
(8)出版日期:其数字标识符为〈307〉
在数字标识符〈307〉之后,是该公开出版物的出版日期,其格式为:YYYY-MM-DD,例如1999-09-20。
(9)公开出版物的数据库登记号:其数字标识符为〈308〉
如果该文献被收入某个数据库的话,那么在数字标识符〈308〉之后,是该文献在该数据库中的登记号。
(10)录入数据库的日期:其数字标识符为〈309〉
如果该文献被收入某个数据库的话,那么在数字标识符〈309〉之后,是该文献录入该数据库的日期,其格式为:YYYY-MM-DD,例如1999-09-20。
(11)专利公开号:其数字标识符为〈310〉
如果该公开出版物是专利文献的话,那么在数字标识符〈310〉之后,是该专利的公开号,其格式为:世界知识产权组织(WIPO)标准3(ST 3)的国家、地区和政府间组织代码+标准6(ST 6)的公开号+标准16(ST 16)的文献类型,例如CN1183117A。
(12)专利申请日:其数字标识符为〈311〉
如果该公开出版物是专利文献的话,那么在数字标识符〈311〉之后,是该专利的申请日,其格式为:YYYY-MM-DD,例如1999-09-20。
(13)专利公开日:其数字标识符为〈312〉
如果该公开出版物是专利文献的话,那么在数字标识符〈312〉之后,是该专利的公开日,其格式为:YYYY-MM-DD,例如199909-20。
4.4.7、核苷酸序列和/或氨基酸序列:其数字标识符为〈400〉。
在数字标识符〈400〉之后,是该序列的序列标识符;从下一行开始是该核苷酸和/或氨基酸序列。
该序列可以是纯核苷酸序列,或者是纯氨基酸序列,或者是核苷酸序列和与它对应的氨基酸序列。
(1)纯核苷酸序列:
核苷酸序列应当只用单链表示,从左到右是5’-末端至3’-末端的方向,序列中不应当出现术语5’和3’。
应当用单字母代码表示核苷酸序列的碱基来表述核苷酸序列的特征;只能使用与附录1之表1中给出的符号相一致的小写字母来表示。
在一个核苷酸序列中,如果经修饰的碱基是附录1之表2中列出的之一,那么在该序列本身中,应当用未修饰的碱基或“n”来表示该经修饰的碱基,符号“n”等同于唯一的一个未知的或经修饰的核苷酸;但在该序列的特征部分(数字标识符〈220〉-〈223〉)应当使用附录1之表2中给出的符号进一步表述该修饰(参见本标准4.4.5节)。附录1之表2中的符号可以用于说明书或序列的特征部分,但不得用于序列本身。
核苷酸序列中碱基的编号开始于序列中的第1个碱基,并从5’到3’方向连续地计数。该计数方法也用于构型为环状的核苷酸序列,在这种情况下,申请人可任意指定序列的第一个核苷酸。
来自大序列的一个或更多非邻接区段或来自不同序列的区段组成的核苷酸序列,应当作为带有单独序列标识符的单独序列来计数。带有一个缺口或多个缺口的序列应当作为带有单独序列标识符的多个单独序列来计数,而单独序列的数目与序列数据的连续序列的数目相同。
核苷酸序列每行最多60个核苷酸碱基,每10个核苷酸碱基后空一格。该行的最后是该行最后一个碱基的编号。
(2)纯氨基酸序列:
对于氨基酸序列,蛋白质或肽序列中的氨基酸应当从左到右以氨基到羧基的方向列出;序列中不应当出现氨基或羧基基团。
氨基酸应当使用与附录1之表3中的符号相一致的、第一个字母大写的三字母符号表示。有空白或内部中止符号(例如“Ter”或“*”或“·”)的氨基酸序列不应当表示为单个氨基酸序列,而应当作为独立的氨基酸序列分别列出。
在一个氨基酸序列中,如果经修饰的氨基酸是附录1之表4中列出的氨基酸之一,那么在该序列本身中,应当用相应的未经修饰的氨基酸或“Xaa”来表示该经修饰的和不常用的氨基酸,符号“Xaa”等同于唯一的一个未知的或经修饰的氨基酸;但在该序列的特征部分(数字标识符〈220〉-〈223〉),应当使用附录1之表4中给出的符号进一步表述该修饰(参见本标准4.4.5节)。附录1之表4中的符号可以用于说明书或序列的特征部分,但不得用于序列本身。
氨基酸的编号开始于序列中的第1个氨基酸,以数字1表示并标注在该氨基酸的下面;以后每隔5个氨基酸在其下面标注上该氨基酸的编号。当成熟蛋白质之前存在氨基酸时,例如对于前-序列,原-序列,前-原-序列和信号序列而言,可以任选地从与成熟蛋白第一个氨基酸相邻的氨基酸开始以负数往回编号。当氨基酸编号使用负数以区分成熟蛋白质时,不得使用数字0。上述氨基酸序列的计数方法也适用于环状构型的氨基酸序列,申请人可以任意指定第一个氨基酸。
第 [1] [2] [3] [4] [5] [6] [7] 页 共[8]页
|