核苷酸和／或氨基酸序列表和序列表电子文件标准-法搜-中国法律信息搜索网

　　４．４．４、生物体：其数字标识符为〈２１３〉。
　　在数字标识符〈２１３〉之后，应当用中文和拉丁文（拉丁文应当放在中文之后并用圆括号括起来，例如，草履虫种（Ｐａｒａｍｅｃｉｕｍ　ｓｐ．））注明该序列来源的生物名称，即科学命名的生物属种；或者是“人工序列”或“未知”。
　　４．４．５、序列中特征部分的内容：数字标识符〈２２０〉－〈２２３〉。
　　本节涉及到序列中与特征相关的内容的表述。
　　在核苷酸序列（数字标识符〈４００〉）中含有“ｎ”或修饰的碱基的情况下（参见本标准４．４．７节（１）的内容），或者在氨基酸序列（数字标识符〈４００〉）中含有“Ｘａａ”或修饰的氨基酸或不常用的Ｌ－氨基酸的情况下（
参见本标准４．４．７节（２）的内容），必须包括下面（１）－（４）项的内容。
　　在生物体（数字标识符〈２１３〉）是“人工序列”或“未知”的情况下，必须包括下面（１）和（４）项的内容。
　　在一个序列中有多个特征的情况下，应当按照这些特征在序列中出现的先后次序逐一地表述每个特征。
　　序列中特征部分的具体内容和数字标识符如下：
　　（１）特征：其数字标识符为〈２２０〉。
　　在数字标识符〈２２０〉之后，应当是空白。
　　（２）名称／关键词：其数字标识符为〈２２１〉。
　　在数字标识符〈２２１〉之后，是特征名称或关键词。使用关键词表述特征时，只能使用附录１之表５或表６中列出的关键词来表述。
　　（３）位置：其数字标识符为〈２２２〉。
　　在数字标识符〈２２２〉之后，应当标明特征的位置，标注的方式为：从特征中的第一个碱基或氨基酸的编号到特征的最后一个碱基或氨基酸的编号，编号圆括号括起来，两个编号中间是“．．．”，例如：（２７９）．．．（３８９）；当序列中使用了多个“ｎ”或“Ｘａａ”时，应当标明它们的所有位置，例如：（８０，１００，１１２）。参见附录２的序列表样例。
　　（４）其它信息：其数字标识符为〈２２３〉。
　　在数字标识符〈２２３〉之后，应当表述序列中与特征有关的其它相关信息。在表述修饰的碱基或修饰的氨基酸时，应该用附录１之表２或表４中给出的符号来表述。
　　４．４．６、出版公开信息：数字标识符〈３００〉－〈３１２〉。
　　出版公开信息是非强制性的内容，在序列表和序列表电子文件中，可以包含也可以不包含这些内容。
　　（１）公开出版信息：其数字标识符为〈３００〉
　　在数字标识符〈３００〉之后，应当是空白。
　　（２）作者：其数字标识符为〈３０１〉
　　在数字标识符〈３０１〉之后，是该文献作者的姓名。
　　（３）题目：其数字标识符为〈３０２〉
　　在数字标识符〈３０２〉之后，是出版物中该文献的题目。
　　（４）杂志名称：其数字标识符为〈３０３〉
　　在数字标识符〈３０３〉之后，是公开出版物的杂志名称。
　　（５）公开出版物的卷号：其数字标识符为〈３０４〉
　　在数字标识符〈３０４〉之后，是公开出版物的卷号。
　　（６）公开出版物的出版号：其数字标识符为〈３０５〉
　　在数字标识符〈３０５〉之后，是公开出版物的出版号。
　　（７）页码：其数字标识符为〈３０６〉
　　在数字标识符〈３０６〉之后，是该文献的起始－终止页码。
　　（８）出版日期：其数字标识符为〈３０７〉
　　在数字标识符〈３０７〉之后，是该公开出版物的出版日期，其格式为：ＹＹＹＹ－ＭＭ－ＤＤ，例如１９９９－０９－２０。
　　（９）公开出版物的数据库登记号：其数字标识符为〈３０８〉
　　如果该文献被收入某个数据库的话，那么在数字标识符〈３０８〉之后，是该文献在该数据库中的登记号。
　　（１０）录入数据库的日期：其数字标识符为〈３０９〉
　　如果该文献被收入某个数据库的话，那么在数字标识符〈３０９〉之后，是该文献录入该数据库的日期，其格式为：ＹＹＹＹ－ＭＭ－ＤＤ，例如１９９９－０９－２０。
　　（１１）专利公开号：其数字标识符为〈３１０〉
　　如果该公开出版物是专利文献的话，那么在数字标识符〈３１０〉之后，是该专利的公开号，其格式为：世界知识产权组织（ＷＩＰＯ）标准３（ＳＴ　３）的国家、地区和政府间组织代码＋标准６（ＳＴ　６）的公开号＋标准１６（ＳＴ　１６）的文献类型，例如ＣＮ１１８３１１７Ａ。
　　（１２）专利申请日：其数字标识符为〈３１１〉
　　如果该公开出版物是专利文献的话，那么在数字标识符〈３１１〉之后，是该专利的申请日，其格式为：ＹＹＹＹ－ＭＭ－ＤＤ，例如１９９９－０９－２０。
　　（１３）专利公开日：其数字标识符为〈３１２〉
　　如果该公开出版物是专利文献的话，那么在数字标识符〈３１２〉之后，是该专利的公开日，其格式为：ＹＹＹＹ－ＭＭ－ＤＤ，例如１９９９０９－２０。
　　４．４．７、核苷酸序列和／或氨基酸序列：其数字标识符为〈４００〉。
　　在数字标识符〈４００〉之后，是该序列的序列标识符；从下一行开始是该核苷酸和／或氨基酸序列。
　　该序列可以是纯核苷酸序列，或者是纯氨基酸序列，或者是核苷酸序列和与它对应的氨基酸序列。
　　（１）纯核苷酸序列：
　　核苷酸序列应当只用单链表示，从左到右是５’－末端至３’－末端的方向，序列中不应当出现术语５’和３’。
　　应当用单字母代码表示核苷酸序列的碱基来表述核苷酸序列的特征；只能使用与附录１之表１中给出的符号相一致的小写字母来表示。
　　在一个核苷酸序列中，如果经修饰的碱基是附录１之表２中列出的之一，那么在该序列本身中，应当用未修饰的碱基或“ｎ”来表示该经修饰的碱基，符号“ｎ”等同于唯一的一个未知的或经修饰的核苷酸；但在该序列的特征部分（数字标识符〈２２０〉－〈２２３〉）应当使用附录１之表２中给出的符号进一步表述该修饰（参见本标准４．４．５节）。附录１之表２中的符号可以用于说明书或序列的特征部分，但不得用于序列本身。
　　核苷酸序列中碱基的编号开始于序列中的第１个碱基，并从５’到３’方向连续地计数。该计数方法也用于构型为环状的核苷酸序列，在这种情况下，申请人可任意指定序列的第一个核苷酸。
　　来自大序列的一个或更多非邻接区段或来自不同序列的区段组成的核苷酸序列，应当作为带有单独序列标识符的单独序列来计数。带有一个缺口或多个缺口的序列应当作为带有单独序列标识符的多个单独序列来计数，而单独序列的数目与序列数据的连续序列的数目相同。
　　核苷酸序列每行最多６０个核苷酸碱基，每１０个核苷酸碱基后空一格。该行的最后是该行最后一个碱基的编号。
　　（２）纯氨基酸序列：
　　对于氨基酸序列，蛋白质或肽序列中的氨基酸应当从左到右以氨基到羧基的方向列出；序列中不应当出现氨基或羧基基团。
　　氨基酸应当使用与附录１之表３中的符号相一致的、第一个字母大写的三字母符号表示。有空白或内部中止符号（例如“Ｔｅｒ”或“＊”或“·”）的氨基酸序列不应当表示为单个氨基酸序列，而应当作为独立的氨基酸序列分别列出。
　　在一个氨基酸序列中，如果经修饰的氨基酸是附录１之表４中列出的氨基酸之一，那么在该序列本身中，应当用相应的未经修饰的氨基酸或“Ｘａａ”来表示该经修饰的和不常用的氨基酸，符号“Ｘａａ”等同于唯一的一个未知的或经修饰的氨基酸；但在该序列的特征部分（数字标识符〈２２０〉－〈２２３〉），应当使用附录１之表４中给出的符号进一步表述该修饰（参见本标准４．４．５节）。附录１之表４中的符号可以用于说明书或序列的特征部分，但不得用于序列本身。
　　氨基酸的编号开始于序列中的第１个氨基酸，以数字１表示并标注在该氨基酸的下面；以后每隔５个氨基酸在其下面标注上该氨基酸的编号。当成熟蛋白质之前存在氨基酸时，例如对于前－序列，原－序列，前－原－序列和信号序列而言，可以任选地从与成熟蛋白第一个氨基酸相邻的氨基酸开始以负数往回编号。当氨基酸编号使用负数以区分成熟蛋白质时，不得使用数字０。上述氨基酸序列的计数方法也适用于环状构型的氨基酸序列，申请人可以任意指定第一个氨基酸。