当前位置:

网站首页>文章详情

SRA数据库架构及二代测序数据共享

【PDF在线阅读】 【下载PDF】
  • Author:

  • Author Unit:

  • Keywords:

  • 中图分类号:

  • R4

摘要:

近年来,随着二代测序技术的迅猛发展,高通量测序数据也呈指数级增长,S R A
(Sequence Read Archive)数据库是用于存储这些二代测序原始数据和比对信息的代表性数据库。SRA数
据库建立至今,各项测序数据迅速累积,已囊括多个物种、多种应用,成为大规模二代测序数据库及高
效率的测序数据存储、提取及共享的平台。该数据库目前持续更新并面向公众开放。本文将介绍SRA数
据库的网站架构及测序原始数据提取方法。

Abstract:

In recent years, with the rapid development of next-generation sequencing technology, highthroughput
sequencing data has also grown exponentially. The SRA (Sequence Read Archive) database is a
representative database for storing these next-generation sequencing raw data and comparison information. Since the
establishment of the SRA database, the sequence data has accumulated rapidly. At present,a large-scale database
involving multiple species and multiple applications has been formed,which has become a platform for efficient
storage,extraction and sharing of sequencing data. The database is currently continuously updated and open to the
public. This article will introduce the SRA database website architecture and sequencing raw data extraction method.

基金项目:

国家社会科学基金一般项目(16BGL183)

参考文献:

[1] 李妍,徐兴祥. 高通量测序技术的研究进展[ J ] . 中国医学工
程,2019,27(3):32-7.
[2] 刘永杰,王渊,付强,等. 高通量测序技术在病原生物学方面的研
究进展[J]. 口岸卫生控制,2019,24(1):6-9.
[3] 徐康. 组学大数据的检索系统设计与实现[D]. 哈尔滨工业大
学,2015.
[4] 熊筱晶. NCBI高通量测序数据库SRA介绍[J]. 生命的化学,2010,
30(6):959-63.
[ 5 ] S R A 数据库介绍. h t t p s : / / m p . w e i x i n . q q . c o m / s /
UYuMbVkzneYTVDwqUK5NLw
[6] 宋波,杨艳利,冯云霞. 医疗大数据研究进展[J]. 转化医学杂
志,2016,5(5):298-300,316.
[7] 高凡,田国祥,贺海蓉,等. 如何使用Dryad数据库实现医学数据共
享[J]. 中国循证心血管医学杂志,2018,10(5):518-20.
[8] Choudhary Saket. pysradb:A Python package to query next-generation
sequencing metadata and data from NCBI Sequence Read Archive[J].
F1000Research,2019,8.
  • 2008

  • 1

通讯地址:北京市东城区东四十条南门仓5号
电话: 237499284 邮编:100700
网址:www.ebcvm..org Email: ebcvm_cj@126.com

copyright © 《中国循证心血管医学杂志》编辑部
当您在使用本网站投稿遇到困难时,
请直接将稿件投送到编辑部邮箱ebcvm_cj@126.com