蛋白质数据库

编辑
本词条由“匿名用户” 建档。
蛋白质数据库(PDB)是蛋白质、核酸等生物大分子三维结构数据的数据库。 这些数据通常通过 X 射线晶体学、NMR 光谱学或越来越多的冷冻电子显微镜获得,并由世界各地的生物学家和生物化学家提交,可通过其成员组织的网站(PDBe, PDBj、RCSB 和 BMRB)。 PDB 由一个名为全球蛋白质数据库 (wwPDB) 的组织监督。 PDB 是结构生物学领域的关键,例如结构基因组学。 大多数...

蛋白质数据库

编辑

蛋白质数据库(PDB)是蛋白质、核酸等生物大分子三维结构数据的数据库。 这些数据通常通过 X 射线晶体学、NMR 光谱学或越来越多的冷冻电子显微镜获得,并由世界各地的生物学家和生物化学家提交,可通过其成员组织的网站(PDBe, PDBj、RCSB 和 BMRB)。 PDB 由一个名为全球蛋白质数据库 (wwPDB) 的组织监督。

PDB 是结构生物学领域的关键,例如结构基因组学。 大多数主要科学期刊和一些资助机构现在都要求科学家向 PDB 提交他们的结构数据。 许多其他数据库使用存储在 PDB 中的蛋白质结构。 例如,SCOP 和 CATH 对蛋白质结构进行分类,而 PDBsum 使用来自其他来源(例如基因本体)的信息提供 PDB 条目的图形概述。

历史

编辑

两种力量汇聚在一起启动了 PDB:通过 X 射线衍射确定的蛋白质结构数据集数量虽小但不断增加; 以及新推出的(1968 年)分子图形显示器,Brookhaven 光栅显示器 (BRAD),以 3-D 形式可视化这些蛋白质结构。 1969 年,在布鲁克海文国家实验室 Walter Hamilton 的赞助下,Edgar Meyer(德克萨斯 A&M 大学)开始编写软件,以通用格式存储原子坐标文件,使它们可用于几何和图形评估。 到 1971 年,Meyer 的一个程序 SEARCH 使研究人员能够远程访问数据库中的信息以离线研究蛋白质结构。 SEARCH 在启用网络方面发挥了重要作用,从而标志着 PDB 功能的开始。

蛋白质数据库于 1971 年 10 月在 Nature New Biology 上宣布,是英国剑桥晶体数据中心和美国布鲁克海文国家实验室的合资企业

1973 年汉密尔顿去世后,Tom Koeztle 在随后的 20 年里接管了 PDB。 1994年1月,以色列魏茨曼科学研究所的Joel Sussman被任命为PDB的负责人。 1998年10月,PDB转移到结构生物信息学研究合作实验室(RCSB); 1999年6月完成交接,新任主任是罗格斯大学的Helen M. Berman(RCSB的管理机构之一,另一个是加州大学圣地亚哥分校的圣地亚哥超级计算机中心)。 2003 年,随着 wwPDB 的成立,PDB 成为了一个国际组织。 创始成员是 PDBe(欧洲)、RCSB(美国)和 PDBj(日本)。 BMRB 于 2006 年加入。wwPDB 的四个成员中的每一个都可以作为 PDB 数据的存储、数据处理和分发中心。 数据处理是指 wwPDB 工作人员对每个提交的条目进行审核和注释。 然后自动检查数据的合理性(该验证软件的源代码已免费向公众提供)。

内容

编辑

PDB 数据库每周更新一次(星期三 UTC+0),连同它的持股清单。 截至 2020 年 4 月 1 日,PDB 包括:

PDB 中的 134,146 个结构具有结构因子文件。10,289 个结构具有 NMR 约束文件。PDB 中的 4,814 个结构具有化学位移文件。PDB 中的 4,718 个结构具有存放在 EM 数据库中的 3DEM 映射文件

大多数结构由 X 射线衍射确定,但约 10% 的结构由蛋白质 NMR 确定。 当使用 X 射线衍射时,获得蛋白质原子坐标的近似值,而使用 NMR 时,估计蛋白质原子对之间的距离。 蛋白质的最终构象是通过解决距离几何问题从 NMR 获得的。 2013 年之后,越来越多的蛋白质通过冷电子显微镜测定。 单击链接的外部表中的数字将显示由该方法确定的结构示例。

对于通过 X 射线衍射确定的具有结构因子文件的 PDB 结构,可以查看其电子密度图。 此类结构的数据存储在电子密度服务器上。

从历史上看,PDB 中的结构数量以近似指数的速度增长,1982 年有 100 个注册结构,1993 年有 1,000 个结构,1999 年有 10,000 个,2014 年有 100,000 个。

蛋白质数据库

文件格式

编辑

PDB最初使用的文件格式称为PDB文件格式。 原始格式受计算机穿孔卡片宽度限制为每行 80 个字符。 大约在 1996 年,作为 CIF 格式扩展的大分子晶体学信息文件格式 mmCIF 被逐步采用。mmCIF 在 2014 年成为 PDB 档案的标准格式。2019 年,wwPDB 宣布晶体学方法的沉积将只 以 mmCIF 格式接受。

2005 年描述了 PDB 的 XML 版本,称为 PDBML。

内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/228887/

(7)
词条目录
  1. 蛋白质数据库
  2. 历史
  3. 内容
  4. 文件格式

轻触这里

关闭目录

目录