蛋白质数据库
编辑蛋白质数据库(PDB)是蛋白质、核酸等生物大分子三维结构数据的数据库。 这些数据通常通过 X 射线晶体学、NMR 光谱学或越来越多的冷冻电子显微镜获得,并由世界各地的生物学家和生物化学家提交,可通过其成员组织的网站(PDBe, PDBj、RCSB 和 BMRB)。 PDB 由一个名为全球蛋白质数据库 (wwPDB) 的组织监督。
PDB 是结构生物学领域的关键,例如结构基因组学。 大多数主要科学期刊和一些资助机构现在都要求科学家向 PDB 提交他们的结构数据。 许多其他数据库使用存储在 PDB 中的蛋白质结构。 例如,SCOP 和 CATH 对蛋白质结构进行分类,而 PDBsum 使用来自其他来源(例如基因本体)的信息提供 PDB 条目的图形概述。
历史
编辑两种力量汇聚在一起启动了 PDB:通过 X 射线衍射确定的蛋白质结构数据集数量虽小但不断增加; 以及新推出的(1968 年)分子图形显示器,Brookhaven 光栅显示器 (BRAD),以 3-D 形式可视化这些蛋白质结构。 1969 年,在布鲁克海文国家实验室 Walter Hamilton 的赞助下,Edgar Meyer(德克萨斯 A&M 大学)开始编写软件,以通用格式存储原子坐标文件,使它们可用于几何和图形评估。 到 1971 年,Meyer 的一个程序 SEARCH 使研究人员能够远程访问数据库中的信息以离线研究蛋白质结构。 SEARCH 在启用网络方面发挥了重要作用,从而标志着 PDB 功能的开始。
蛋白质数据库于 1971 年 10 月在 Nature New Biology 上宣布,是英国剑桥晶体数据中心和美国布鲁克海文国家实验室的合资企业。
1973 年汉密尔顿去世后,Tom Koeztle 在随后的 20 年里接管了 PDB。 1994年1月,以色列魏茨曼科学研究所的Joel Sussman被任命为PDB的负责人。 1998年10月,PDB转移到结构生物信息学研究合作实验室(RCSB); 1999年6月完成交接,新任主任是罗格斯大学的Helen M. Berman(RCSB的管理机构之一,另一个是加州大学圣地亚哥分校的圣地亚哥超级计算机中心)。 2003 年,随着 wwPDB 的成立,PDB 成为了一个国际组织。 创始成员是 PDBe(欧洲)、RCSB(美国)和 PDBj(日本)。 BMRB 于 2006 年加入。wwPDB 的四个成员中的每一个都可以作为 PDB 数据的存储、数据处理和分发中心。 数据处理是指 wwPDB 工作人员对每个提交的条目进行审核和注释。 然后自动检查数据的合理性(该验证软件的源代码已免费向公众提供)。
内容
编辑PDB 数据库每周更新一次(星期三 UTC+0),连同它的持股清单。 截至 2020 年 4 月 1 日,PDB 包括:
PDB 中的 134,146 个结构具有结构因子文件。10,289 个结构具有 NMR 约束文件。PDB 中的 4,814 个结构具有化学位移文件。PDB 中的 4,718 个结构具有存放在 EM 数据库中的 3DEM 映射文件
大多数结构由 X 射线衍射确定,但约 10% 的结构由蛋白质 NMR 确定。 当使用 X 射线衍射时,获得蛋白质原子坐标的近似值,而使用 NMR 时,估计蛋白质原子对之间的距离。 蛋白质的最终构象是通过解决距离几何问题从 NMR 获得的。 2013 年之后,越来越多的蛋白质通过冷冻电子显微镜测定。 单击链接的外部表中的数字将显示由该方法确定的结构示例。
对于通过 X 射线衍射确定的具有结构因子文件的 PDB 结构,可以查看其电子密度图。 此类结构的数据存储在电子密度服务器上。
从历史上看,PDB 中的结构数量以近似指数的速度增长,1982 年有 100 个注册结构,1993 年有 1,000 个结构,1999 年有 10,000 个,2014 年有 100,000 个。
文件格式
编辑PDB最初使用的文件格式称为PDB文件格式。 原始格式受计算机穿孔卡片宽度限制为每行 80 个字符。 大约在 1996 年,作为 CIF 格式扩展的大分子晶体学信息文件格式 mmCIF 被逐步采用。mmCIF 在 2014 年成为 PDB 档案的标准格式。2019 年,wwPDB 宣布晶体学方法的沉积将只 以 mmCIF 格式接受。
2005 年描述了 PDB 的 XML 版本,称为 PDBML。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/228887/