Protein Data Bank - Vikipedi

Protein Data Bank (PDB[1]),büyük biyolojik moleküllerin, özellikle proteinler ve nükleik asitlerin üç boyutlu yapısal verilerini içeren bir veri tabanı olarak çalışır. Genellikle X-ışını kristalografisi, NMR spektroskopisi gibi tekniklerle elde edilen deneysel verileri, atomların yeri ve konumunu içeren PDB dosya formatında barındırır. Kriyo-elektron mikroskopisi yöntemi de veri elde etmek için kullanılan yöntemlerden biri olarak öne çıkar. PDBe, PDBj, RCSB ve BMRB gibi üye kuruluşların internet siteleri aracılığıyla herkese açık ve erişilebilirdir. PDB'nin yönetimi Dünya Protein Data Bank (wwPDB) tarafından denetlenmektedir.

PDB yapısal genomik gibi yapısal biyoloji alanlarında kilit bir rol oynamaktadır. Önemli bilimsel dergilerin çoğu ve bazı finansman kuruluşları, bilim insanlarını yapısal verilerini PDB'ye göndermeye zorunlu kılmaktadır. Temel işlevinin ötesinde, PDB, diğer veritabanları tarafından içinde kataloglanan protein yapılarının geniş bir bilimsel yapı içinde önemli bir pozisyona sahiptir. Örneğin, SCOP ve CATH protein yapılarını sınıflandırırken, PDBsum ise PDB kayıtlarının görsel bir özetini sunar ve Gene Ontology gibi çeşitli kaynaklardan gelen bilgileri bir araya getirir.

RCSB Protein Data Bank,[2] yapısal biyoloji alanında bir köşe taşı kaynak olarak durur ve dünya çapındaki araştırmacıların biyolojik makromolekül yapılarının sürekli olarak büyüyen depolamasına erişmelerini, analiz etmelerini ve katkıda bulunmalarını sağlar. Zengin bir geçmişe, geniş veri girişi sayılarına ve standartlaştırılmış bir PDB dosya biçimine sahip olan RCSB PDB, yaşamın moleküler temelini anlama ve geniş bir disiplin yelpazesinde bilimsel keşifleri kolaylaştırmada hayati bir rol oynamaya devam eder.

Protein Data Bank'ın (PDB) ortaya çıkışı

[değiştir | kaynağı değiştir]

X-ışını difraksiyonu ile belirlenen protein yapısı verilerinin tutulması için bir yere ihtayaç doğmaya başladı. Bunun yanı sıra daha sonra deneysel olarak ortaya çıkarılan yapıların 3B olarak görselleştirmek için kullanılabilir hale gelen 1968'de geliştirilen moleküler grafik ekranı olan Brookhaven RAster Display (BRAD) ortaya çıktı. Bu iki gelişme protein yapılarının saklanabileceği ve tekrar kullanılabileceği bir “arşiv” ihtiyacı doğurdu.

1969'da, Brookhaven Ulusal Laboratuvarı'ndaki Walter Hamilton'ın çabasıyla Edgar Meyer (Texas A&M Üniversitesi), bu atom koordinat dosyalarını ortak bir formatta saklamak ve bunları geometrik ve grafiksel değerlendirme için erişilebilir hale getirmek için bir program yazdı. 1971'de, Meyer'in programlarından biri olan SEARCH, araştırmacılara veritabanından bilgiye uzaktan erişim sağladı. SEARCH, ağ oluşturmayı mümkün kılarak PDB'nin işlevsel başlangıcını oluşturdu.

Protein Data Bank, Ekim 1971'de Nature New Biology dergisinde ilan edildi ve İngiltere'deki Cambridge Kristalografi Veri Merkezi ile ABD'deki Brookhaven Ulusal Laboratuvarı arasında bir ortak girişim olarak duyuruldu.

Hamilton'ın 1973'teki ölümünün ardından, Tom Koeztle, PDB'nin yönetimini sonraki 20 yıl boyunca devraldı. Ocak 1994'te, İsrail'in Weizmann Bilim Enstitüsü'nden Joel Sussman, PDB'nin başına getirildi. Ekim 1998'de, PDB Araştırma İşbirliği yapısı (RCSB) tarafından devralındı; transfer Haziran 1999'da tamamlandı. 2003'te wwPDB'nin kurulmasıyla birlikte, PDB uluslararası bir kuruluş haline geldi.[3] Kurucu üyeler PDBe (Avrupa),RCSB (ABD) ve PDBj (Japonya)'dir. BMRB 2006 yılında katıldı. wwPDB'nin dört üyesi, PDB verileri için depolama, veri işleme ve dağıtım merkezi olarak hareket edebilir. Veri işlemesi, wwPDB personelinin her gönderilen girdiyi gözden geçirdiği ve açıklama eklediği anlamına gelir. Veriler daha sonra otomatik olarak inandırıcılık açısından kontrol edilir (bu doğrulama yazılımının kaynak kodu kamuya ücretsiz olarak sunulmuştur).

  • 1970'lerin başları: X-ışını difraksiyonu ile belirlenen protein yapısı verilerinin küçük bir koleksiyonu oluşmaya başladı; aynı dönemde 3B moleküler grafik ekranı Brookhaven RAster Display (BRAD) geliştirildi.
  • 1969: Texas A&M Üniversitesi'nden Edgar Meyer, atom koordinat dosyalarını ortak bir formatta saklamak için yazılım geliştirmeye başladı.
  • 1971: Meyer'in SEARCH programı, araştırmacılara veritabanından bilgiye erişim sağladı ve ağ oluşturmaya imkan tanıdı, böylece PDB'nin işlevsel başlangıcı gerçekleşti.
  • 1971: Protein Data Bank (PDB), İngiltere'deki Cambridge Kristalografi Veri Merkezi ile ABD'deki Brookhaven Ulusal Laboratuvarı arasında ortak bir girişim olarak duyuruldu.
  • 1973: Hamilton'ın ölümünün ardından Tom Koeztle, PDB'nin yönetimini devraldı.
  • 1994: İsrail'in Weizmann Bilim Enstitüsü'nden Joel Sussman, PDB'nin başına getirildi.
  • 1998: PDB Araştırma İşbirliği yapısı (RCSB) tarafından devralındı. Helen M. Berman direktör oldu.[4]
  • 1999: RCSB'ye tamamen transfer tamamlandı.
  • 2003: wwPDB'nin kurulmasıyla PDB uluslararası bir kuruluş haline geldi.
  • 2023: Protein Data Bank Çin (PDBÇ), Dünya Protein Data Bank (wwPDB[5]) Ortaklığının Birleşik Üyesi oldu.[6]

PDB dosya biçimi

[değiştir | kaynağı değiştir]

Protein Data Bank (PDB) dosya biçimi, Protein Data Bank'ta bulunan moleküllerin üç boyutlu yapılarını açıklayan metin tabanlı bir dosya biçimidir ve daha sonra mmCIF biçimi tarafından takip edilmiştir. Bu nedenle PDB biçimi, protein ve nükleik asit yapılarının açıklaması ve açıklaması için kullanılır; bunlar arasında atom koordinatları, ikincil yapı atamaları ve atom bağlantıları bulunur. Ayrıca deneysel meta veriler de depolanır. PDB biçimi, biyolojik makromoleküllerle ilgili verileri tutan Protein Data Bank'ın eski dosya biçimidir ve daha yeni mmCIF dosya biçiminde veri saklar.[7]

Her PDB dosyası, RCSB PDB'deki tek bir girişe karşılık gelir ve genellikle atomların üç boyutlu koordinatları, bağ uzunlukları ve açıları hakkında bilgiler, simetri operatörleri ve yapıdaki ligandlar ile çözücü molekülleri hakkındaki bilgiler gibi verileri içerir. PDB biçimi, yıllar içinde artan yapısal verilerin karmaşıklığı ve çeşitliliğine uyum sağlamak için birkaç kez revize edilmiş ve genişletilmiştir.

PDB dosya formatı belirli değişkenleri belli bir formatta saklar. Bazı değişkenlerin her dosyada bulunması gerekirken bazılarının ise olma zorunluluğu yoktur. Her dosyanın içerdiği satırların açıklamaları aşağıdaki tabloda yer almaktadır:

KAYIT TÜRÜ MEVCUTLUK KOŞULLAR İSTEĞE BAĞLI
HEADER Zorunlu Giriş başlığı.
OBSLTE İsteğe Bağlı Yenisiyle değiştirilmiş girişlerde kullanılır.
TITLE Zorunlu Giriş başlığı.
SPLIT İsteğe Bağlı Büyük makromoleküler kompleksler birden fazla PDB girişine bölündüğünde kullanılır.
CAVEAT İsteğe Bağlı Hatalar gibi açık durumlar olduğunda kullanılır.
COMPND Zorunlu Bileşik adı ve diğer bileşik bilgileri.
SOURCE Zorunlu Kaynağın adı ve diğer bilgileri.
KEYWDS Zorunlu Anahtar kelimeler.
EXPDTA Zorunlu Deney yöntemi ve diğer ilgili bilgiler.
NUMMDL İsteğe Bağlı NMR ansambl girişleri için gerekli.
MDLTYP İsteğe Bağlı NMR minimize edilmiş ortalama yapıları veya tüm polimer zinciri C alfa veya P atomları içeriyorsa gerekli.
AUTHOR Zorunlu Yazar bilgileri.
REVDAT Zorunlu Revizyon tarihleri ve açıklamaları.
SPRSDE İsteğe Bağlı Yenisiyle değiştirilmiş bir giriş olduğunda gerekli.
JRNL İsteğe Bağlı Deneyi tanımlayan bir yayın olduğunda gerekli.
REMARK 0 İsteğe Bağlı Yeniden düzeltilmiş bir yapı için gerekli.
REMARK 1 İsteğe Bağlı Genel açıklama için kullanılır.
REMARK 2 Zorunlu Giriş hakkında ayrıntılı bilgi.
REMARK 3 Zorunlu Giriş hakkında ek ayrıntılı bilgi.
REMARK N İsteğe Bağlı Belirli koşullar altında kullanılır.
DBREF İsteğe Bağlı Tüm polimer zincirleri için kullanılır.
DBREF1/DBREF2 İsteğe Bağlı Belirli dizi veritabanı erişimi ve/veya sıra numaralandırma uygun değilse kullanılır.
SEQADV İsteğe Bağlı Dizi çakışması varsa kullanılır.
SEQRES Zorunlu ATOM kayıtları varsa kullanılır.
MODRES İsteğe Bağlı Koordinatlarda değiştirilmiş grup varsa kullanılır.
HET İsteğe Bağlı Su dışında standart olmayan grup varsa kullanılır.
HETNAM İsteğe Bağlı Su dışında standart olmayan grup varsa kullanılır.
HETSYN İsteğe Bağlı Standart olmayan grupların senonimleri.
FORMUL İsteğe Bağlı Su dışında standart olmayan grup veya su varsa kullanılır.
HELIX İsteğe Bağlı Alfa sarmal yapısı.
SHEET İsteğe Bağlı Beta yapısı.
SSBOND İsteğe Bağlı Bir disülfit bağı varsa kullanılır.
LINK İsteğe Bağlı Polimer zincirlerinde standart olmayan bileşikler varsa kullanılır.
CISPEP İsteğe Bağlı Sis izomeri bilgisi.
SITE İsteğe Bağlı Bağlama alanları.
CRYST1 Zorunlu Kristal parametreleri.
ORIGX1 ORIGX2 ORIGX3 Zorunlu Koordinat dönüş matrisleri.
SCALE1 SCALE2 SCALE3 Zorunlu Koordinat dönüş matrisleri.
MTRIX1 MTRIX2 MTRIX3 İsteğe Bağlı Asimetrik ünitenin oluşturulması gerekiyorsa kullanılır.
MODEL İsteğe Bağlı Birden fazla model varsa kullanılır.
ATOM İsteğe Bağlı Standart kalıntılar varsa kullanılır.
ANISOU İsteğe Bağlı Birkutuplu atomun termal titreşim bilgisi.
TER İsteğe Bağlı Polimer zincirleri varsa kullanılır.
HETATM İsteğe Bağlı Standart olmayan grup varsa kullanılır.
ENDMDL İsteğe Bağlı MODEL beliriyorsa kullanılır.
CONECT İsteğe Bağlı Standart olmayan grup varsa ve LINK veya SSBOND kayıtları varsa kullanılır.
  1. ^ "Protein Data Bank". 11 Kasım 1998 tarihinde kaynağından arşivlendi. 
  2. ^ "Protein Data Bank – Protein Data Bank Tanıyalım". 15 Ağustos 2023 tarihinde kaynağından arşivlendi. 
  3. ^ Berman, Helen; Henrick, Kim; Nakamura, Haruki (2003). "Announcing the worldwide Protein Data Bank". Nature Structural & Molecular Biology (İngilizce). 10 (12): 980-980. doi:10.1038/nsb1203-980. ISSN 1545-9985. 3 Şubat 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 19 Ağustos 2023. 
  4. ^ eresblog (15 Ağustos 2023). "Protein Data Bank - Protein Data Bank Tanıyalım". ERES Biyoteknoloji. 15 Ağustos 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 19 Ağustos 2023. 
  5. ^ "wwPDB". 27 Kasım 2003 tarihinde kaynağından arşivlendi. 
  6. ^ "Wenqing Xu, Sameer Velankar, Ardan Patwardhan, Jeffrey C. Hoch, Stephen K. Burley, Genji Kurisu. (2023) Announcing launch of Protein Data Bank China (PDBc) as an Associate Member of the Worldwide Protein Data Bank (wwPDB) Partnership Acta Cryst. D, submitted" (PDF). 19 Ağustos 2023 tarihinde kaynağından arşivlendi (PDF). Erişim tarihi: 19 Ağustos 2023. 
  7. ^ Burley, S.K., Berman, H.M., Kleywegt, G.J., Markley, J.L., Nakamura, H., Velankar, S. (2017). Protein Data Bank (PDB): The Single Global Macromolecular Structure Archive. In: Wlodawer, A., Dauter, Z., Jaskolski, M. (eds) Protein Crystallography. Methods in Molecular Biology, vol 1607. Humana Press, New York, NY. https://doi.org/10.1007/978-1-4939-7000-1_26