ماتریس جایگزینی - ویکی‌پدیا، دانشنامهٔ آزاد

ماتریس جایگزینی نوعی ماتریس تصادفی است که در زیست‌داده‌ورزی(بیوانفورماتیک) و زیست شناسی تکاملی برای هم‌ترازسازی توالی‌های پروتئین، دی‌ان‌ای و یا آران‌ای به کار می‌رود.

هر سطر و ستون ماتریس جایگزینی متناظر با یک تکپار (نوکلئوتید یا اسید آمینه) است و درایه‌های این ماتریس میزان احتمال تغییر یک تکپار به تکپاری دیگر را در اثر گذر زمان توصیف می‌کند.

پیش‌زمینه زیستی

دستورالعمل‌های ژنتکی سلول‌های یک موجود زنده در دی‌ان‌ای آن ذخیره شده است. در طول حیات سلول، این اطلاعات بارها رونویسی شده و احتمال دارد که دی‌ان‌ای در حین این فرایندها دستخوش تغییر شود.این تغییرات جهش نامیده می‌شوند.^[۱]

عملکرد پروتئین‌ها نیز بسیار به ساختارشان وابسته است. تغییر حتی یکی از آمینواسیدهای پروتئین ممکن است کارآمدی آن برای انجام وظیفه مربوطه اش کاهش دهد یا کارکرد آن را به طور کلی دچار تغییر کند.^[۱]

ابزارهایی که هم‌ترازسازی توالی انجام می‌دهند از بین پرکاربردترین ابزارهای مبتنی بر رایانه اند که در زیست‌شناسی مدرن استفاده می‌شوند زیرا هم‌ترازسازی ها اطلاعات ارزشمندی در مورد کارکردهای ژن پروتئین‌ها می‌دهد. در هر روشی از هم‌ترازسازی از یک روش امتیازدهی برای تخمین شباهت استفاده می‌شود.^[۲] از ماتریس‌های جایگزینی بدین منظور استفاده می‌شود.

انواع

ماتریس‌های PAM و BLOSUM از پرکاربردترین ماتریس‌های جایگزینی اند. در محاسبه این ماتریس‌ها از لگاریتم نسبت شانس‌ها استفاده می‌شود.

در محاسبه ماتریس‌های log-odds به هر جفت آمینواسید تطبیق داده شده به صورت ضمنی یک بسامد هدف نسبت داده می‌شود که با $q_{i,j}$ نشان داده می‌شود و امتیاز یک جفت آمینواسید به صورت $s_{i,j}=(\log {\dfrac {q_{i,j}}{p_{i}\times p_{j}}})/\lambda$ محاسبه می‌شود که $p_{i}$ و $p_{j}$ نشان‌دهنده بسامد آمینواسید‌های $i$ و $j$ است و پایه لگاریتم به دلخواه انتخاب می‌شود.^[۳]

جهش پذیرفته نقطه‌ای

یکی از اولین ماتریس‌های جایگزینی مربوط به آمینواسیدها ماتریس‌های جهش پذیرفته نقطه‌ای (PAM) هستند که در سال ۱۹۷۸ توسط مارگارت دایهوف معرفی شدند.^[۴] محاسبه این ماتریس‌ها بر مبنای ۱۵۷۲ جهش مشاهده شده در درخت‌های تبارزایی ۷۱ خانواده پروتئین‌های بسیار مرتبط با یک‌دیگر انجام شده است. پروتئین هایی برای مطالعه انتخاب شدند که شباهت زیادی در واقع حداقل ۸۵٪ شباهت با اجدادشان داشته باشند.^[۵]^[۶]پس معقول است که فرض کنیم که عدم تطابق‌ها در نتیجه تنها یک جهش نه چند جهش در آن جایگاه از رشته پروتئین بوده است. ماتریس‌های PAM از به توان رسیدن ماتریس PAM1 به دست آمده اند. استفاده از اعداد بزرگتر در نام‌گذاری این ماتریس‌ها نشان‌دهنده فاصله بیشتر است.

بلوسام

ماتریس‌های بلوسام برای اولین بار در مقاله‌ای توسط هنی‌کاف معرفی شدند^[۲]. در روند ساخت این ماتریس‌ها برای به دست آوردن فراوانی نسبی و احتمال جایگزینی آمینواسیدها از پایگاه داده بلوک‌ها برای پیدا کردن دنباله‌های تغییرنیافته در خانواده‌های پروتئین‌ها استفاده شده است. تمامی ماتریس‌های بلوسام برخلاف ماتریس‌های PAM برمبنای چینش‌های مشاهده شده محاسبه شده اند. ماتریس‌های بلوسام با اندیس بزرگتر برای مقایسه رشته‌هایی که شباهت بیشتری دارند استفاده می‌شوند.

منابع

↑ ^۱٫۰ ^۱٫۱ Campbell NA; Reece JB; Meyers N; Urry LA; Cain ML; Wasserman SA; Minorsky PV; Jackson RB (2009). Biology: Australian Version (8th ed.). Pearson Education Australia. ISBN 978-1-4425-0221-5.
↑ ^۲٫۰ ^۲٫۱ Henikoff, S.; Henikoff, J.G. (1992). "Amino Acid Substitution Matrices from Protein Blocks". PNAS. 89 (22): 10915–10919. doi:10.1073/pnas.89.22.10915. PMC 50453. PMID 1438297.
↑ Altschul, SF (1991). "Amino acid substitution matrices from an information theoretic perspective". Journal of Molecular Biology. 219 (3): 555–65. doi:10.1016/0022-2836(91)90193-A.
↑ Dayhoff, M.O., Schwartz, R. and Orcutt, B.C. (1978). "A model of Evolutionary Change in Proteins". Atlas of protein sequence and structure (volume 5, supplement 3 ed.). Nat. Biomed. Res. Found. pp. 345–358. ISBN 978-0-912466-07-1.{{cite book}}: نگهداری یادکرد:نام‌های متعدد:فهرست نویسندگان (link)
↑ Pevsner J (2009). "Pairwise Sequence Alignment". Bioinformatics and Functional Genomics (2nd ed.). Wiley-Blackwell. pp. 58–68. ISBN 978-0-470-08585-1.
↑ Wing-Kin Sung (2010). Algorithms in Bioinformatics: A Practical Introduction. CRC Press. pp. 51–52. ISBN 978-1-4200-7033-0.

[campbell-ch16-1] ۱٫۰ ^۱٫۱ Campbell NA; Reece JB; Meyers N; Urry LA; Cain ML; Wasserman SA; Minorsky PV; Jackson RB (2009). Biology: Australian Version (8th ed.). Pearson Education Australia. ISBN 978-1-4425-0221-5.

[henikoff-2] ۲٫۰ ^۲٫۱ Henikoff, S.; Henikoff, J.G. (1992). "Amino Acid Substitution Matrices from Protein Blocks". PNAS. 89 (22): 10915–10919. doi:10.1073/pnas.89.22.10915. PMC 50453. PMID 1438297.

[3] Altschul, SF (1991). "Amino acid substitution matrices from an information theoretic perspective". Journal of Molecular Biology. 219 (3): 555–65. doi:10.1016/0022-2836(91)90193-A.

[dayhoff19782-4] Dayhoff, M.O., Schwartz, R. and Orcutt, B.C. (1978). "A model of Evolutionary Change in Proteins". Atlas of protein sequence and structure (volume 5, supplement 3 ed.). Nat. Biomed. Res. Found. pp. 345–358. ISBN 978-0-912466-07-1.{{cite book}}: نگهداری یادکرد:نام‌های متعدد:فهرست نویسندگان (link)

[Pevsner-ch32-5] Pevsner J (2009). "Pairwise Sequence Alignment". Bioinformatics and Functional Genomics (2nd ed.). Wiley-Blackwell. pp. 58–68. ISBN 978-0-470-08585-1.

[sung2-6] Wing-Kin Sung (2010). Algorithms in Bioinformatics: A Practical Introduction. CRC Press. pp. 51–52. ISBN 978-1-4200-7033-0.

[۱]

[۲]

[۳]

[۴]

[۵]

[۶]

ن ب و انواع ماتریس
با درایه های صراحتاً مقید	(0, 1) متناوب پادقطری پادهرمیتی پادمتقارن پیکانی نواری دوقطری مبنای دو دو-متقارن بلوکی-قطری بلوکی بلوکی سه‌قطری بولی کوشی مرکز-متقارن کنفرانسی هادامارد مختلط هم-مثبت قطری غالب قطری تبدیل فوریه گسسته مقدماتی معادل فروبنیوس جایگشتی تعمیم یافته هادامارد هنکل هرمیتی هسنبرگ توخالی عددصحیح منطقی مارکوف متزلر تک‌جمله‌ای مور نامنفی افرازشده پاریسی پنج-قطری جایگشت پر-متقارن چندجمله‌ای مثبت چهارتایی علامت امضاء اریب-هرمیتی اریب-متقارن خط افق خلوت سیلوستر متقارن توپلیتز مثلثی سه‌قطری یکانی وندرموند والش زد
ثابت	تبادل هیلبرت همانی لمر یک‌ها پاسکال پاولی ردفر جابجایی صفر
شرایط روی مقادیرویژه یا بردارویژه‌ها	همراه همگرا نقصانی قطری پذیر هورویتز ماتریس مثبت-معین پایداری اشتیلیس
شرایط کافی روی ضرب‌ها یا معکوس‌ها	همنهشتی خودتوان یا تصویری معکوس‌پذیر پیچش پوچ‌توان نرمال متعامد متعامد یکه تکین تک‌نمایی تک-توان کاملاً تک-نما وزنی
با کاربردهای خاص	الحاقی با علامت متناوب افزوده بزو کارلمن کارتان دوری کهاد جابجایی پریشانی کاکستر موهن فاصله تکرار حذف فاصله اقلیدسی بنیادی (معادله دیفرانسیل خطی) مولد گرامیان هسین خانه‌دار ژاکوبی گشتاور بازده پیک راندوم دوران سیفرت برش شباهت همتافته کاملاً مثبت تبدیل ودربرن X–Y–Z
بکار رفته در آمار	برنولی مرکزیت همبستگی کوواریانس طرح پراکندگی تصادفی مضاعف اطلاع فیشر کلاه دقت تصادفی انتقال
بکار رفته در نظریه گراف	مجاورت دو-مجاورت درجه ادموندز وقوع لاپلاس مجاورت سیدل اریب-مجاورت توته
بکار رفته در علوم و مهندسی	کابیبو-کوبایاشی-ماسکاوا چگالی بنیادی (بینایی رایانه) شرکتپذیری فازی گاما گل-من همیلتونی نامنظم همپوشانی S انتقال حالت جایگزینی Z (شیمی)
اصطلاحات مرتبط	فرم کانونی جوردن استقلال خطی نمای ماتریس نمایش ماتریسی مقاطع مخروطی ماتریس بی نقص شبه معکوس ماتریس چهارتایی شکل سطری-پلکانی رونسکین
لیست ماتریس‎ها رده:ماتریس‌ها