الفبا (نظریه زبانها) - ویکیپدیا، دانشنامهٔ آزاد
در نظریهٔ زبانهای صوری، هر مجموعهٔ ناتهی را الفبا (الفبای صوری) مینامیم و اعضای آن را (مثل حروف، ارقام یا char
) نمادهای آن الفبا (یا حروف صوری آن) هستند.[۱]
این نمادها میتوانند مجموعهای از واجها باشند (مثل IPA). همچنین فونتها و قلمهای رایانه (مجموعهای از گلیفها) را نیز میتوان طبق این تعریف الفبا نامید.[۲] الفبا با این تعریف در طیف وسیعی از زمینهها از جمله منطق، ریاضیات، علوم کامپیوتر و زبانشناسی استفاده میشود. کدگذاری نویسهها مثل ASCII از نمونههای کاربرد در کامپیوتر است.[۳]
یک الفبا معمولاً با (سیگما بزرگ)،[۱][۲][۳] (گاما بزرگ)[۱] یا نمایش داده میشود. اندازهٔ الفبا کاردینالیتهٔ مجموعه است و ممکن است متناهی، شمارا یا حتی ناشمارا باشد.[۱]
الفبا در نظریه زبانها و نظریه ماشینها مهم هستند. برای تعریف اتوماتاهایی مثل DFA لازم است الفبایی مشخص کنیم تا رشتههای ورودی آن اتوماتا از آن رشتهها باشند.
رشته
[ویرایش]یک رشته (یا کلمهٔ صوری) در یک الفبا به صورت «دنبالهای از حروف الفبا» تعریف میشود. به عنوان مثال، به کمک (الفبای شامل) حروف «الف» تا «ی» میتوان کلمات فارسی مانند «آب» ایجاد کرد. یک الفبای رایج، الفبای باینری است و «» نمونه ای از یک رشته باینری است. یک رشته معمولاً با نمایش داده میشود. طول رشته تعداد نمادهای درونش است. رشتهٔ تهی با طول صفر را با ،[۱] [۳] (اپسیلون کوچک) یا [۲] (لاندا کوچک) نمایش میدهیم.
اغلب برای خوانایی لازم است که نمادها را در یک الفبا به یک علامت محدود کنیم تا تفسیر هر رشته بدون ابهام باشند. برای مثال، اگر الفبای دو عضوی باشد، رشتهٔ مبهم است، زیرا مشخص نیست که است یا یا .
اعمال روی رشتهها
[ویرایش]الحاق رشتهها
[ویرایش]عملگر الحاق دو رشته و با نماد ضرب نمایش میدهیم. البته معمولاً این نماد را حذف میکنیم و الحاق را به صورت نشان میدهیم.
به عنوان مثال الحاق و برابر است.
توان رشته
[ویرایش]با بار الحاق در خودش به میرسیم. همچنین تعریف میکنیم.[۲]
معکوس رشته
[ویرایش]معکوس یک رشته با نماد همان حروف صوری به ترتیب عکس است؛ مثلاً .[۲]
اگر معکوس یک رشته با خودش یکسان باشد به آن رشته پالیندروم میگوییم.
زیررشته
[ویرایش]اگر میگوییم (و همچنین ) زیررشتهٔ است ( دلخواه و شاید تهی). مثلاً «شنبه» زیررشتهٔ «چهارشنبهسوری» است.
به پیشوند و به پسوند میگوییم. به اضافه اگر باشد آن را پیشوند اکید مینامیم.[۱]
ترتیب رشتهها
[ویرایش]اگر برای حروف الفبا یک ترتیب الفبایی (مثل ) تعریف شده باشد میتوانیم برای رشتهها نیز ترتیب تعریف کنیم. ترتیب لغتنامهای (به انگلیسی: lexicographic order) همان ترتیبی است که در فرهنگنامهها استفاده میشود. با یک تغییر جزئی در قوانین به ترتیب (به انگلیسی: shortlex order) میرسیم. در این ترتیب رشتههای کوتاهتر باید جایگاه کمتری داشته باشند؛ مثلاً در الفبای :[۱]
در ترتیب lexicographic:
در ترتیب shortlex:
توان الفبا
[ویرایش]با اعمال عمل توان بر روی یک الفبا یک زبان به دست میآید. اگر یک الفبا باشد، مجموعهٔ تمام رشتههای به طول بر روی الفبای را به صورت نمایش میدهیم؛ مثلاً اگر باشد .[۳]
مجموعهٔ تمام رشتههای با هر طول (متناهی) را بستار کلین مینامیم:
هر کدام از رشتههای عضو متناهی اند ولی خود شمارا و نامتناهی است. در مثال فوق
همچنین بستار مثبت پس .[۲]
مجموعهٔ تمام رشتههای نامتناهی را با نماد نمایش میدهیم (توان امگا در اینجا نماد عدد اردینال است) و .
جمله
[ویرایش]در تعریف الفبا (هر مجموعهٔ ناتهی) هیچ محدودیتی وجود ندارد. در نتیجه مجموعهای از کلمات (از الفبایی مثل ) خود میتواند الفبای دیگری مثل فرض شود (مثلاً ). در برخی حوزهها مثل منطق، الفبای صوری به عنوان واژگان (مجموعهٔ کلمات) و کلمات صوری به عنوان جملات شناخته می شوند. به عبارتی دیگر استعارهٔ حرف/کلمه را میشکند و استعارهٔ کلمه/جمله جایگزین آن میکند. به طور کلی میتوان به عناصر (کلمات) عضو یک زبان جمله گفت.[۲]
جستارهای وابسته
[ویرایش]منابع
[ویرایش]- ↑ ۱٫۰ ۱٫۱ ۱٫۲ ۱٫۳ ۱٫۴ ۱٫۵ ۱٫۶ Introduction to the Theory of Computation (Third Edition). به کوشش Michael Sipser.
- ↑ ۲٫۰ ۲٫۱ ۲٫۲ ۲٫۳ ۲٫۴ ۲٫۵ ۲٫۶ An Introduction to Formal Languages and Automata (Sixth Edition). به کوشش Peter Linz.
- ↑ ۳٫۰ ۳٫۱ ۳٫۲ ۳٫۳ Introduction to Automata Theory, Languages, and Computation (Third Edition). به کوشش John E. Hopcroft, Rajeev Motwani, Jeffrey D. Ullman.