1. Pojęcia podstawowe

1.3. Język

Zbiór wszystkich słów nad ustalonym alfabetem V oznaczamy symbolem V* a dowolny niepusty podzbiór L tego zbioru nazywamy językiem. Do zbioru Vzaliczamy również słowo puste (oznaczane na ogół symbolem ε). Słowo puste ma długość 0. Zbiór Vjest oczywiście nieskończony ale przeliczalny, mamy bowiem

V* = {ε} ∪ V ∪ V∪ ... ∪ Vn ∪ ...

W zbiorze V* definiujemy działanie dwuargumentowe \(\circ\) V× V→ Vtzw. konkatenację (ang. concatenation). Jeśli α, β ∈ V* i α = a1a2...an β = b1b2...bto z definicji mamy

a \(\circ\) b = a1a2...an \(\circ\) b1b2...bn \(\overset{df}=\)  a1a2...anb1b2...bn

Jak widać konkatenacja jest zestawianiem słów np. ala konkatenowane z makota daje alamakota, podobnie kot z let daje kotlet.

Jak łatwo sprawdzić działanie konkatenacji jest łączne, tzn. dla każdego  α, β, γ ∈ V* mamy (α \(\circ\) β) \(\circ\) γ = α \(\circ\) (β \(\circ\) γ). Mamy ponadto dla każdego α ∈ V*; α \(\circ\) ε = ε \(\circ\) α = α  zatem słowo puste ε jest jedynką działania \(\circ\)V× VV*. Inaczej mówiąc konkatenacja ze słowem pustym dowolnego słowa α ∈ Vnie zmienia tego słowa. Zbiór ∈ V* z działaniem konkatenacji \(\circ\)V× VV jest więc monoidem (czyli półgrupą z jednością). 

Widać natychmiast, że konkatenacja na ogół nie jest działaniem przemiennym w V*, ale zawsze jest działaniem łącznym, tzn. na ogół \(\cdot\) y ≠ y \(\cdot\) x  dla x, y ∈ V*, ale zawsze tzn. dla każdego x, y, z ∈ V*, mamy:

(\(\cdot\) y)  \(\cdot\) z  = x \(\cdot\) (y  \(\cdot\) z)

Język to dowolny podzbiór zbioru V*. Podzbiór ten można definiować na wiele sposobów np. za pomocą wyrażeń regularnych, notacją Backusa-Naura, gramatyką, automatem skończonym itd.. Wszystkie te sposoby poznamy w dalszym ciągu. Istnieje również wiele typów języków m.in. języki regularne, języki bezkontekstowe itd.

Jeśli V ={0,1} to zbiór {0,001 ,100001} jest językiem. 
Sam alfabet V jest również językiem ponieważ jest to zbiór wszystkich jednoliterowych słów nad alfabetem V
Zauważmy, że Vjest zbiorem przeliczalnym, zatem również każdy język jest co najwyżej zbiorem przeliczalnym.
Istota rzeczy: Jeśli weźmiemy kilka słów a może nieskończoną liczbę słów to mamy język. Możemy 2 słowa zestawiać razem tworząc nowe słowo. Nazywa się to konkatenacją.

Złożeniem dwóch języków K i L, gdzie K, LV* nazywamy język

KL \(\overset{df}{=}\) { x, y ∈ <em>V<sup>*</sup></em>;<em> </em>x, <em>y</em> ∈ <em>K</em> oraz <em>y</em> ∈ <em>L</em>}

Potęga języka. Potęgę Ljęzyka definiujemy indukcyjnie następująco

L\(\overset{df}{=}\) {ε}, L\(\overset{df}{=}\) L,  L\(\overset{df}{=}\) LLLn+1 \(\overset{df}{=}\) LLn, ... 

Potęga liter. Potęgę liter definiujemy indukcyjnie następująco. Niech a będzie dowolną ustaloną literą aVwówczas a\(\overset{df}{=}\) {ε}, a\(\overset{df}{=}\) aa\(\overset{df}{=}\) aa, ..., an+1 \(\overset{df}{=}\) aan, ... 

Potęga słów. Potęgę słów definiujemy indukcyjnie następująco. Niech w będzie dowolnym ustalonym słowem, wV*, wówczas w\(\overset{df}{=}\) {ε}, w\(\overset{df}{=}\) ww\(\overset{df}{=}\) ww, ..., wn+1 \(\overset{df}{=}\) wwn, ... 

Domknięcie języka (gwiazdeczka Kleen'a) L*. Niech V będzie ustalonym alfabetem a L językiem LV*. Domknięciem języka L nazywamy zbiór L* ⊂ V*, gdzie

L* \(\overset{df}{=}\) LL1 ∪ L2 ∪ ...,  ∪ Ln ∪ ...