Základy programování (IZP)

Na této stránce je můj elektronický sešit do předmětu IZP. Při jeho vytváření jsem čerpal informace z přednášek a ze studijní opory k předmětu IZP od RNDr. Jitky Kreslíkové, CSc. a Ing. Davida Martinka.

Tématické okruhy

Algoritmy a řešení problémů: strategie řešení problémů, strukturovaná dekompozice, pojem a vlastnosti algoritmu.
Základní programovací konstrukty: syntaxe a sémantika vyššího programovacího jazyka, definice proměnných, datové typy, výrazy, řídicí struktury, podprogramy, předávání parametrů, vstupy/výstupy.
Základní datové struktury: primitivní datové typy, přiřazení, implicitní typová konverze, explicitní typová konverze.
Strukturované datové typy: pole, struktura, soubor, znakové řetězce.
Alokace paměti: základní typy alokace paměti, jejich princip a použití.
Proměnné a konstanty: druhy, umístění v paměti.
Dynamické datové struktury, typ ukazatel.
Hodnocení složitosti algoritmů.
Algoritmy pro vyhledávání: sekvenční vyhledávání, vyhledávání v neseřazeném a v seřazeném poli, vyhledávání se zarážkou, binární vyhledávání.
Metody řazení: vlastnosti, principy, Select-sort, Insert-sort, Bubble-sort a jeho varianty.
Rekurze: princip rekurze, rekurze v programování, jednoduché rekurzivní funkce.
Modulární návrh a abstrakce.
Dokazování správnosti programů: částečná a úplná správnost, invarianty, konvergence, průběžné dokazování.

Etapy programování

Formulace úlohy
Analýza úlohy
Návrh řešení
Sestavení algoritmu řešení - vývojový diagram, pseudokód, ...
Kódování programu
Odladění - sada testů, porovnání výsledků se specifikací
Optimalizace - zrychlování výpočtu, snižování paměťových nároků - bez změn návrhu!!

Algoritmus: Algoritmus je přesně definovaná konečná posloupnost kroků, jejichž prováděním pro každé přípustné vstupní hodnoty získáme po konečném počtu kroků odpovídající hodnoty výstupní.

Data: Hodnoty nějakého datového typu. (volná definice)

Informace: Data, která mají definovanou sémantiku. (volná definice)

Program: Program je předpis, podle kterého je počítač (nebo jiný výkonný prvek - procesor) schopen provádět výpočty nějakého algoritmu.

Procesor: Procesor je prvek, kterému je svěřeno vykonávání algoritmu.

Strategie řešení problémů

Dekompozice: Dekomponovat znamená najít v složitém problému takové hierarchické uspořádání, které umožní zapsat složité akce pomocí akcí jednodušších. Ty mohou být stejným způsobem redukovány na akce ještě jednodušší. (metoda shora dolů)

Abstrakce: Abstrakce je koncepční zjednodušení složitého problému ignorováním detailů. Pojmenováním akcí a dočasným ignorováním detailů je možné celý složitý problém řešit po částech. Abstrakce tedy umožňuje oddělit jádro řešeného problému od detailů. (metoda zdola nahoru)

Datová abstrakce: S daty lze manipulovat bez znalosti jejich vnitřní implementace.

Konstrukci programů lze logicky rozdělit na dvě části:

Datové struktury - specifikace dat
Řídící struktury - algoritmy

Vlastnosti algoritmů

Rezultativnost = konečnost: Úloha musí být vyřešena po konečném počtu kroků.; Každý algoritmus musí někdy skončit.

Hromadnost = obecnost: Jedním algoritmem lze řešit celou třídu úloh stejného druhu.; Algoritmus musí vyřešit zadanou úlohu pro libovolně zadané vstupní hodnoty.

Determinovanost: Algoritmus musí být zadaný ve formě konečného počtu jednoznačných pravidel. (Program nesmí mít žádnou slepou cestu.)

Vyjádření algoritmů

Slovní popis
Vývojové diagramy
Rozhodovací tabulky (seznam podmínek, seznam činností, kombinace)

Strukturované programování

Zaznamenání algoritmu (Dijkstra)

Sekvence = posloupnost
Selekce = větvení (if, if-else, switch)
Iterace = cyklus (while, do-while, for)

Programovací jazyky

Syntaxe

Syntaktické diagramy

Terminální symbol: Znak, klíčové slovo, ...; Zapisuje se v kroužku nebo oválku.

Nonterminální symbol: Dále se rozvádí podle diagramu.; Zapisuje se v obdélníku.

BNF = Backus-Naurova Forma: Textový zápis syntaxe, stejná vyjadřovací schopnost jako syntaktický diagram.; <> - Úhlové závorky značí nonterminály; = - Definiční znak; | - Odděluje jednotlivé varianty --> seznam variant; ...

EBNF = Rozšířené BNF: Zjednodušuje zápis, ale nezvyšuje vyjadřovací schopnost.; {} - opakování 0 až n; [] - nepovinný řetězec symbolů; () - seskupování konstrukcí

Sémantika: viz. IAL - Sémantika ADT

2. Principy vyšších programovacích jazyků

Datové struktury

Pro stejné operace nad daty vedou některé struktury k více či méně efektivním algoritmům než jiné. Volba algoritmu a volba datové struktury jsou navzájem propojeny a správným výběrem se snažíme najít cesty k úspoře času a místa.

Jsou-li všechny komponenty dané struktury téhož typu, označujeme strukturu homogenní, v opačném případě heterogenní.

Statická datová struktura: Nemůže v průběhu výpočtu měnit počet svých komponent ani způsob jejich uspořádání.

Dynamická datová struktura: Může v průběhu výpočtu měnit počet svých komponent a způsob jejich uspořádání.

Vlastnosti datových struktur je třeba posuzovat na určité úrovni abstrakce. Na úrovni stroje jsou data vždy homogenní a statická.

Datové typy

Datový typ: Datový typ je definován množinou hodnot, které může nabývat a množinou operací nad ním definovaných.; Typ proměnné/konstanty je určen při její deklaraci/definici. Typ výrazu je dán operátory a operandy, které jsou ve výrazu použity.; Příslušnost k typu je syntaktickou vlastností objektu.

Kardinalita datového typu: Počet různých hodnot, které může datový typ nabývat.

Primitivní typ: Hodnoty primitivního typu lze definovat výčtem (enumerací).

Standardní typy: Standardní typy jsou předdefinovány programovacím jazykem.

Strukturované datové typy

pole
struktura (záznam)
množina
soubor

Typový systém: Typovým systémem programovacího jazyka rozumíme soubor pravidel, která přiřazují výrazům typ.; Typový systém nazveme silným, pokud akceptuje pouze typově bezpečné výrazy. Typový systém, který není silný, se nazývá slabý.

Lexikální jednotky jazyka C

Rezervované slovo
Identifikátor
Konstanta
Řetězcový literál
Oddělovač

Pojmenované konstanty

Pomocí preprocesoru - #define
Pomocí výčtu - klíčové slovo enum
Pomocí konstantní proměnné - klíčové slovo const

Proměnné a deklarace

Datový objekt(nesouvisí s OOP) je obecné označení jakéhokoliv údaje uloženého v paměti.

Paměťová místa, ve kterých uchováváme data, označujeme proměnné.

Deklarace proměnné: Deklarace proměnné je konstrukce, která přidělí proměnné jméno a typ, ale nevytvoří ji.

Definice proměnné: Definice proměnné kromě jména a datového typu přidělí proměnné i paměťový prostor.

Operátory a výrazy

Výraz: Výraz je konstrukce jazyka, která má hodnotu. (nějakého datového typu); Část výrazu, na kterou je aplikován jeden z operátorů, se nazývá operand. Operandem může být opět výraz, někdy se operandům říká podvýrazy.; Operátor určuje, jakým způsobem se z operandů získá hodnota. Pořadí vyhodnocování podvýrazů je dáno prioritami operátorů nebo závorkami.

Operátor přiřazení: Operátor přiřazení (=) kopíruje hodnotu na své pravé straně do L-hodnoty na své levé straně.; L-hodnota je objekt v paměti, kterému lze přiřadit hodnotu.; R-hodnota je výraz, který má hodnotu a vystupuje na pravé straně přiřazovacího příkazu.; Přiřazení je v jazyce C definováno jako operátor, výsledkem je tedy opět R-hodnota.

Operátor čárka: Tento operátor zřetězuje dva výrazy a zajišťuje přesné pořadí jejich vyhodnocení zleva doprava. Nabývá hodnoty nejpravějšího podvýrazu.

3. Řízení chodu programu

Prototyp funkce: Prototyp funkce deklaruje funkci před jejím použitím a před tím než je definována.

4. Typ ukazatel, strukturované datové typy

Ukazatel: Ukazatel je proměnná která obsahuje paměťovou adresu. Jeho hodnota říká, kde je nějaký objekt uložen.; Součástí deklarace ukazatele je informace o typu dat, která jsou na uložené adrese očekávána.; Pojmem dereference ukazatele rozumíme zpřístupnění objektu, na který ukazatel ukazuje.

Konstantní ukazatel

Ukazatel na konstantu

Obecný ukazatel

Konverze ukazatele

Ukazatelová aritmetika

Vícenásobná dereference

Paměťový prostor

Kódová oblast
Oblast statických dat
Hromada
Zásobník

Operátor sizeof()

Únik paměti (memory leak)

Pole

Pole je kolekce proměnných stejného typu. Jednotlivá proměnná v poli se nazývá prvek pole. K prvkům pole se přistupuje prostřednictvím identifikátoru pole a indexu.

Rozměr globálního pole je nutné zadat prostřednictvím literálu.

Vícerozměrné pole: Vícerozměrné pole řádu n je v jazyce C definováno jako jednorozměrné pole řádu n-1.

Použití ukazatelů pro práci s poli: Použití samotného identifikátoru pole má stejný význam jako použití konstantního ukazatele na první prvek pole.; Hodnotu ukazatele tvořeného jménem pole nelze měnit.

5. Výčtový typ, strukturované datové typy

Specifikátor typedef

Specifikátor typedef slouží k vytvoření nového označení datového typu. Používá se pro zvýšení přehlednosti programu. Pozor: typedef není operátor, ale specifikátor.

Výčtový typ

V jazyce C lze definovat sadu pojmenovaných celočíselných konstant, nazývanou výčet. Výčtový typ je kompatibilní s celými čísly, tyto konstanty lze tedy používat jako celočíselné konstanty.

Datový typ struktura

Struktura je odvozený datový typ, který může obsahovat datové složky různého typu. Říkáme, že jde o heterogenní datový typ.

Kompatibilita struktur: Vytvoříme-li dvě struktury se stejnými složkami, budou to dva různé (nekompatibilní) typy.

Operátor přiřazení: Nad datovým typem struktura je definován operátor přiřazení. Obsah jedné struktury lze tímto operátorem přiřadit jiné, pokud jsou obě stejného typu. V tomto případě se provádí tzv. mělká kopie.

Struktura odkazující sama na sebe: Pokud musí struktura odkazovat sama na sebe, nelze k tomu použít identifikátor vytvořený pomocí typedef.

Předávání struktury: Návratovou hodnotou funkce může být struktura. Struktura může být také předána funkci jako parametr. Předávání (větší) struktury hodnotou je však neefektivní, proto se dává přednost ukazateli na konstantní strukturu.

Práce se soubory

Standardní vstup/výstup: Během inicializace programu v jazyce C se automaticky otevírají tři soubory: stdin, stdout, stderr. Standardní vstup/výstup se používá zejména u programů, které zpracovávají data proudovým způsobem. Takovým programům se někdy říká filtry.

Vstup/výstup znaků: int getchar (void);
int putchar (int);

Formátovaný výstup - funkce printf(): Formátovací specifikace začínají znakem %, za ním následují nepovinné parametry (šířka, přesnost, ...) a povinný parametr - konverze (%d, %f, %s, ...).

Formátovaný vstup - funkce scanf(): Stejné formátovací specifikace jako u printf(), všechny parametry se předávají odkazem.

Datový typ soubor

Se soubory se pracuje pomocí datového typu FILE*. Jazyk C rozlišuje dva druhy souborů - textový a binární. V textovém souboru lze pracovat s jednotlivými řádky textu nezávisle na typu OS.

Otevření a uzavření souboru: FILE *fopen (const char *name, const char *mode);
int fclose (FILE *file);

Mód otevření souboru

`"r"`	čtení
`"w"`	zápis nebo přepsání
`"a"`	připojení na konec
`"r+"`	čtení a zápis
`"w+"`	čtení, zápis nebo přepsání
`"a+"`	čtení a zápis na konec

Pro práci s binárním souborem se k řetězci, který udává mód, přidá prefix "b"

Souborový vstup/výstup po znacích: int getc (FILE*);
int putc (int, FILE*);

Formátovaný vstup/výstup nad soubory: int fscanf (FILE *, const char *, ...);
int fprintf (FILE *, const char *, ...);

Souborový vstup/výstup po řádcích: char *fgets (char *dest, int max, FILE*);
int fputs (char *src, FILE* file);

Testování chyb: // Vrací 0, pokud nedošlo k chybě
int ferror (FILE *);; Konkrétní kód chyby lze přečíst z globální proměnné errno typu int deklarované v errno.h.

6. Řešení rekurentních problémů

Pokud problém vede na iteraci, kde každý krok iterace závisí na výsledku z předchozí iterace, říkáme problému rekurentní.

Rekurentní vztah: Následující hodnota je funkcí hodnot předchozích. Musí existovat konečný počet iterací, po jejichž provedení výpočet skončí.

Posloupnosti: B(y) - predikát, který říká, že výsledná hodnota splňuje podmínky (např. přesnost).; y = y0; while (!B(y)) y = F(y);

Algoritmické schéma: Algoritmickou konstrukci, ve které jsou uvedeny pouze symboly proměnných, funkcí a predikátů, nazýváme algoritmické schéma.

Řady

Aproximace funkcí: Přibližný výsledek funkce se aproximuje částečným součtem řady. Ukončení algoritmu je založeno na požadavku na přesnost aproximace. Ta je vyjádřena zpravidla přírůstkem, tj. posledním členem řady v dané iteraci.

Heuristika

Vstupní data pro aproximaci funkce je potřeba předzpracovat tak, aby vlastní výpočet probíhal v tom nejvýhodnějším intervalu. Opatřením, které vedou ke snížení náročnosti výpočtu a ke zvýšení efektivity, se říká heuristika.

7. Rekurzivní metody v programování

Rekurze: Rekurze je způsob specifikace části počítačového programu odkazem na sebe.; IAL - rekurze; Každou rekurzi lze nahradit iterací a naopak. Iterace bývá často efektivnější, rekurzi lze zase někdy zapsat průzračnějším algoritmem.

Rekurzivní funkce

Přímá - např. výpočet binomického koeficientu
Nepřímá

Víme...

Hanojské věže

Přeneseme N-1 horních disků z A na B s použitím C jako odkládací jehly.
Přeneseme největší disk zbylý na A na jehlu C.
Přeneseme věž s N-1 disky z B na C s použitím A jako odkládací jehly.

8. Složitost algoritmů

IAL - Složitost algoritmů

Dolní odhad složitosti: Dolní odhad složitosti určuje ideální složitost algoritmu, tj. jeho nejrychlejší možné provedení.

Průměrná složitost (očekávaná složitost): Průměrná složitost se spočítá jako střední hodnota náhodné složitosti při určitém rozložení vstupních dat.

9. Algoritmy pro práci s vektory a s maticemi

Skalární součin
Vektorový součin

Eratosthenovo síto

Eratosthenovo síto je efektivní algoritmus pro hledání všech prvočísel od 2 do N.

Vytvoříme bitové pole, pro každé přirozené číslo v rozsahu od 2 do N vyhradíme 1 bit. Index pole udává číslo, položka nabývá hodnoty 1, je-li číslo prvočíslo.
Pole je inicializováno samými jedničkami.
Procházíme prvky pole a hledáme první nenulový bit.
Nalezené číslo (P) je prvočíslo, necháme na jeho místě jedničku. Potom na místa všech násobků P zapíšeme nuly.
Cyklus opakujeme tak dlouho, dokud není P větší než odmocnina z N.

Matice

Soubor čísel uspořádaných do řádků a sloupců nazýváme maticí.

Matice je nulová, když jsou všechny její prvky rovny nule. Matice je jednotková, když jsou prvky hlavní diagonály rovny jedné a všechny ostatní prvky jsou rovny nule.

Transponovaná matice k matici A vznikne záměnou řádků matice A za sloupce, značíme AT. Matice je symetrická, je-li čtvercová a platí A == AT.

Násobení matic

10. Algoritmy pro vyhledávání a řazení

IAL - Vyhledávání

Sekvenční vyhledávání: Vyhledávaná struktura se prochází sekvenčně.

Index-sekvenční vyhledávání: (ISAM = Index Sequential Access Method) Přímým přístupem se nalezne blok a v něm se sekvenčně dohledá požadovaná položka.

Nesekvenční vyhledávání: IAL - Binární vyhledávání v seřazeném poli

Vyhledávání v uspořádaných stromech: IAL - Binární vyhledávací strom

Tabulky s rozptýlenými položkami: IAL - Tabulky s rozptýlenými položkami

Algoritmy pro řazení

IAL - Řazení

12. Verifikace algoritmů

O algoritmu lze tvrdit, že je správný, když lze dokázat, že je správný vzhledem k zadání.

IAL - Dokazování správnosti algoritmu

Částečná správnost: Skončí-li algoritmus, pak je výsledek vždy správný. To znamená, že algoritmus nemusí s končit pro všechny korektní vstupy v reálném čase.

Úplná správnost: Je-li algoritmus částečně správný a skončí-li pro libovolné vstupní hodnoty, pak je úplně správný.

Průběžné dokazování (As-You-Go): Průběžné dokazování je založené na dekompozici problému na malé (snadno dokazatelné) celky a postupné syntéze algoritmů spojené s vytvářením prostředků pro vedení důkazu.

Automatizovaná verifikace

Automatizovaná verifikace se používá hlavně u paralelních programů, kde je nutné řešit synchronizační problémy. Existují dva základní přístupy k automatizované verifikaci - theorem proving a model checking.

Theorem proving: Theorem proving je obdoba dokazování programu člověkem. Nástroje si vedou přesnou evidenci použitých zákonů logiky, apod. Důkaz však musí vést člověk.

Model checking: Model checking je založený na systematickém generování a zkoumání všech programem dosažitelných stavů.

13. Algoritmy pro numerické výpočty

Mnohočlen = polynom: Víme...

Hornerovo schéma: Hornerovo schéma představuje efektivní algoritmus pro výpočet hodnoty polynomu v bodě.

Výpočet určitého integrálu

Obdélníková metoda

Lichoběžníková metoda

Simpsonova metoda: Používá se konstantní šířka a sudý počet aproximačních intervalů. Tři sousední body křivky se vždy aproximují vhodnou parabolou. Metoda vykazuje velmi dobré výsledky (přesnost) již při velmi nízkém počtu intervalů.

14. Modulární výstavba programů

Modularita: Modularita představuje obecně vyšší stupeň strukturovanosti programu. Modularita usnadňuje dekompozici problému na jednodušší části - moduly.

Modul: Modul tvoří samostatnou jednotku, kterou lze samostatně kompilovat a opakovaně využívat. S moduly se pracuje pomocí jejich rozhraní, samotná implementace jednotlivých operací je skryta.

Rozhraní modulu: Rozhraní modulu definuje vývoz (export) a dovoz (import) modulu, víme...