155IN4G Informatika 4: Porovnání verzí
mBez shrnutí editace |
|||
(Není zobrazeno 8 mezilehlých verzí od 2 dalších uživatelů.) | |||
Řádek 1: | Řádek 1: | ||
{{ | == Základní údaje o předmětu== | ||
* '''Aktuální a kompletní informace jsou na této stránce''' | |||
* Kód předmětu: 155IN4G | |||
* Garant předmětu: {{Lidé|Ing. Jan Pytel, Ph.D.}} | |||
* Přednášející: {{Lidé|Ing. Jan Pytel, Ph.D.}} | |||
* Rozsah: 2+2 | |||
* Počet kreditů: 5 | |||
* Ukončení: z, zk | |||
== Anotace == | == Anotace == | ||
V rámci předmětu jsou studenti seznámeni s technikami zpracování velkého množství dat. Nejprve se naučí jak předzpracovávat data v příkazovém řádku před importem do DB. Důraz je kladen na relační databáze a témata, která nebyla zmíněna během předmětu Informatika 2: indexy, exekuční plány, partitioning. Poté studenti dostanou základní informace o NoSQL databázích, ElasticSearch, R a cloudu. | |||
=== Doporučená literatura === | === Doporučená literatura === | ||
== | == Harmonogram == | ||
Vyučující: {{lide|Ing. Jan Pytel, Ph.D.}} | |||
# BigData - vývoj a koncept | |||
# Preprocesing dat v příkazovém řádku | |||
# Preprocesing dat v příkazovém řádku 2 | |||
# Relační databáze - indexy, partitioning, ladění výkonu ACID | |||
# NoSQL databáze - koncept, odlišný přitup oproti relačním databázím | |||
# NoSQL databáze - Apache Cassandra | |||
# NoSQL databáze - grafové databáze (Neo4j), dokumentově orientované databáze | |||
# Základy cloudu | |||
# Instalace NoSQL databáze do cloudu - praktická ukázka redundance, CAP Theorem | |||
# Apache ekosystém I: Hadoop, HBase, Sparc, Pig | |||
# Fultextový vyhledávač ElasticSearch | |||
# Statistický jazyk R - využití při zpracování velkého množství dat | |||
# Statistický jazyk R - spojení s Apache Spark, praktické ukázky | |||
== Odkazy == | == Odkazy == | ||
* Apache Cassandra/Hadoop/HBase/Sparc/Pig - http://www.apache.org/ | |||
* Neo4j - https://neo4j.com/ | |||
* ElasticSearch - https://www.elastic.co/ | |||
* Language R - https://www.r-project.org | |||
{{Geoinformatika}} | {{Geoinformatika}} |
Aktuální verze z 6. 10. 2023, 21:01
Základní údaje o předmětu
- Aktuální a kompletní informace jsou na této stránce
- Kód předmětu: 155IN4G
- Garant předmětu:
- Přednášející:
- Rozsah: 2+2
- Počet kreditů: 5
- Ukončení: z, zk
Anotace
V rámci předmětu jsou studenti seznámeni s technikami zpracování velkého množství dat. Nejprve se naučí jak předzpracovávat data v příkazovém řádku před importem do DB. Důraz je kladen na relační databáze a témata, která nebyla zmíněna během předmětu Informatika 2: indexy, exekuční plány, partitioning. Poté studenti dostanou základní informace o NoSQL databázích, ElasticSearch, R a cloudu.
Doporučená literatura
Harmonogram
Vyučující: Ing. Jan Pytel, Ph.D.
- BigData - vývoj a koncept
- Preprocesing dat v příkazovém řádku
- Preprocesing dat v příkazovém řádku 2
- Relační databáze - indexy, partitioning, ladění výkonu ACID
- NoSQL databáze - koncept, odlišný přitup oproti relačním databázím
- NoSQL databáze - Apache Cassandra
- NoSQL databáze - grafové databáze (Neo4j), dokumentově orientované databáze
- Základy cloudu
- Instalace NoSQL databáze do cloudu - praktická ukázka redundance, CAP Theorem
- Apache ekosystém I: Hadoop, HBase, Sparc, Pig
- Fultextový vyhledávač ElasticSearch
- Statistický jazyk R - využití při zpracování velkého množství dat
- Statistický jazyk R - spojení s Apache Spark, praktické ukázky
Odkazy
- Apache Cassandra/Hadoop/HBase/Sparc/Pig - http://www.apache.org/
- Neo4j - https://neo4j.com/
- ElasticSearch - https://www.elastic.co/
- Language R - https://www.r-project.org