Generativní umělá inteligence na český způsob - rozhovor s Dianou Hlaváčovou ze Seznam.cz | EkonTech.cz


Generativní umělá inteligence na český způsob - rozhovor s Dianou Hlaváčovou ze Seznam.cz

Rozhovory / rozhovor / top zaměstnavatelé
28. 5. 2024 - 14:28

Společnost Seznam investuje desítky milionů korun do vývoje vlastních AI technologií. Projekt má zlepšit zpracování českého jazyka, ochránit uživatelská data a poskytnout uživatelům přesnější a rychlejší odpovědi. Jaké jsou další plány? Jaké výzvy přináší tento ambiciózní projekt a co přinese budoucnost, nám popsala Diana Hlaváčová, která stojí v čele produktového vývoje velkých jazykových modelů.

Seznam.cz aktivně pracuje na vývoji vlastních velkých jazykových modelů (LLM). Jaké byly hlavní důvody pro toto rozhodnutí a co mají přinést?

Naše motivace pro vývoj vlastních velkých jazykových modelů vychází z několika důvodů. Prvním je snaha o nezávislost na externích poskytovatelích. Vlastní technologie nám umožňuje mít plnou kontrolu nad jejich vývojem a implementací, což je klíčové pro udržení konkurenceschopnosti. Dalším důvodem je potřeba přizpůsobení modelů specifickým požadavkům českého jazyka a našich uživatelů, které komerční modely často nezohledňují. Navíc, vlastní LLM nám umožňuje lépe chránit data našich uživatelů a poskytovat rychlejší a přesnější odpovědi na jejich dotazy.

 

Jaké konkrétní výhody mají vlastní jazykové modely oproti komerčním řešením?

Vlastní modely nám poskytují flexibilitu a agilitu v reakcích na rychle se měnící trh a uživatelské požadavky. Můžeme je rychle upravovat a optimalizovat bez nutnosti vyjednávání s externími dodavateli. Pro zlepšení uživatelského komfortu jsou zásadní specifické úpravy pro češtinu, jako je rozpoznávání místních idiomů, správné skloňování a časování. To vše vede k vyšší spokojenosti našich uživatelů, která je pro nás prioritou.

 

Jakého pokroku jste dosáhli ve vývoji těchto modelů a jaké jsou další kroky v jejich vývoji?

Dosáhli jsme značného pokroku v oblasti porozumění a generování českého jazyka. V této oblasti nyní překonávají standardní LLM. Jen pro zajímavost: neformálně jsme jeden z nich nechali dělat přijímací řízení na osmileté gymnázium z českého jazyka a jeden z našich systémů by se na školu úspěšně dostal. Dalším nutným krokem je integrace těchto modelů do všech našich klíčových produktů, jako je vyhledávání, personalizace obsahu nebo interaktivní asistenti. Snažíme se také zlepšit jejich schopnosti v reálném čase a zároveň minimalizovat jejich požadavky na výpočetní zdroje.

 

Můžete popsat, jaké specifické výzvy přináší vývoj LLM pro český jazyk a jak tyto výzvy řešíte?

Čeština je jazyk s komplexní morfologií a složitým systémem skloňování a časování, což představuje výzvy pro strojové učení a zpracování přirozeného jazyka. Díky jazykovým modelům by se mohly transformovat odpovědi na vyhledávací dotazy. Chceme modelu předkládat relevantní data, abychom využili dostupné zdroje a zároveň jazykové kapacity modelů.

---------------

DIANA HLAVÁČOVÁ

Vystudovala obor Business Administration and Management na VŠE. V Seznamu působí dva roky, a než se dostala do čela vývoje velkých jazykových modelů, pracovala na algoritmu, který při internetovém vyhledávání řadí výsledky podle jejich relevance.