Naším nejpřirozenějším komunikačním prostředkem je řeč. Pro hledání na internetu na počítačích a mobilech přesto nejčatěji používáme klávesnici. Hlavním důvodem je, že se přes více jak třicet let intenzivního vývoje ropoznávání řeči nepodřílo vytvořit spolehlivé uživatelské rozhranní. Díky nedávným objevům nových algoritmům se dosáhlo podstatného snížení chybovosti rozpoznávačů a zdá se, že se řeč konečně stane jedním z komunikačních kanálů. V přednášce se zmíním o technologiích a okolnostech, které vedly k tomuto posuvu a na něktrých aplikacích ukážu současné a budoucí trendy vývoje.
Jan Šedivý vyučuje a vede skupinu výzkumníků a doktorandů pracující v oblasti Conversational AI a zpracování přirozeného jazyka na ČVUT CIIRC, Praha, Česká Republika. Skupina vytvořila sociálního bota Alquist a odpovídač dotazů YodaQA. Alquist se dvakrát za sebou umístil druhý v Amazon Alexa Prize z více jak sto akademických týmů. V současnosti se skupina soustřeďuje na vývoj konverzačních aplikaci pro zdravotnictví. V letech 1992 – 2000 pracoval v IBM, T. J. Watson Research, NY, v USA. Od roku 2000 do roku 2008 byl manažer výzkumné skupiny v IBM ČR. V letech 2008 – 2010 byl manažerem vývojářů v Googlu ve Švýcarsku. V průběhu své praxe vedl mnoho projektů v oblasti AI, rozpoznávání řeči, NLP atd. Účastnil se několika evropských projektů a sám jeden vedl. Je autorem 19 amerických patentů a řady publikací z oblasti rozpoznávání řeči a NLP.