Telerik Academy

Сподели тази страница

Агентни системи | Agent Systems

Минало събитие

Ще получите базисни познания в областта на агентните системи и подсиленото самообучение (Reinforcement Learning). Ще научите какво е "агент", какво е рационално мислене и как да постигате оптималност при избора на действията. Ще се потопите в дебрите на подсиленото самоубочение и ще придобиете основни познания относно процеса за решенията на Марков (Markov decision process) и уравненията на Белман.

Семинарът ще завърши с реализирането на практически проект. Ще имате възможност индивидуално или в група от двама. трима или четирима човека да имплементирате алгоритъм, който да се самообучи да играе Морски шах. Алгоритъмът, изправен срещу естествен противник - човек, трябва винаги да побеждава или да води играта до реми.

Изискванията към желаещите да участват в този курс са: основни познания по програмиране и аналитични умения. Няма допълнителни изисквания към езика за програмиране, стига той да е от високо ниво.


Вижте видео от семинара "Агентни системи"

 


Какво представляват агентните системи?
Агентните системи са автономни единици, които следят околната среда чрез сензори и реагират по начин, по който могат да постигнат предварително зададени цели. Агентните системи могат да се самообучават, което определя и широката им употреба в практиката:

  • Управление на процеси, SCADA;

  • Роботика;

  • Автономни автомобили;

  • GoogleAdSense - за определяне на кого да се показват рекламите и колко да струва една реклама;

  • E-bay агенти - агенти, които наддават вместо вас, Sniper bid- наддаване в последният момент;

  • Сензорни мрежи;

  • За охрана и военни цели;

  • Автономно управление на сфетофарна система в един град - система, която сама решава колко дълъг да е всеки сигнал, в зависимост от натовареността на трафика.


Семинар за "Агентни системи" - програма

Час Лекция

09:40 – 10:00

Настаняване

10:00 – 10:45

Въведение в Изкувствения интелект. Какво е агент? Какво е агента система?

10:45 – 11:00

Почивка

11:00 – 11:45

Кратка история и възникване на едноагентните системи. Динамично програмиране. Монте-карло алгоритми. Уравнения на темпоралните разлики.

11:45 – 12:00

Почивка

12:00 – 12:45

Рационални агенти. Състояния на средата. Видимост. Свойството на Марков. Цели. Функции на прехода и Награди.

12:45 – 13:00

Почивка

13:00 – 13:45

Самообучение. Q-самообучение. Уравнения на Белман. ( уравнението на Белман е основна част от Q-самообучението )

13:45 – 15:00

Обяд

15:00 – 19:00

Задаване на проекта. Имплементация.

Лектор

  • Стефан Ставрев

    Собственик и управител на TRI Soft Ltd.

    С над 3 години опит в проектирането и разработването на интелигентни системи и игри, и трудов стаж в научната компания TNO - основен партньор на Холандското министерство на отбраната. Понастоящем Стефан Ставрев се занимава с разработката на иновативни автономни системи, компютърно зрение, разпознаване на лица и разработване на игри. Изкувственият интелект и модерните технологии за него са не просто академични дисциплини, а и начин на мислене. В свободното си време обича да преподава. Води избираеми курсове в Пловдивския университет "Паисий Хилендарски".

     LinkedIn Blog

Ключови думи: агент, агентна система, agent systems, мулти-агентните системи, изкуствен интелект, самоубочение, reinforcement learning, стефан ставрев,