Главная фишка в том, что обычно нейросети учатся заранее, а потом работают с фиксированными правилами.
Здесь же нейросети учатся прямо во время жизни. Как живые организмы адаптируются к изменениям среды — так и эти агенты постоянно меняют свою «стратегию поведения» через градиентный спуск.
Это модель того, как из простых правил + конкуренции + способности учиться может возникать настоящая открытая эволюция — бесконечное усложнение и появление новых форм поведения. Как в настоящей жизни.
Самое крутое в этой работе —
из чисто эгоистичной конкуренции спонтанно возникает кооперация. Это говорит что-то глубокое о том, как в природе из конкурентной борьбы за выживание появляется симбиоз и сотрудничество.


