Страница:
21 из 82
Всеэто относится к механическому игроку, который не обучается в ходе игры. Однако ничто не мешает ему научиться играть более разумно. С этой целью он должен сохранять в своей памяти записи прошлых игр. Затем в конце каждой игры или каждой серии игр определенного типа его механизм должен перестраиваться на совершенно иной образ действий.
При формировании показателя эффективности (оценочной функции) в него вводятся некоторые константы, которые можно выбирать различным образом. Так, например, соотношение констант, соответствующих относительной силе фигур, их подвижности и эквивалентному числу, может составлять 10:3:2 вместо 9:4:4. Новый способ применения регулируемой машины состоит в изучении проведенных игр, с тем чтобы, учитывая их исход, найти соответствующие им показатели эффективности (оценочные функции), отражающие динамику этих игр.
Таким образом, оценочная функция подвергается непрерывной переоценке, при которой более высокое значение этой функции присваивается позициям, характерным для выигранных партий, и меньшее значение – позициям, свойственным большей частью проигранным партиям. Игра должна продолжаться уже с новым значением оценочной функции, которая может быть определена различными способами, отличающимися лишь в деталях. В результате этого игровой автомат будет непрерывно преобразовываться в некую отличную от исходной машину в соответствии с историей развертывающейся игры.
|< Пред. 19 20 21 22 23 След. >|