Добавлен Vlod,
опубликован
Начало
Продолжая тему ИИ и при желании пользователей запускаем челлендж-марафон:
- Каждому участнику предлагается самому посмотреть на технологию самообучения и собрать свой ии.
- Во время проведения турнира лучшие экземпляры собираются, оцениваются и снова раздаются участникам.
- В это время игроки могут делиться впечатлениями, предлагать идеи, оставлять обратную связь и т.д. Некоторые поправки могут включаться прям во время марафона.
- По итогу участники получат лучший найденный ии, опыт работы с ним и весь исходный код.
Что надо делать?
— Минимальный набор действий это: скачать карту, запустить на ~30+ минут. Ввести слово "save". Дождаться появления файла по пути ./save/GA_test_01/Cod.txt. Скинуть. Лучший найденный скидывается вам обратно. И так несколько раз =)
Кратко об ии
— Каждый объект представляет собой кольцевую цепочку команд. Каждая команда является точкой на отрезке. Проекция дерева решений на отрезок однозначно соотносит точку и конкретное решение.
Примерный список команд
- Сравнить
- Число
- Юнит (случайный, ближайший, дохлый)
- Жизнь
- Дистанция
- Количество
- Зомби (...)
- Жизнь
- Дистанция
- Количество
- Я
- Жизнь
- Отклонение времени
- Отклонение времени2
- Кольцо
- Положение
- Дистанция
- Центр
- Дистанция
- Сделать
- Я
- Остановится
- Инвиз
- Юнит (...)
- Бежать
- Атаковать
- Проколоть
- Зомби (...)
- Бежать
- Атаковать
- Проколоть
- Зона
- К
- От
- Вправо
- Влево
- Пространство
- Наверх
- Вниз
- Направо
- Налево
- Я
Другие вопросы
Как сохранить ИИ?
Для сохранения лучшего экземпляра введите слово "save". Файл кода будет лежать в папке варкрафта ./save/GA_test_01/Cod.txt
Для сохранения лучшего экземпляра введите слово "save". Файл кода будет лежать в папке варкрафта ./save/GA_test_01/Cod.txt
Могу я сохранить понравившийся ии?
Да, для этого нажмите на юнита и введите слово "s save". Код сохранится, даже если юнит умрет до конца условного раунда.
Да, для этого нажмите на юнита и введите слово "s save". Код сохранится, даже если юнит умрет до конца условного раунда.
Можно загрузить сохраненный ии?
Да, введите слово "download". В начале следующего раунда он будет загружен и подключен.
Да, введите слово "download". В начале следующего раунда он будет загружен и подключен.
Ехало
Первое видео
Задача - прожить как можно дольше
Приветствую вырезки интересного поведения, а также предложения по улучшению обучающей среды и внутренних механизмов.
Скачать:
v02 Динамичное кольцо:
03 KodG3_king of the mountain.w3x оцениваются убийства и количество выживших
Можете улучшить готовый вариант или собрать свой с нуля Cod.txt
v02 Динамичное кольцо:
03 KodG3_king of the mountain.w3x оцениваются убийства и количество выживших
Можете улучшить готовый вариант или собрать свой с нуля Cod.txt
v01 Статичное кольцо:
02 KodG3_kill_and_life.w3x оцениваются убийства и жизни
01 KodG3_only_kill.w3x оцениваются только убийства
Пишите, какую разницу в поведении юнитов обучаемых разным способом вы заметили.
02 KodG3_kill_and_life.w3x оцениваются убийства и жизни
01 KodG3_only_kill.w3x оцениваются только убийства
Пишите, какую разницу в поведении юнитов обучаемых разным способом вы заметили.
`
ОЖИДАНИЕ РЕКЛАМЫ...
Чтобы оставить комментарий, пожалуйста, войдите на сайт.
Отредактирован MpW
у эльфов 3-4 прохода, база огорожена деревьями
у альянса 2 прохода, база огорожена клиффами, удобно пристроились
орки 3 прохода окружена скалами
Сколько проходов, а дурачки-скелетосы прутся через основной. Им не хватает мозгов действовать неординарно. Они всегда идут по короткому пути. И брать всякие тактики. Нападать скопом в менее защищенные точки, отвлекать, атаковать/херачить воздухом, катапультами. Но и с защитой у ИИ нежити проблема. у нежити много производных здании, и для ослабления натиска нежити нужно их сносить. Но не всегда защищает.
Отредактирован Vlod
Отредактирован ScorpioT1000
тут бы помогло обучение с подкреплением, а не отбором лучших результатов с каждой генерацией
Отредактирован Vlod
Причем тут back propagation и представленный код-геном, где цепочка команд, как днк, а не веса нейросети. Какое обучение с подкреплением, откуда мы знаем, какое поведение лучше, а какое не лучше. Если необходимое поведение известно заранее, то не проще ли его вбить сразу и не париться с самообучением?
Челлендж завершен, всем спасибо!