главная турниры статьи wiki карта сайта логин
 

ladder и ожидание выигрыша

Автор wieker, июля 30, 2011, 09:44:00

« назад - далее »

0 Пользователи и 1 гость просматривают эту тему.


wieker

как известно wesnoth игра, в которой объективная сила игроков определяется только после серии игр и накопления достаточной статистики. кубок очень плох - выбросы могут решить исход, но с другой стороны кубок очень жизненный. ladder много лучше в плане выявления силы, но страдает одним изъяном - для корректного определения сильнейшего необходима случайно выбранная выборка потивников. если распределения различны, результаты могут быть не объективны.

что полразумевается под одинаковой выборкой? противник не выбирает себе противников, а играет с кем придется. если противник играет только со слабыми - он прокачается. и наоборот. elo рейтинг это должен учитывать, так как дает за победу над более слабыми играоками меньше баллов. из чего исходили создатели elo рейтинга я не знаю, надо будет погуглить. пока же попытаюсь вычислить функции ожидания победы над X-ранговым противником для каждого игрока.

в общем виде данные о победах можно представить в виде функции f(X) = число побед, где X - опыт игрока с кем сыгран матч.
подгонять функцию для начала можно попробовать методом наибольшего правдоподобия, с нормальным распределением. потом можно будет применять более корректные методы, учитывающие переобучение модели и вид распределения случайной составляющей.

пока же использую в качестве факторов регрессии полиномы, как самый простой вариант для моделирования

полученная функция (как я надеюсь) позволит предсказывать матожидание победы конкретного ladder игрока над игроком с опытом X. посмотрим, что из этого получится и будут ли результаты правдоподобны. а если нет, буду искать другие модели.
Jabber:
xmpp:[email protected]


nagafono

ну начнем с того, что elo-рейтинг был  унаследован из шахмат, где являлся неким показателем шахматного звания (подробнее - на википедии). так вот, там, при разнице в рейтинге в несколько сотен пунктов, более высокий по званию игрок в случае получал настолько мало очков, что ими просто можно было бы пренебречь. так вот, в шахматах, на сколько я помню (очень давно уже не играю и не интересуюсь), более-менее профессиональные турниры проводятся именно в соответствии с рейтингом. в ладдере же сама суть эло искажена, т. к. в ней просто нет никакого реального смысла, кроме как примерно оценить силу игрока. хотя это тоже далеко не всегда отражает действительность. ну да обо всём по порядку.

итак, можно заметить, что распределение рейтинга выглядит довольно странно. возьмем, например, игроков с рейтингом 1500 (не новичка) и 2000. при победе более сильного игрока, проигравший получит -11 +-1 рейтинга. что это значит? это значит, что для того, чтобы восстановиться до предыдущего рейтинга (до поражения), ему достаточно победить игрока с рейтингом 1350-1400. отсюда вопрос: показателем чего тогда является ладдер от таких чисел?? ситуация на столько абсурдна, что даже комментировать нет смысла.  осбоенно если учесть, что те же -11 +-1 получит игрок с рейтингом 1750. лично я вообще здесь не то что зависимости, логики не вижу. подобных примеров на ладдере множество.

продолжение следует...

Exper

ну вроде бы хай рейтинг получает мизер за челов с рейтингом -500 от победившего)
Ворон, тут останется память о тебе.


nagafono

касательно местечковых странностей, вроде +-30-50 пунктов у новичков я касаться не буду, перейду на другие моменты. на сколько я понял ладдер учитывает зависимость не только от текущего рейтинга, но и от количества сыгранных партий. однако сложно сказать ,на сколько текущая зависимость эффективна. возьмем например игрока kezz как мы видим, в лучшие времена он имел рейтинг 1650+, однако после какой-то просто-таки невероятной полосы неудач, в которой из примерно 45 игр он выиграл только 5-7, его рейтинг упал до 1397. но до этого он как-то ведь поднялся до 1650, значит потенциал в нем есть, но что-то случилось видимо. то есть называть его плохим игроком нельзя, т. к. подобных вещей на пустом месте не бывает (такой взлет и такое падение). а потому , ориентироваться на количество игр я считаю несколько неуместным. куда более эффективны были бы показатели недавней динамики игрока, а также максимального и минимального его рейтингов. вот такие вот мысли.

теперь вспомним мультиаккаунтовость, о которой сейчас идет яростный срач спор на официальном форуме. взять хотя бы леокротту и его другие аккаунты, вроде дредноута - и полная картина еще больше исказится. это тоже должно учитываться

потом, предположим такую ситуацию. на ладдере зарегался новичок, и у него базовые 1500. он, как это обычно бывает, проигрывает в чистую первые 5-8 игр. а после, просто забивает на ладдер, решив, что нет там для него фана. так вот, он получает рейтинг unranked и его аккаунт отправляется в забвение, в то время как победившие его игроки нажили на таком игроке неплохие показатели. но т. к. отрицательные очки рейтинга массово уходят вникуда, то идет необоснованная инфляция рейтинга, что также плохо.

если интересно, могу еще отметить интересные особенности текущей модели рейтинга ладдера.

замечу также, что разработчики веснота крайне неготивно были настроены на официализацию ладдера и внедрение автоматики прямо в игру, чем, как мне кажется, довольно ступорят саму идею ладдера.

зы недавно написал ригору, что хочу присоединиться к команде разработчиков ладдера - он дал добро. так что может какие-то идеи получится передать


nagafono

Exper,
смотря что считать за мизер. если 5  +- 2 очков рейтинга - это мизер - то да

Exper

ну даже если они наживаются бесплатно, это им опыта не прибавляет :Р
Ворон, тут останется память о тебе.


py6aka

Я лично всегда смотрю на оппозицию игрока. Чем больше игр и побед над высокими рейтингами он имеет, тем я серьёзней начинаю к нему относиться. К примеру человек человек с рейтингом 1400, но с хорошей оппозицией, для меня стоит выше, чем человек с 1700, но со слабой оппозицией.

Ну а то, что система ladder'а не объективна, это уже давно замечено. Ещё раз - смотрим на оппозицию, количество игр, рейтинг. Именно в этой последовательности :)
Не читай меня буквально.

yra111

для бесплатных игр и для игр с платным созданием акка применяют разные ладдеры.Из за мультов и "мертвых душ" которые сливают десяток игр и уходят.
пример ХОН(платный) при игре с равным соперником снимают и начисляют равное кол-во очков .
в играх где можно создавать себе скоко угоно аакаунтов  применяеться чтото похожее на ладдер ICCUPа - там на низких ПТС(при игре против равных конечно) за вин дают к примеру +200 , за луз минус 50, чуть выше  +150 -100 итд до +50  -100 для самых лучших.
В итоге криворукий нуб сыгравший  кучу игр по рейтингу выше чем  профи почти не игравший.И догоняет он его только через некоторое кол-во игр, время потеянное на этот нубодром и служит защитой от абузинга мультами.