О корректности при использовании статистики

Н.Г.Борисов, г.Химки

Перечитывая старые номера журнала "Олимп", я обратил внимание на то, что некоторые системы оценивания тяжелоатлетических результатов выведены их авторами путём использования не совсем корректных методик статистической обработки данных. Некорректность этих методик заключается в ориентации на равное представительство вместо пропорционального.

К сожалению, о конкретных деталях своих методик авторы систем оценивания, построенных на базе статистической обработки результатов соревнований, написали в целом глухо и невнятно. Но иногда в их статьях на сей счёт прорывается всё-таки и кое-что определённое. Вот что сообщил, например, исследователь А.Важенин из Екатеринбурга:

"Была проанализирована динамика мировых рекордов в отдельных упражнениях... Просчитывались соотношения рекордных результатов между различными категориями..." ("Олимп", 1993 г., № 1). "...Уровень мировых рекордов в различных весовых категориях примерно одинаков, особенно если брать не конкретные показатели, сложившиеся на сегодня, а соотношение между рекордными результатами на протяжении достаточно длительного времени... " ("Олимп", 1997 г., № 2-3.)

Как можно понять из приведённых цитат, для создания своей системы А.Важенин нашёл списки рекордов за разные годы, вычислил соотношения рекордов разных весовых категорий для каждого списка, вывел средние арифметические этих соотношений за все годы и подобрал формулу, наиболее точно описывающую изменения этих усреднённых соотношений от одной весовой категории к другой.

То, что сходную методику отбора по одному человеку, по одному рекордсмену от каждой весовой категории, применяли и другие авторы, точно так же, как и Важенин, базировавшие свои системы оценивания на статистической обработке соревновательных данных, косвенно подтверждают слова известного исследователя М.Стародубцева из Москвы:

"Представило интерес сравнить, как согласуются между собой фактические результаты в видах троеборья с рассчитанными по этим формулам теоретическими аналогами у чемпионов мира 1992 года..." ("Олимп", 1994 г., № 2.)

То есть здесь очень похоже, что М.Стародубцев считает общетеоретические оценки вполне родственными оценкам результатов чемпионов одного соревнования.

Ещё одним подтверждением того, что исследователи, основывающие свои выводы на статистической обработке соревновательных данных, брали для этой обработки из каждой весовой категории именно равные количества лучших представителей разных весовых категорий, является предложение А.Важенина рассмотреть результаты сначала "пяти лучших атлетов, следующих за мировыми рекордсменами в каждой из весовых категорий", а затем "результаты атлетов, занявших с 1-го по 6-ое места" ("Олимп", 1993 г., № 1).

Однако подобная методика — брать для анализа от разных по численности групп равные количества представителей — повторяю, очевидно некорректна.

Это ведь всё равно, как если какой-нибудь социолог для получения сведений об общем настроении в стране, где 60% составляют рабочие, 1% — предприниматели и 1% — чиновники, опросил бы всего лишь по одному человеку и от рабочих, и от предпринимателей, и от чиновников.

И тогда на такой, например, вопрос, как "Хватает ли опрашиваемым на жизнь их доходов?" от одного предпринимателя, от одного чиновника и от одного рабочего горе-социолог получил бы два положительных ответа и один отрицательный. То есть этот опрос привёл бы социолуха к выводу, что в данном обществе людей, довольных уровнем своих доходов, вдвое (2:1) больше, чем недовольных, — хотя на самом деле недовольных в тридцать раз (60:2) больше, чем довольных.

В тяжёлой атлетике в разных весовых категориях выступает очень разное количество атлетов. Например, средневесов во всём мире живёт, наверное, несколько десятков или даже сотен тысяч человек, а вот супертяжеловесов во всём мире можно насчитать вряд ли больше нескольких тысяч. Соответственно, брать для сравнения из этих совершенно разных по численности весовых категорий одно и то же количество лучших атлетов — это неправильно.

Если проанализировать результаты любого более-менее представительного тяжелоатлетического соревнования, то, скорее всего, выявятся отчётливые различия и в количествах представителей разных весовых категорий, и в уровнях результатов, показанных в этих категориях. Например, в любой из средних весовых категорий количество участников бывает обычно в 2-4 раза больше, чем число тяжеловесов или супертяжеловесов.

С другой же стороны, если в средних весовых категориях чемпионские результаты превосходят результаты, давшие пятые места, на 5-10%, то у супертяжеловесов первый результат превосходит пятый зачастую на 25-35%. Нередко на крупных соревнованиях можно видеть такую картину, что в средних весовых категориях первые пять участников показывают результаты уровня МСМК, а в тяжёлых или в наилегчайшей пятый результат имеет уровень уже всего лишь КМС или даже первого разряда.

Таким образом, согласно методике Важенина, Стародубцева и других исследователей, применяющих аналогичные подходы, получается, что общий уровень результатов пяти МСМК из средних весовых категорий должен быть приравнен к общему уровню результатов одного МСМК, пары МС, одного КМС и одного перворазрядника из супертяжеловесов. (Кстати, нередко случается ведь и так, что супертяжеловесам не надо бывает даже стараться показать какое-либо приличное достижение — из-за физического отсутствия соперников призовое место достаётся им автоматически за любой результат.)

Как известно, чтобы срез общественного мнения оказался правильным, а не искажённым, социологи давно уже ориентируют свои статистические выкладки не на равное, а именно на пропорциональное представительство. То есть в приведённом выше примере с обществом, где рабочие составляют 60% населения, предприниматели — 1% и чиновники — 1%, грамотный социолог всегда опрашивает не по одному представителю от каждого социального слоя, а, допустим, шестьдесят человек от рабочих и по одному — от чиновников и от предпринимателей.

Всё то же самое проделал бы и любой специалист по выведению систем оценивания тяжелоатлетических результатов на основании статистических обсчётов итогов соревнований. То есть таким исследователям, как Важенин, Стародубцев, Синклер, Уилкс, Мэлоун, Швартц и т.п. для корректного выведения своих систем следовало брать из каждой весовой категории такие количества лучших атлетов, которые были бы не равны между собой, а именно пропорциональны общемировому количеству представителей каждой весовой категории.

К примеру, если брать по одной десятой процента от общемирового числа представителей каждой весовой категории, то от супертяжеловесов следовало взять, положим, 10 лучших атлетов для статистического усреднения их результатов, а от средневесов — 100 лучших атлетов и т.д.

Я понимаю, что узнать более-менее точное общемировое количество представителей каждой весовой категории — задача, в общем-то, невыполнимая. Но невозможность решения этой задачи свидетельствует вовсе не о фиаско самой идеи сформировать корректную систему оценивания тяжелоатлетических результатов, а всего лишь о фиаско той методики, которая была избрана Синклером, Стародубцевым, Важениным и пр.

Видимо, именно ошибочность этой методики и вызвала существенный разнобой в системах Синклера, Стародубцева и Важенина, приведший в итоге к затяжным дискуссиям на страницах "Олимпа" о правильности тех или иных систем оценивания тяжелоатлетических результатов.

[на главную страницу]

О корректности при использовании статистики

Архив переписки

Форум