И вот, октябрь кончился, данные я собрал, но мне понадобилось ещё почти 20 дней, чтобы подсчитать цифры, приведённые ниже. За каждой цифрой в таблицах стоит 22-23 цифры, которые нужно было усреднить. Кроме того, разные сайты выдают данные в разном виде, и их нужно было как-то привести к единому виду. В общем, времени я потратил много, и всё равно стало понятно, что месячная выборка явно недостаточна, чтобы делать какие-то выводы. Я так и планировал повторить потом эксперимент в другие месяцы и в другие сезоны, но считать вручную мне что-то больше не хочется. Нужно будет написать программу, которая будет укладывать эти данные в базу, и дальше можно будет подсчитать намного больше статистик. Например, мне было интересно, в какую сторону кто чаще ошибается. Кроме того, на основе данных разных сайтов, с учётом весовых коэффициентов, тоже можно составлять итоговый прогноз, который, как мне кажется, будет сбываться лучше, чем прогноз отдельных сайтов. Но это всё дело будущего, а пока получилось вот что:


Несколько комментариев к полученным цифрам.
1. Оправдываемость прогнозов облачности официального сайта, возможно, несколько занижена, потому что у них есть только три градации: пасмурно, переменная облачность и ясно. Чтобы привести эти данные к общему виду в процентах, пришлось переменную облачность считать за 50%, хотя 80-90% осенью тоже вполне воспринимаются как переменная облачность. Если же считать переменной облачностью всё, что не 0 и не 100, тогда это будет малоинформативно, можно будет всегда это ставить в прогнозе, и он будет почти всегда сбываться, особенно летом.
2. Оправдываемость прогнозов осадков Intellicast, наоборот, завышена. Этот сайт даёт вероятность осадков, но не даёт их количество. А, поскольку вероятность у них чаще всего не 0, прогноз "небольшой дождь" осенью сбывается чаще других.
3. Прогнозы, составленные живыми синоптиками, не настолько точнее модельных, насколько я думал. Отчасти это из-за п.1.
4. Теперь на эту табличку можно давать ссылку тем, кто не верит, что погоду вообще можно предсказывать. Вот пример :) Всё-таки оправдываемость больше 50% даже у 6-дневных прогнозов.
Journal information