Исследование зависимости читаемости писем от попадания в папку “спам”
Какие письма мы рассылаем
Мы собрали в открытых источниках адреса электронной почты компаний России и высылаем на эти адреса заказы на продукцию компании. Например, если это полиграфия в Москве, то такая компания будет получать письма с заказами на печать листовок, визиток и пр. Наша рассылка осуществляется с собственных почтовых серверов, которые настроены по всем правилам.
Как мы собираем данные о результатах рассылки
Мы подключили Postmaster mail.ru и Почтовый офис Яндекса. Последний позволяет смотреть статистику для каждой рассылки отдельно - это и предоставило нам необходимые данные для нашего исследования.
Почтовый офис показывает рассылки только от 100 писем. Для каждой из них обозначены доли: сколько писем прочитано, не прочитано, удалено, спам. Кроме того, можно посмотреть более полный и, надо признать, очень красивый отчет. Результаты также можно агрегировать по всем рассылкам за день, по темам и т.д.
Проблема Почтового офиса в том, что доля прочитанных писем определяется только при чтении из веб-интерфейса почты. Часть людей, особенно в корпоративной среде, читают свою почту с помощью Outlook, The Bat и других почтовых клиентов. Поэтому доля прочитанных писем на самом деле значительно больше.
Мне, к сожалению, не удалось найти статистику Яндекса или другой компании, какая доля их пользователей читает почту из веб-интерфейса, чтобы скорректировать полученные данные. Таким образом, мы знаем, что в абсолютных числах есть погрешность на неизвестный коэффициент, но общий вид зависимости должен быть верным.
Стоит отметить, что наша рассылка идет на разные почтовые службы, а анализ мы проводим только по подмножеству, которое уходит на Яндекс.Почту. Это также может внести систематическую погрешность.
Анализ данных
Мы обработали 113 наших рассылок за октябрь 2014 г. В них оказалось 22 тысячи писем. Результаты рассылок оформили в виде таблицы.
Зависимость доли прочитанных писем от числа писем, упавших в папку "спам", представлена на рисунке ниже. Интересно то, что при увеличении в 2 раза доли писем, которые угодили в "спам", число прочитанных писем уменьшается не в 2 раза, а всего на 25% (примерно). Это говорит о том, что примерно половина компаний регулярно просматривают папку "спам" и читают оттуда письма, которые сочли интересными.
Доля писем, которые Яндекс отправляет в спам, почти не зависит от количества писем в рассылке, что видно из рисунка ниже. Небольшое снижение линии тренда - скорее всего результат статистической погрешности или какой-то скрытой закономерности. Например, возможно, самые большие рассылки у нас идут по тем рубрикам, которые "нравятся" Яндексу по содержанию писем.
Когда у нас появилась идея проанализировать информацию, которую нам предоставляет Яндекс о нашей рассылке, мы рассчитывали, что сможем как-то уменьшить процент писем, которые падают в папку спам. К сожалению, это нам не удалось. Но мы узнали, что примерно половина компаний читает интересные письма из спама – это позитивный фактор для нашего проекта Supl.biz. А вы находите полезные письма в папке "спам"?
Автор статьи: Евгений Дьяченко