Мы в Datmark в какой-то момент задались вопросом: как выбрать те бизнес-книги, что достойны внимания, времени и средств? Какие книги можно назвать выдающимися? Кто рекомендует стоящие книги? Может ли один автор написать много хороших книг, или количество — не признак мастерства? Так появилась идея этого исследования.
Цель — разобраться, как выбирать стоящие книги для чтения, и создать удобный интерактивный инструмент для себя и всех читающих. Что получилось, можно изучить по ссылке , а далее расскажем о пути проекта.
Мы собрали базу книг с сайта книжного рекомендательного сервиса LiveLib с помощью парсинга. Выбрали LiveLib по нескольким причинам:
Размер библиотеки. Сайт содержит 3 миллиона книг. Количество оценок. LiveLib отличается полной базой оценок и отзывов: на 4 августа 2020 года пользователи написали 1,2 миллиона рецензий. Развитый каталог. Бизнес-книги в 28 поджанрах: от психологии и мотивации до аналитики и интернет-бизнеса. Парсинг категории бизнес-литературы собрал 64076 книг. Мы очистили базу от дублей, устаревших и сомнительных книг. Вот ограничения, которые мы установили:
3 оценки — минимум, при котором книга входила в базу. Чтобы средней оценке можно было доверять. Оставили книги новее 2000 года. Попали как изданные после 2000 года, так и переизданные, но и это обеспечило актуальность базы. Только бизнес-книги 28 тематик. Разработали каталог на основе запросов наших коллег из разных профессиональных сфер, а также собственного опыта чтения бизнес-литературы. Сформулировали редкие категории, которые трудно найти в каталогах интернет-магазинов: управление продуктом, digital-маркетинг, инвестирование, брендинг, копирайтинг и другие. После очистки в базе осталось 4793 книги. Для каждой книги у нас были:
средняя оценка; количество оценок; авторы; издательство; тема, установленная вручную. Кроме того, мы отметили книги, входящие в 14 рекомендательных подборок от компаний и известных людей: узнали, что читают Герман Греф и Олег Тиньков, а также заглянули в библиотеку SkyEng.
Мы осознанно выбрали источник и тщательно подготовили данные, но не претендуем на истину в последней инстанции. Хотя бы по причине нескольких ограничений: проект основан на данных сайта LiveLib на июль 2020 года. Вполне возможно, что вы не найдете некоторых книг в базе потому, что их нет на LiveLib или они не отмечены как бизнес-книги. Тем не менее, погрешность мала, а проект от этого не становится менее увлекательным.
Вот что нам удалось выяснить.
Лучшие книги Мы с интересом фильтровали и сортировали результаты, получив очищенную базу книг. Так мы узнали, что в базе 37 книг с количеством оценок больше 1000, а самая популярная книга за всё время — «Богатый папа, бедный папа» Роберта Кийосаки, набравшая почти 9 тысяч оценок.Лист «Подобрать книгу» в дашборде
Мы искали в базе прочитанные книги, чтобы узнать, какая у них средняя оценка и сколько раз их оценили. Попробуйте на вкладке «Подобрать книгу» — это затягивает! В процессе мы поняли, что средняя оценка и их количество — главные параметры при выборе книг, но какой важнее?
Книгу могут оценить 1000 раз, но оценить на 3 балла — такие книги не вызывают интереса. Или средняя оценка может быть 5, но оценок всего 4, можно ли им доверять? Вряд ли. Внимания заслуживают те книги, которые сочетают большое количество оценок с высокой средней оценкой.
Мы назвали их выдающимися.Лист «Лучшие книги» в дашборде
Выдающихся книг немного: они выделяются рекордной популярностью и сравнительно высокой оценкой. Это те книги, которые мы рекомендуем новичкам в теме. Просто отфильтруйте диаграмму на листе «Лучшие книги» по категориям и наведите курсор на точки.
Квадрант переоцененных книг нередко остается пустым — а значит незаслуженно-популярных книг немного. Большинство книг попадает в квадрант посредственных, но те несколько, что оказались недооцененными, вызывают интерес.
У недооцененных книг сравнительно мало оценок, однако рейтинг выше среднего по выборке. Рекомендуем искушенным читателям: вполне возможно, откроете для себя новую замечательную книгу.
Темы О вкусах не спорят. Неудивительно, что книги разных тем оцениваются по-разному. Например, самой популярной категорией стали личные финансы, во многом благодаря Роберту Кийосаки (и книге «Богатый папа, бедный папа»). Однако можно заметить, что самые оцениваемые (читайте: популярные) категории не отличаются качеством книг. Это доказывает, что популярность книги еще не делает её хорошей.Лист «Темы» в дашборде
Примечательно, что количество книг в категории не связано с популярностью или средней оценкой. Хорошие книги есть в каждой теме, но в крупных категориях их сложнее найти. Например, в саморазвитии 36% хороших книг, в то время как в финансах 72%. В среднем количество книг с высокой оценкой составляет 50% внутри категории, а значит шансы найти стоящую книгу 50 на 50.
Стоит отметить, что в развивающихся категориях легко ошибиться с выбором книги. В частности, в digital-маркетинге и инновациях книг с высокой оценкой менее трети.Лист «Темы и оценки» в дашборде
Авторы Отдельного внимания стоят авторы, иначе кому мы обязаны за книги?
Мы разделили авторов по тому же принципу, что и книги: на выдающихся, недооцененных и переоцененных. Анализ показал: чем больше автор пишет, тем ниже средняя оценка его книг и меньше оценок в целом. Выдающимися становятся те, кто пишет мало, но хорошо.
Примечательно, что переоцененных авторов, также мало, как и книг. Вероятно потому, что автору сложно удержать популярность после нескольких неудачных книг.Лист «Авторы» в дашборде
Мы составили подборки лучших авторов, используя 3 подхода:
По количеству книг. По средней оценке. Выбирая тех авторов, у кого книг больше 3 и количество оценок выше медианного значения. По количеству оценок на книгу. Среди тех авторов, у кого книг больше 3. Подборки авторов представлены ниже, а также на странице дашборда «Лучшие авторы». Удивительно, что только Максим Ильяхов дважды попал в ТОП-5: по средней оценке и количеству оценок на книгу. Другие же авторы либо пишут много книг, либо качественные, либо популярные.
Вокруг фотографии автора книги распределены на хорошие, средние и плохие. При этом видно, что авторы, лидирующие по количеству книг, не отличаются высоким качеством последних. Список книг можно увидеть в дашборде, наведя курсор на сегмент круговой диаграммы.Лист «Лучшие авторы» в дашборде
Издательства Издательства играют немаловажную роль в судьбе книги: они не только берут на себя обязанности по публикации, но и занимаются продвижением. То есть книги, собравшие много оценок, нередко обязаны этим своему издателю.Лист «Издательства» в дашборде
Для анализа мы выбрали ТОП-6 издательств, которые выпустили минимум 100 бизнес-книг. Нетрудно догадаться, что крупнейшими издательствами являются МИФ и Альпина. В исследуемой базе они выпустили более 50% книг, а МИФ не только выпускает больше всех книг, но отлично их продвигает: книги получают больше всех оценок.Лист «Издательства и темы» в дашборде
Кроме прочего МИФ и Альпина единственные выпускают книги в 28 тематиках, другие же издательства сосредоточены на нескольких категориях.
Саморазвитие — самая выпускаемая категория среди издательств, большинство книг выпустили МИФ. Они же выпускают самые популярные книги, но не самые качественные: средняя оценка выше у Попурри, Питер и АСТ.
В развивающейся категории digital-маркетинга лучшие книги выпускает АСТ, хотя в традиционном маркетинге лидируют МИФ и Попурри. Менеджмент — еще одна популярная категория. Лучшие книги в ней также выпускает МИФ, однако в теме предпринимательства сильнее Альпина и Питер.
Рекомендации Рекомендации — частый способ выбрать книгу для чтения. Мы полагаемся на мнение известных людей, компаний или друзей и коллег. А стоит ли?
Мы собрали подборки бизнес-книг от предпринимателей, журналов, издательств и компаний, чтобы понять, кто рекомендует более качественные книги.Лист «Рекомендации» в дашборде
Вывод: опора на рекомендации — верная стратегия. В большинстве своем подборки помогут не ошибиться в выборе, так как в них редко попадают книги с низкой оценкой.
Издательства рекомендуют одни из самых качественных книг. Вероятно причина в том, что подборки уже основаны на оценках книг, а не на личном опыте и предпочтениях.
Книжные магазины предлагают много посредственных книг (вероятно, чтобы поднять продажи), а подборки от известных людей основаны на опыте и включают книги разного качества.
Еще один важный момент: в годовые подборки входит ограниченный набор, поэтому рекомендации такого типа не отличаются качеством книг. Но в них вы найдете актуальные книги и новинки.
На странице дашборда «Рекомендации» можно посмотреть , какие книги рекомендуют авторы подборок.
В конечном счете Качество книг — условный параметр. Оценка отдельного человека зависит от уровня знаний в конкретной теме, ожиданий по слогу и содержанию, а также от того, что он читал ранее. Иными словами, литературные предпочтения — дело вкуса.
С помощью аналитики мы постарались сделать выбор книги понятным и четким, чтобы даже в таком непростом деле принимать решения на основе данных.