Проблемы и перспективы поисковых технологий
Поисковики уже не те, поисковые алгоритмы не совершенны, в интернет ничего не найдешь, закладки превратились в кучу мусора. Даже статью, видео, сайт которые просмотрел, потом уже трудно найти. Информацию трудно найти также на крупных тематических площадках.
Проблемы есть, а как же их решать?
Есть идея создать специальные тематические хабы-каталоги по виду контента. В хабах будут четко структурированы миллионы тем от "устройство двигателя ЗАЗ" до "Шестой технологический уклад". Получатся следующие виды хабов, соединенных между собой:
- хаб с видео;
- хаб с картинками;
- хаб с текстами;
- хаб с аудио;
- хаб с приложениями, программами и др.
Проблема заключается в том, что если пользователь хочет найти информацию и пишет в поисковом запросе "фильмы о писателях Африки", "фильмы о железном занавесе", "фильмы о современных экономистах", то поисковики бессильны в подобных запросах.
В данном проекте поисковики индексируют содержание хабов и выдают ссылки в поисковых запросах. Пользователь забивает в поисковике "фильмы об изучении древних языков". Видит в поисковой выдаче ссылку на хаб, нажимает ее и попадает в нужную тему-тэг хаба. Точно так как пользователь попадает в Википедию. В каждом хабе будет структурированный каталог на подобии библиотечного УДК, для любителей покапаться в архивах хаба. О проблемах ББК очень подробно написано в этой статье: главноая проблема это приверженность к жесткой иерархической сстеме, которая в современных условиях не решает проблемы тематического поиска. Рассматриваемый проект решает эту проблему.
Заполнение контентом будет происходить по плану и по заявкам обладателей контента. Хаб не забирает контент, а дает только ссылку на статью, видео, лекцию, приложение в соответсвующей оформленной карточке. Площадки с контентом получают трафик с хабов. Возможно также и прямое размещение статей, видео, аудио.
Главная цель хаба не размещать контент, а структурировать и систематизировать информацию о контенте. Возможность попасть в каталог хаба получат и крупные контентные сайты и простой пользователь, создавший качественную единицу контента. Экспертизу будет проводить редакция и сообщество на традиционном форуме. Многие сайты с контентом пытались создать собственные тематические каталоги, но отдельные каталоги будут относительно малосодержательными, а объединение архивов телеканалов, онлайн-кинотеатров, лекций, YouTube, радиостанций, блогеров, в одной библиотеке хаба, думается будет более эффективной.
Проблема в том, что еще слабо развиты технологии индексации содержания видео. Естественно, когда пользователь будет искать "фильм о Ломоносове", то поисковики выдадут ему ссылки на х/ф "Михайло Ломоносов" или ролик в YouTube, потому что такой поисковый ключ есть и в названии и в описании фильма.
Однако, пользователи не знают что конкретно они ищут (в узком конкретном смысле). Ему нужны знания из области теплотехники, сопротивлении материалов, об экономике средних веков и т.д.
К томуже очень много видео информации остается вне досягаемости поисковиков.
Автоматизировать процесс представляется возможным, но не оптимальным решением. Почему? Смотрите первое предложение статьи. Есть кейс giphy.com, которые отказались от автоматического наполнения гифками, т.к. все превратилось в кучу мусора. Выходом является классическая редакционная работа, то бишь организованная работа головного мозга. В данном проекте хорошо будут работать люди с широким кругозором и получающие удовольствие от раскладывания контента по полочкам.
Данная идея опробована, имеет рабочий прототип, в общем начальном, не идеальном виде, с нулевым дизайном. Поисковики данный хаб с рабочим название "Контент Информ" проиндексировали (Яндекс хуже Гугла). На сегодняшний день сложилось четкое понимание развития данных проектов, аналогов которых в мире нет.
Интересно мнение профессионального сообщества: нужен такой проект?