Главное Авторские колонки Вакансии Образование
Выбор редакции:
715 6 В избр. Сохранено
Авторизуйтесь
Вход с паролем

Проблемы и перспективы поисковых технологий

На современном уровне развития поисковых технологий на протяжении нескольких лет звучит справедливая критика в их адрес. В статье предлагаются некоторые размышления о возможных путях разрешения данных проблем.
Мнение автора может не совпадать с мнением редакции

Поисковики уже не те, поисковые алгоритмы не совершенны, в интернет ничего не найдешь, закладки превратились в кучу мусора. Даже статью, видео, сайт которые просмотрел, потом уже трудно найти. Информацию трудно найти также на крупных тематических площадках.

Проблемы есть, а как же их решать?

Есть идея создать специальные тематические хабы-каталоги по виду контента. В хабах будут четко структурированы миллионы тем от "устройство двигателя ЗАЗ" до "Шестой технологический уклад". Получатся следующие виды хабов, соединенных между собой:

- хаб с видео;

- хаб с картинками;

- хаб с текстами;

- хаб с аудио;

- хаб с приложениями, программами и др.

Проблема заключается в том, что если пользователь хочет найти информацию и пишет в поисковом запросе "фильмы о писателях Африки", "фильмы о железном занавесе", "фильмы о современных экономистах", то поисковики бессильны в подобных запросах.

В данном проекте поисковики индексируют содержание хабов и выдают ссылки в поисковых запросах. Пользователь забивает в поисковике "фильмы об изучении древних языков". Видит в поисковой выдаче ссылку на хаб, нажимает ее и попадает в нужную тему-тэг хаба. Точно так как пользователь попадает в Википедию. В каждом хабе будет структурированный каталог на подобии библиотечного УДК, для любителей покапаться в архивах хаба. О проблемах ББК очень подробно написано в этой статье: главноая проблема это приверженность к жесткой иерархической сстеме, которая в современных условиях не решает проблемы тематического поиска. Рассматриваемый проект решает эту проблему.

Заполнение контентом будет происходить по плану и по заявкам обладателей контента. Хаб не забирает контент, а дает только ссылку на статью, видео, лекцию, приложение в соответсвующей оформленной карточке. Площадки с контентом получают трафик с хабов. Возможно также и прямое размещение статей, видео, аудио.

Главная цель хаба не размещать контент, а структурировать и систематизировать информацию о контенте. Возможность попасть в каталог хаба получат и крупные контентные сайты и простой пользователь, создавший качественную единицу контента. Экспертизу будет проводить редакция и сообщество на традиционном форуме. Многие сайты с контентом пытались создать собственные тематические каталоги, но отдельные каталоги будут относительно малосодержательными, а объединение архивов телеканалов, онлайн-кинотеатров, лекций, YouTube, радиостанций, блогеров, в одной библиотеке хаба, думается будет более эффективной.

Проблема в том, что еще слабо развиты технологии индексации содержания видео. Естественно, когда пользователь будет искать "фильм о Ломоносове", то поисковики выдадут ему ссылки на х/ф "Михайло Ломоносов" или ролик в YouTube, потому что такой поисковый ключ есть и в названии и в описании фильма.

Однако, пользователи не знают что конкретно они ищут (в узком конкретном смысле). Ему нужны знания из области теплотехники, сопротивлении материалов, об экономике средних веков и т.д.

К томуже очень много видео информации остается вне досягаемости поисковиков.

Автоматизировать процесс представляется возможным, но не оптимальным решением. Почему? Смотрите первое предложение статьи. Есть кейс giphy.com, которые отказались от автоматического наполнения гифками, т.к. все превратилось в кучу мусора. Выходом является классическая редакционная работа, то бишь организованная работа головного мозга. В данном проекте хорошо будут работать люди с широким кругозором и получающие удовольствие от раскладывания контента по полочкам.

Данная идея опробована, имеет рабочий прототип, в общем начальном, не идеальном виде, с нулевым дизайном. Поисковики данный хаб с рабочим название "Контент Информ" проиндексировали (Яндекс хуже Гугла). На сегодняшний день сложилось четкое понимание развития данных проектов, аналогов которых в мире нет.

Интересно мнение профессионального сообщества: нужен такой проект?

0
В избр. Сохранено
Авторизуйтесь
Вход с паролем
Комментарии
Ильдар Карымов
так это же имиджборд или торрент трекер
Ответить
Контент Информ
Видео энциклопедия фильмов и лекций
Александр Ортиков
Неудобный каталог Рутрекера стал одной из предпосылок создания идеи))) Да, там есть несколько нецентрализованных тематических подборок, но глобальной тематической каталогизации нет. Рутрекер, Кинопоиск и другие контентные площадки не стали энциклопедиями, а являются кучей несистематизированной информации. У Кинопоиска относительно документальных фильмов и лекций мало тегов. У Рутрекера падение посещаемости и проблемы с легальностью.
Ответить
Контент Информ
Видео энциклопедия фильмов и лекций
Александр Ортиков
Имиджборды и представленный проект как-то не понял в чем похожи)
Ответить
Ильдар Карымов
У имиджбордов точно так же вся информация структурируется по тредам, если я не ошибаюсь
Ответить
Контент Информ
Видео энциклопедия фильмов и лекций
Александр Ортиков
Этот пример https://2ch.hk/ подходит?) Смотрите там только общие темы для ОБСУЖДЕНИЯ, а в самих хабах обсуждения не будет, это будет как собранная подборка ссылок на узкие темы.

А в хабах будут миллионы тем. Это как в библиотеке: Вы приходите и просите информацию об спецслужбах Японии. Вот вам пожалуйста - тематический полочка, на которой все спецслужбы собраны отдельно.
Ответить
Ильдар Карымов
Окей, понял вас )
Ответить
Выбрать файл
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать

Spark использует cookie-файлы. С их помощью мы улучшаем работу нашего сайта и ваше взаимодействие с ним.