Учимся писать парсеры
Мы начинаем публикацию цикла статей, в которых будем досконально разбирать процесс парсинга данных с различных ресурсов. Статьи будут публиковаться в нашем основном блоге. Здесь же мы будем писать анонсы с новым статьям для тех, кто еще пока не читает наш основной блог.
Для чего это нужно? Часто к нам обращаются люди с просьбой показать на реальных примерах, как они могли бы использовать мета-язык. Идем им навстречу и постараемся хотя бы раз в неделю описывать в деталях процесс парсинга различных русскоязычных ресурсов. Все парсеры будут также добавлены в наш репозиторий, откуда любой может скачать его, при желании модифицировать, и использовать.
Также мы планируем начать серию статей, которые будут дополнительно описывать каждую команду, используемую в мета-языке с использованием реальных примеров и интересных кейсов, с которыми нам приходилось сталкиваться в нашей работе за последние 10 лет.
Мы надеемся, что статьи окажутся полезными и помогут вам в решении задач парсинга. Также мы будем рады услышать ваши замечания или пожелания, предложения по кейсам для разбора.
Первая наша статья посвящена написанию парсера новостных сайтов на примере ленты новостей РИА Новости.