редакции Выбор
Лайфхак: Google Spreadsheets для анализа сайта
Задача стояла в проверке коммерческих факторов у всех сайтов клиентов. Погуглив, ничего здравого в этом направлении я не нашел, но вспомнил про восхитительную функцию IMPORTXML() в гугл таблицах. Гугл просто предоставляет бесплатный и простой в настройке парсер!
Здесь описание функции: https://support.google.com/docs/answer/3093342
Логика такая:
- Получаем код странички по ссылке
- Ищем нужный коммерческий фактор
- Выставляем индикатор наличия
Фактически функция IMPORTXML() сразу получает нужную ноду, склеивая первый и второй шаг логики. Один нюанс: для выборки элементов странички используется XPath (документация https://www.w3schools.com/xml/xpath_intro.asp), поэтому придется поизучать тем, кто ранее не сталкивался. Собственно, на этом все. Осталось только выставить флаг в зависимости от наличия/отсутствия в выборке элементов.
Что получилось
Ссылка в ячейке F1. Например, ищем номер телефона по вхождению подстроки, типичной для записи начала номера в России. Если ошибки в выборке нет (то есть что-то нашлось), будет записана единичка. Вуа-ля.