Как удалить данные на странице с помощью simple_html_dom

Admin WordPress

В продолжение статей о парсинге страниц. На этот раз небольшая заметка о том, как с помощью simple_html_dom удалить ненужные данные на странице.

Если надо удалить какой-то участок на странице данных, чтобы они не попадали в парсинг, лучше всего это сделать перед началом. А именно в самом верху нашего кода положим такой участок:

foreach($html ->find('div.class-one') as $matches) {
    $matches->outertext = '';
    }

    // Сохраним в $html новый код
    $html->load($html->save());

Теперь мы можем посмотреть полученное содержимое страницы без не нужных данных и поправить её при необходимости:

echo $html

Или работать дальше в обычном порядке:

foreach ( $html->find('') as $matches ) {}

На сайте отсутствует реклама! Значете почему?

Помогать людям - моё хобби. А навыки разработчика позволяют не парится нулевой монетизизацией этого сайта. Хотя...

Если вам помогла информация, то даже от доната в 40 рублей мне будет приятно. Докину немного, куплю латте в макдаке, вспомню за чей счет банкет и карма вам зачтется!

Но и просто оставленный комментарий благодарности ниже принесет мне улыбку радости :)

А если захочется написать всякие гадости с переходом на личности, да тоже не стесняйтесь, но обычно я отправляю такое в спам. Люблю, когда дома чисто.

Добавить комментарий

Напишите свой комментарий, если вам есть что добавить/поправить/спросить по теме текущей статьи:
"Как удалить данные на странице с помощью simple_html_dom"