@password22

Поиск определенного фрагмента по файлам html, как сделать массивно?

Здравствуйте. Не знаю с помощью чего можно осуществить подобное, поэтому указал и php и парсер.
Есть, допустим, 20 000 страниц сайта на html. Мне нужно вытащить из них содержимое div с каким-либо классом. Как мне это сделать? Может программа какая-нибудь?
  • Вопрос задан
  • 141 просмотр
Решения вопроса 1
Kasperenysh
@Kasperenysh
Рецидив в особо острой форме))
предположим что все файлы лежат в dir1, а новые будем создавать в "имя фала/имя класса.html"
$class = 'text_text'; //какой класс ищем...

foreach (glob("dir1/*.html") as $filename) {
  $html = file_get_contents($filename);
  preg_match('<div class="'.$class.'">(.*)</div>', $html, $result);
  file_put_contents($filename.'/'.$class.'.html', $result[0]);
}

с регулярками у меня беда) но в теории код должен работать)) ну и хз как это по времени будет занимать.... более опытные ребята может подправят что-то...
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
@Arthurka
1. Делаете цикл на 20000.
2. Делаем открытие папки.
3. Сверяем каждую строку на наличие нужного класса.
4. Если найдено - создаем папку и вносим данные
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
Sveak Барнаул
от 50 000 руб.
OTC.RU Барнаул
от 50 000 руб.
ИТ-центр Воронеж
от 50 000 до 70 000 руб.
16 июл. 2019, в 00:49
15000 руб./за проект
15 июл. 2019, в 23:17
3000 руб./за проект
15 июл. 2019, в 23:03
1000 руб./за проект