@skygliderus
Excel, HTML, CSS, JS, PHP, adaptive design

Xpath. Как правильно спарсить конкретный текст?

На странице есть условно такой код:
...
<div class="item">
  <a name="111" id="111">
  <div class="header">
    <h2 class="">Заголовок</h2>
    <div class="news-author"> Автор новости</div>
  </div>
  <div class="newsbody"
    <div class="news-text">Текст новости</div>
  </div>
</div>
...


И таких блоков на странице каждой категории много. Как правильно составить XPath чтобы вытаскивал new-author из блока с конкретным значением id в теге a?

Для сбора использую Google Таблицы. Собираю заголовки, даты всё норм.

Затык в сборе самой новости. Они идут подряд и относятся к разным категориям. И когда я пытаюсь собрать автора:
=IMPORTXML(СЦЕПИТЬ("https://domain.tdl";IMPORTXML("https://domain.tdl/categories/"; "//div[@class='news-read-more']/a/@href")); "//div[@class='news-author']")

Он собирает авторов из категории первой новости. Ну и тексты соответственно.

Хелп плиз )
  • Вопрос задан
  • 258 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы