Задать вопрос

Алексей @skygliderus

Excel, HTML, CSS, JS, PHP, adaptive design

парсинг

Xpath. Как правильно спарсить конкретный текст?

На странице есть условно такой код:

...
<div class="item">
  <a name="111" id="111">
  <div class="header">
    <h2 class="">Заголовок</h2>
    <div class="news-author"> Автор новости</div>
  </div>
  <div class="newsbody"
    <div class="news-text">Текст новости</div>
  </div>
</div>
...

И таких блоков на странице каждой категории много. Как правильно составить XPath чтобы вытаскивал new-author из блока с конкретным значением id в теге a?

Для сбора использую Google Таблицы. Собираю заголовки, даты всё норм.

Затык в сборе самой новости. Они идут подряд и относятся к разным категориям. И когда я пытаюсь собрать автора:

=IMPORTXML(СЦЕПИТЬ("https://domain.tdl";IMPORTXML("https://domain.tdl/categories/"; "//div[@class='news-read-more']/a/@href")); "//div[@class='news-author']")

Он собирает авторов из категории первой новости. Ну и тексты соответственно.

Хелп плиз )

Вопрос задан более трёх лет назад
258 просмотров

Комментировать

Подписаться 3 Средний Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Средний
Как переместить мышь вместе с элементом в pyppeteer?
- 1 подписчик
- 21 апр.
- 94 просмотра
0

ответов
Python

+2 ещё

Средний
Как пофиксить ошибку с сертификатом при работе с selenium?
- 1 подписчик
- 19 апр.
- 67 просмотров
0

ответов
WordPress

+1 ещё

Средний
Парсинг сайта на wordpress?
- 1 подписчик
- 19 апр.
- 83 просмотра
2

ответа
Парсинг

+1 ещё

Средний
Как правильно написать функцию IMPORTJSON для парсинга цен криптовалют в гугл таблицу?
- 1 подписчик
- 19 апр.
- 25 просмотров
0

ответов
Python

+1 ещё

Простой
Выбор: парсить на питоне с aiohttp, asyncio, bs4 или requests + bs4?
- 1 подписчик
- 17 апр.
- 154 просмотра
2

ответа
PHP

+1 ещё

Простой
Как получить данные title на TradingView?
- 1 подписчик
- 17 апр.
- 33 просмотра
1

ответ
Парсинг

Средний
Как парсить сайты на Wordpress в определённой доменной зоне?
- 1 подписчик
- 16 апр.
- 26 просмотров
3

ответа
Python

+1 ещё

Простой
Как вывести конкретное значение из класса в python?
- 1 подписчик
- 14 апр.
- 123 просмотра
1

ответ
Парсинг

Простой
Есть кто copart.com парсил?
- 1 подписчик
- 14 апр.
- 108 просмотров
0

ответов
Python

+1 ещё

Средний
Почему ответ из request, появляется только после того как зашёл сайт, с которого и пытаемся получить ответ через запрос, а так он пуст?
- 1 подписчик
- 13 апр.
- 104 просмотра
3

ответа
Показать ещё Загружается…

Веб-разработка и управление IT в Sortage

Sortage • Москва

от 180 000 ₽

Uway

от 140 000 до 200 000 ₽

Senior system administrator / Системный администратор

XIAG AG • Новосибирск

от 190 000 до 260 000 ₽

Написать индикатор на TradingView по хаям/лоям дня недели

25 апр. 2024, в 08:45

4000 руб./за проект

Вычислить размер объекта по карте глубин

25 апр. 2024, в 07:37

5000 руб./за проект

Спарсить TON PLACE: скрейпинг фото и текста с анкет по списку URL

25 апр. 2024, в 05:57

3000 руб./за проект