Какие существуют способы получения canonical url при парсинге конкретного адреса ресурса?

Question

Everything_is_not_so_bad @2ord

Какие существуют способы получения canonical url при парсинге конкретного адреса ресурса?

Некоторому "пауку" скармливается URL некоторого адреса ресурса, допустим, _http_://www.example.com/blog/2019/mega-article
Кроме всего, потенциально возможны разные варианты URL:
_https_://www.example.com/blog/2019/mega-article
_http_://m.example.com/blog/2019/mega-article

Если в заголовке присутствует rel=canonical, то все понятно: просто извлекаем тот URL и все.
А как быть если не указан rel=canonical ?
Существуют ли другие способы получения канонического URL? А если нужно все равно его получить, то как выкрутиться из положения?

Дополнение:

описание задачи

Есть одна задача, в которой API сервис должен получить url в качестве параметра, а ответом должен вернуть

ID representing the canonical URL of the given url

Загвоздка в том как получить канонический URL если rel=canonical отсутствует. Насколько я понимаю, тогда остается принимать исходный url за канонический. Так?

Вопрос задан более трёх лет назад
104 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

JavaScript

+2 ещё

Простой
Вся секция заежает за header?
- 1 подписчик
- 7 часов назад
- 26 просмотров
0

ответов
HTML

+1 ещё

Простой
Как добавить разный фон в ::before для объектов с одинаковым стилем?
- 1 подписчик
- 13 часов назад
- 20 просмотров
0

ответов
JavaScript

+2 ещё

Средний
Возможно ли расположить или чтобы блок div мог заходить в прозрачный фон png фота?
- 1 подписчик
- 14 часов назад
- 26 просмотров
1

ответ
Парсинг

Средний
Как автоматически скачивать файл с сайта регулярно?
- 1 подписчик
- 20 часов назад
- 45 просмотров
2

ответа
JavaScript

+3 ещё

Простой
Почему приходят пустые данные с формы на почту?
- 1 подписчик
- 20 часов назад
- 56 просмотров
1

ответ
Поисковая оптимизация

Простой
Как создать Сайт на 3-х языках?
- 1 подписчик
- 21 час назад
- 73 просмотра
4

ответа
HTML

Простой
Не получается поставить поисковую строку справа, что сделать чтобы исправить?
- 1 подписчик
- вчера
- 59 просмотров
0

ответов
HTML

Простой
С чем может быть связано не правильный вывод изображений?
- 1 подписчик
- вчера
- 188 просмотров
1

ответ
JavaScript

+1 ещё

Средний
Как задать img источник из svg inline?
- 1 подписчик
- вчера
- 117 просмотров
1

ответ
JavaScript

+2 ещё

Простой
Смена стилей шапки сайта при скролле к определенному блоку? Стили должны применяться при скролле до блока и отменяться за его пределами?
- 1 подписчик
- вчера
- 65 просмотров
1

ответ
Показать ещё Загружается…

Тестировщик-стажёр

ITooLabs • Тула

от 35 000 до 40 000 ₽

Fullstack PHP Developer

Smapse Education

от 40 000 до 65 000 ₽

Trainee - IT Support

move2usajobs.com LLC • Лос-Анджелес

от 2 000 до 4 000 $

Подобрать картинки для каталога

27 апр. 2024, в 06:40

2000 руб./за проект

Подключить сервер к сети

27 апр. 2024, в 02:39

2500 руб./за проект

Необходимо сверстать приложение согласно макету Figma используя React

26 апр. 2024, в 22:22

1500 руб./за проект

Answer 1 · 2019-04-10 10:52:33

Не могли бы вы переформулировать вопрос или дописать, с какой целью вам это нужно?
Сейчас вопрос звучит как "как получить канонический url, если его нет в коде?"
Если на странице нет каноникла на другой урл, значит данная страница по-умолчанию каноническая.

Answer 2 · 2019-04-10 04:36:14

ну а как вы выкрутитесь, если он может быть в общем-то каким угодно, если не указан. и для чего лично вам нужен каноникал стороннего сайта? это сугубо проблемы этого сайта, а не ваши.

Какие существуют способы получения canonical url при парсинге конкретного адреса ресурса?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт