Парсинг html с помощью c# стандартных инструментов?

Question

iXelper @iXelper

C#

Парсинг html с помощью c# стандартных инструментов?

Есть html код с элементом:

<div style="font-family: 'Courier New', Courier, monospace; font-weight: normal;">Hello word</div>

Xpath: //*[@id="Text"]/div[2]/ol/li/div

Вопрос: Как вытащить строку "Hello Word" с помощью Regex

Извиняюсь если задаю глупые вопросы, но безвыходная ситуация))

Вопрос задан более трёх лет назад
2099 просмотров

2 комментария

Подписаться 1 Простой 2 комментария

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

C#

Простой
C# и несколько CPU?
- 6 подписчиков
- вчера
- 2420 просмотров
3

ответа
C#

+1 ещё

Простой
Как сделать смену обьекта при приближении?
- 1 подписчик
- 14 апр.
- 61 просмотр
1

ответ
Windows

+2 ещё

Простой
Как обеспечить относительный путь к БД SQLite?
- 1 подписчик
- 14 апр.
- 103 просмотра
3

ответа
C#

+1 ещё

Простой
Как понять что я выучил основы C#?
- 1 подписчик
- 12 апр.
- 422 просмотра
4

ответа
C#

+1 ещё

Средний
Почему не работают миграции при переходе на новый csproj формат?
- 1 подписчик
- 12 апр.
- 53 просмотра
1

ответ
C#

Простой
Что означает оператор => в linq c#?
- 1 подписчик
- 12 апр.
- 128 просмотров
2

ответа
C#

+1 ещё

Простой
Почему некорректно работает параметр маршрутизатора Razor Pages?
- 1 подписчик
- 11 апр.
- 51 просмотр
1

ответ
C#

Простой
Как сделать чтобы приложение для win ce открывалось на весь экран?
- 1 подписчик
- 11 апр.
- 49 просмотров
1

ответ
C#

+3 ещё

Простой
Как решить проблему подключения БД к WPF проекту?
- 1 подписчик
- 11 апр.
- 83 просмотра
2

ответа
C#

+2 ещё

Простой
Как настроить переход по ссылкам?
- 1 подписчик
- 11 апр.
- 62 просмотра
1

ответ
Показать ещё Загружается…

Разработчик C# (криптография)

Avanpost

от 200 000 ₽

Middle+ .Net(C#) developer

RateX

от 200 000 до 300 000 ₽

Middle C# developer

ЮГПА • Ростов-на-Дону

от 130 000 до 170 000 ₽

Менеджер по продажам в онлайн-школу

17 апр. 2024, в 00:48

35000 руб./за проект

Сделать картинки для слов

17 апр. 2024, в 00:13

800 руб./за проект

Разработка backend python+django

17 апр. 2024, в 00:06

240000 руб./за проект

Как вытащить строку "Hello Word" с помощью Regex

Никак, для этого существуют специальные инструменты.
Как распарсить HTML в .NET?

Я бы рекомендовал использовать AngleSharp

Answer 1 · 2019-01-21 23:29:26

Если у вас правильный html с закрывающимися тегами, то можно попробовать через XDocument или XElement
Условно, где-то так:

var xEl = XElement.Parse("<div style=\"font-family: 'Courier New', Courier, monospace; font-weight: normal\">Hello word</div>");
Console.WriteLine((string)xEl);

Там же можно воспользоваться XPath. Где-то так:

var xDoc = XDocument.Parse("<div><div class='c1'>c1</div><div class='c2'>c2</div><div class='c3'>c3</div></div>");

string xPath = "//div[@class='c1']";

foreach (var xElement in xDoc.XPathSelectElements(xPath))
{
	Console.WriteLine((string)xElement);
}

Answer 2 · 2019-01-22 07:03:45

для плохоопределенных html существует HTMLAgilityPack
CsQuery Fizzler (это я самкогдато пробовал) и полно альтернатив https://stackoverflow.com/questions/1065031/is-the...
при помощи Regex лудить html знать толк в извращениях

это все давно стандртные инструменты так как есть nuget

Answer 3 · 2019-01-24 01:24:08

Если действительно необходимо выполнить парсинг HTML при помощи регулярных выражений, то можно сделать так

string html = "<div style=\"font - family: 'Courier New', Courier, monospace; font - weight: normal; \">Hello word</div>";
Regex regex = new Regex("<div style=\"font - family: 'Courier New', Courier, monospace; font - weight: normal; \">(.*)<\\/div>");
string text = regex.Match(html).Groups[1].Value;

Парсинг html с помощью c# стандартных инструментов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт