import lxml.html
data = '''<HTML>
<TiTLE>Книга пророка Авдия</TiTLE>
...
</BODY>
</HTML>
'''
html = lxml.html.fromstring(data)
print(html.xpath('//title')[0].text)
for line in html.xpath('//p'):
print(line.text)
Книга пророка Авдия
1 Видение Авдия. Так говорит Господь Бог об Едоме: весть услышали мы от Господа, и посол послан
2 Вот, Я сделал тебя малым между народами, и ты в большом презрении.
3 Гордость сердца твоего обольстила тебя; ты живешь в расселинах скал, на возвышенном месте, и говоришь в сердце твоем: "кто низринет меня на землю?"
4 Но хотя бы ты, как орел, поднялся высоко и среди звезд устроил гнездо твое, то и оттуда Я низрину тебя, говорит Господь.
5 Не воры ли приходили к тебе? не ночные ли грабители, что ты так разорен? Но они украли бы столько, сколько надобно им. Если бы проникли к тебе обиратели винограда, то и они разве не оставили бы несколько ягод?
6 Как обобрано все у Исава и обысканы тайники его!
7 До границы выпроводят тебя все союзники твои, обманут тебя, одолеют тебя живущие с тобою в мире, ядущие хлеб твой нанесут тебе удар. Нет в нем смысла!
...
знаю только его айпи, в данном случае 1.1.1.1
data = '''
Сервер: test3.com
Address: 3.3.3.3
Сервер: test.test2.com
Address: 2.2.2.2
Имя: test2.test.ru
Address: 1.1.1.1
'''
parsed = [x.split(':') for x in filter(lambda x:any([
x.startswith('Сервер:'),
x.startswith('Имя:'),
x.startswith('Address:')
]), data.split('\n'))]
servers = dict([(x[1][1].strip(), x[0][1].strip()) for x in zip(parsed[::2], parsed[1::2])])
servers['1.1.1.1']
# 'test2.test.ru'
cat data.txt | awk '{ print $1; }' | sort | uniq -c | grep -v -E "^\s+1\s+"
3 +375291045612
2 +375299990999
cat 1.txt | awk '{ print $1; }' | sort | uniq -c | grep -v -E "^\s+1\s+" | awk '{ print $2; }'
text = '''
Version: V3
Subject: CN=Фамилия Имя Отчество, SURNAME=Фамилия, GIVENNAME=Имя Отчество, C=RU, ST=23 Регион, L=Город, STREET=ул. улица д. 00, OID.0.0.000.000.0=#00000000000000000000000000, OID.0.0.000.000.0=#00000000000000000000000000, EMAILADDRESS=email@gmail.com, OID.0.0.000.000.0=#00000000000000000000000000
Signature Algorithm: 0.0.000.0.0.0.0.0, OID = 0.0.000.0.0.0.0.0
...не нужные данные...
Validity: [From: Thu Oct 10 09:45:58 MSK 2019,
To: Sat Oct 10 09:55:58 MSK 2020]
Issuer: CN="ООО \"РОГА И КОПЫТА\"", O="ООО \"РОГА И КОПЫТА\"", STREET=ул. улица д. 00, L=Город, ST=23 Регион, C=RU, OID.0.0.000.000.0=#00000000000000000000000000, OID.0.0.000.000.0=#00000000000000000000000000, EMAILADDRESS=email@gmail.com
SerialNumber: [ 00000000 00000000 0000]
...не нужные данные...
'''
for line in text.split('\n'):
if 'Subject' in line:
a = [x.split('=') for x in line.split(':')[1].split(',')]
data = dict(zip([x[0].strip() for x in a], [x[1].strip() for x in a]))
print('CN> ', data['CN'])
print('SURNAME> ', data['SURNAME'])
var str1 = "M1,60 0,0,7.332538412e-8,-90"
str1.split(' ')[0] + ' ' + str1.split(' ')[1].split(',').map(function(item){return parseFloat(item).toFixed(2)}).join(',')
str1.split(' ')[0] + ' ' + str1.split(' ')[1].split(',').map(function(item){return parseFloat(item).toFixed(0)}).join(',')
import re
str1 = """Высшая математика, дополнительные главы высшей математики, Численные методы, Дополнительные главы высшей математики, Дополнительные главы по численным методам, Дополнительные главы математического анализа, Теория упругости, Профессиональная практика, Преддипломная практика, Научно-исследовательская практика"""
re.findall(r'[А-Я]?[^А-Я]*', str1)
>>> str1 = "fName: Vasya, sName: Petrov, Desc: worker, fName: Dina, sName: Egorova, Desc: engineer, worker"
>>> for im in zip(re.findall(r'(\w+):', str1), [x for x in re.split(r'\w+:', str1) if x]):print(im)
...
('fName', ' Vasya, ')
('sName', ' Petrov, ')
('Desc', ' worker, ')
('fName', ' Dina, ')
('sName', ' Egorova, ')
('Desc', ' engineer, worker')
>>> for im in zip(re.findall(r'(\w+:)', str1), [x.strip() for x in re.split(r'\w+:', str1) if x]):print(' '.join(im))
...
fName: Vasya,
sName: Petrov,
Desc: worker,
fName: Dina,
sName: Egorova,
Desc: engineer, worker
>>> import lxml.html
>>> str1 = """
... <tr>
... <td>99</td>
... <td>Name</td>
... <td>ЕГЭ</td>
... <td>268</td><td>90</td><td>91</td><td>87</td>
... <td></td>
... <td>Копия</td>
... <td>Нет</td>
... </tr>"""
>>> root = lxml.html.fromstring(str1)
>>> [x.text for x in root.xpath('.//td')]
['99', 'Name', 'ЕГЭ', '268', '90', '91', '87', None, 'Копия', 'Нет']
import os
from selenium import webdriver
DRIVER_PATH = os.path.join('c:\\', 'utils', 'chromedriver.exe')
options = webdriver.ChromeOptions()
options.add_argument('headless')
options.add_argument('start-maximized')
options.add_argument('window-size=2048x5000')
browser = webdriver.Chrome(executable_path=DRIVER_PATH, options=options)
browser.get('https://lime-shop.ru/shops/moskva/')
browser.implicitly_wait(10)
for el in browser.find_elements_by_xpath("//div[@class='shops__place']"):
print(el.text)
print('-' * 30)