Как низкоуровневый код использующий стек узнает откуда он начинается?

Question

6y6eH4uk @6y6eH4uk

Как низкоуровневый код использующий стек узнает откуда он начинается?

Когда операционная система запускает процесс, она выделяет ему память под стек, но как низкоуровневый код узнает начальный адрес стека?

Если взять за основу эту схему, то становится понятно, как код процесса может узнать адреса текста, инициализированных данных, неинициализированных данных и кучи (просто прибавлять кол-во выделенной с помощью системных вызовов памяти к концу BSS). Однако, не ясно, как становится известен адрес стека и аргументов командной строки.

Если немного пораскинуть мозгами, то самый логичный ответ на этот вопрос - при запуске процесса ОС сама настраивает (думаю, что в данном примере не важно какая именно ОС, но я отталкиваю от примера linux) регистры стека на нужные значения, однако у меня нет опыта программирования на ассемблере (только теория), а все источники, которые я читал явно на это не указывают, поэтому я не могу быть уверен в этом предположении. Ну и если следовать этому предположению, то и адреса аргументов командной строки можно узнать отсчитав их от адреса стека.

Если все мои догадки верны, то хотелось бы получить утвердительный ответ от точно знающих это людей, если же используется другой способ, то хотелось бы получить подробное его описание.

Вопрос задан более трёх лет назад
453 просмотра

Комментировать

Подписаться 2 Простой Комментировать

Решения вопроса 2

Комментировать

Пригласить эксперта

Ответы на вопрос 1

4 комментария

6y6eH4uk @6y6eH4uk Автор вопроса

Подготовка - да. Но стек должен активно использоваться самой программой и ее текстом включительно. Как эта самая программа знает откуда начинается стек? Он автоматически устанавливается в регистр стека?

Я предположил, что каждому процессу формально выделяется все виртуальное адресное пространство, которое только может быть, но фактически выделяется только явно инициализированное пространство (сегменты текста и данных) и если код будет пытаться получать доступ к другим виртуальным адресам, то будет ошибка доступа. Именно по этой причине программа для динамического выделения памяти в куче должна явно совершать системный вызов с виртуальным адресом до которого должна расшириться куча. Однако, стек является уникальной структурой данных, адреса для которого ОС выделяет сама и автоматически. Так вот, логично предположить, что на момент старта программы ОС формально выделяет адреса для стека согласно его максимальному размеру, а также какую-то часть этого пространства выделяет фактически, с него и начинает расти стек и если он выйдет за пределы фактически выделенной памяти в формально выделенную, то стек расширится. Но как программа узнает откуда начинается тот самый начальный адрес стека?

Написано более трёх лет назад
freeExec @freeExec

6y6eH4uk, Ниоткуда, ей вообще не надо ни чего про него знать. Она работает относительно его вершины и пофиг где он там расположен и кто установил значения в регистр стека. Примерно как пассажир в автобусе, его не заботит откуда в нём бензин взялся, но он знает, что его довезут от точки А до Б.

Написано более трёх лет назад
6y6eH4uk @6y6eH4uk Автор вопроса

freeExec, Если бы для уровня машинного кода или ассемблера были актуальны высокоуровневые абстракции и инкапсуляция за которую вы мне говорите, то да, но значения регистров можно менять произвольно на любые значения, именно так работает раскрутка стека, к примеру. И здесь возникает проблема, ведь если в регистр стека поместить адреса не из пространства выделенного ОС для стека, то и расширять эти адреса ОС автоматически не будет, регистр стека фактически станет обычным регистром. Из вашего ответа косвенно стало ясно, что ОС сама назначает адрес стека в регистр, как я и предполагал и именно об этом был вопрос.

Написано более трёх лет назад
freeExec @freeExec

6y6eH4uk, Да, именно так. Я видел такие финты ушами, когда программа выделяла себе десятки мегабайт памяти, переносила туда стек и делала свои тёмные дела.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Linux

+1 ещё

Простой
Хочу заняться графической оболочкой для линукс. Есть ли какая-нибудь база дистрибутива?
- 1 подписчик
- 37 минут назад
- 30 просмотров
1

ответ
Linux

Средний
Linux на SSD рядом с Win10, на внешний HDD или виртуализация?
- 1 подписчик
- 10 часов назад
- 122 просмотра
6

ответов
Linux

+1 ещё

Простой
Что делать, если пишет «error: unknown filesystem Enering rescue mode... grub rescue>»?
- 1 подписчик
- 21 час назад
- 102 просмотра
2

ответа
Linux

+3 ещё

Простой
Как вернуть обратно gnome 44 в Kali linux?
- 1 подписчик
- 22 часа назад
- 66 просмотров
0

ответов
Linux

+1 ещё

Средний
Astra Linux — как избавиться от шума в HDD?
- 2 подписчика
- вчера
- 325 просмотров
4

ответа
Assembler

Простой
Почему не работает подсчёт произведения элементов массива masm32(ассемблер)?
- 1 подписчик
- вчера
- 26 просмотров
1

ответ
Linux

+2 ещё

Простой
Что выбрать для проекта Windows Embedded или Linux?
- 1 подписчик
- вчера
- 164 просмотра
4

ответа
Linux

+1 ещё

Средний
Как переименовать файлы и папки с одинаковым именем, но разным регистром?
- 1 подписчик
- вчера
- 109 просмотров
0

ответов
Linux

Простой
Почему не отрабатывает REISUB?
- 1 подписчик
- вчера
- 67 просмотров
1

ответ
Linux

+1 ещё

Средний
Как выглядят данные об авторизации linux?
- 1 подписчик
- вчера
- 159 просмотров
2

ответа
Показать ещё Загружается…

Программист C для Embedded Linux

Radiofid • Санкт-Петербург

от 120 000 до 180 000 ₽

Linux Администратор DevOps

ИМАГ • Москва

от 150 000 до 170 000 ₽

Программист C/C++ embedded Linux

РТК Автоматика • Москва

от 170 000 до 250 000 ₽

Расработка Парсер для сайта https://soliq.uz/activities/debtor

19 апр. 2024, в 19:51

3000 руб./за проект

Два скрипта, Python, web3.py, вызов функции смарт-конракта

19 апр. 2024, в 19:47

50000 руб./за проект

Сделать дизайн главной страницы сайта

19 апр. 2024, в 19:17

1500 руб./за проект

Answer 1 · 2019-06-16 22:28:54

Если взять за основу эту схему, то становится понятно, как код процесса может узнать адреса текста, инициализированных данных, неинициализированных данных

Если мы говорим про обычные (не PIE) исполняемые ELF-файлы, то они слинкованы под конкретный адрес куда они будут загружены, и все адреса внутри одного исполняемого файла посчитаны заранее. Поэтому загрузка адреса функции или пременной в секции данных -- это просто загрузка константы в регистр.

и кучи

С кучей всё по-другому, потому что куча и объекты в ней полностью динамические. Выделение памяти для кучи -- это всегда системный вызов, который возвращает адрес выделенной памяти (и sbrk, и mmap).

не ясно, как становится известен адрес стека и аргументов командной строки

они инициализируются ядром ОС, согласно ABI, см. например, ABI x86_64, раздел 3.4.1.

Answer 2 · 2019-06-17 00:53:18

Обычно для работы со стеком процессор использует регистр стека (Stack Pointer register).

Следовательно операционная система устанавливает этот регистр для процесса при его запуске и инициализации.
В современных процессорах регистров стека может быть несколько (я могу ошибаться, но возможно даже несколько на каждое ядро).

Answer 3 · 2019-06-16 19:15:47

Странно, что у вас возник вопрос по поводу стека, не не как процесс начинает свою работу именно с нужного адреса, а не абы откуда? Многое эти настройки хранятся в заголовках исполняемых файлов: и размер стека и адрес точки входа и какие библиотеки и куда их загрузить. И всеми этими подготовками занимается загрузчик в ОС.

Как низкоуровневый код использующий стек узнает откуда он начинается?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт