Java, многопоточность, инициализация объектов и reordering — всегда ли нужно синхронизировать инициализацию?

Question

NikKotovski @NikKotovski

Java, многопоточность, инициализация объектов и reordering — всегда ли нужно синхронизировать инициализацию?

Java создаёт ссылку на инициализируемый объект до конструктора и до блоков инициализации. Данное обстоятельство позволяет изнутри этих блоков отдать ссылку на объект другому объекту и другому потоку с помощью слова this до того, как все полня будут инициализированы, если писать код неаккуратно - если сначала отдать ссылку, а потом инициализировать поля. А ещё логика работы Java позволяет виртуальной машине менять инструкции местами, поэтому даже если писать код аккуратно и передавать ссылку в коде после того, как там будет прописана вся инициализация, то это всё равно не защищает от передачи ссылки до инициализации полей, потому что JVM может выполнить код, осуществляющий передачу ссылки до того, как выполнится инициализация. В принципе с этим всё понятно.

Для меня вопрос состоит в том, может ли конструктор вернуть ссылку на себя вовне до того, как он инициализировался, если мы не используем слово this - то есть при обычной инициализации. И если да, то нельзя ли избежать этого с помощью создания метода, где объект будет инициализироваться, а потом возвращаться. Я перекопал весь интернет в поисках ответа, и как правило пишут о том, что такое возможно, и что оба варианта инициализации не являются потоково-безопасными. Проблема в том, что большая часть из ответов старые и логика синхронный работы с тех пор менялась раз или два. Более того, среди более свежих заметок по этой теме мне уже встречались обе точки зрения - и я не могу понять, то ли те несколько заметок, которые говорят, что это безопасно, ошибочны, то ли ошибается большинство, которое по инерции считает, что инициализация потоково-небезопасна.

Приведу конкретный пример того, о чём идёт речь. Пусть у нас есть переменная
MyClass m;
доступная для нескольких потоков. Если эта переменная не инициализирована, то один из потоков пытается её инициализировать
m = new MyClass();
Может ли переменная m начать указывать на какой-то объект, до того, как он будет инициализирован. Другими словами, может ли конструктор вернуть m ссылку на содержащий его объект, до того, как в нём выполнится весь код.

Допустим может. Тогда второй пример. Пусть у нас есть метод
MyClass creatMyClass() {
MyClass m = new MyClass();
return m;
}
Может ли данный метод вернуть m, которая будет не до конца инициализирована?

При этом я понимаю, что даже если примеры кода потоков безопасны, то всё-равно придётся делать какую-то синхронизацию, иначе один поток может создать объект, поработать в нём, а потом другой поток создаст новый объект и изменения первого потока не сохранятся. Конкретнее, пусть у нас есть такой код:
volatile MyClass m;
if (m == null) m = createMyClass();
В этом случае возможен сценарий один поток читает m и видит null, второй поток читает m и видит null, потом они оба начинают создавать по объекту, потом поток, первым создавший объект успевает в нём что-то поменять, а потом отстающий поток заменяет объект на другой, в результате чего изменения первого потока сбрасываются.
Однако в зависимости от логики работы, во-первых, имеется разная цена ошибки в коде, а во-вторых, потенциально можно обойтись атомарной переменной вместо полновесного замка.

Т.о. вот конкретный вопрос - может ли в первых двух примерах (кода) переменная m содержать ссылку на объект с недоинициализированными полями, если m не volatile? И если да, то поможет ли volatile избежать проблемы?

Вопрос задан более трёх лет назад
391 просмотр

7 комментариев

Подписаться 1 Средний 7 комментариев

EVGENY T. @Beshere

Может, завести в MyClass переменную под флаг окончания инициализации, ставить туда true, когда объект готов. И проверять сначала сам объект на null, а потом этот флаг.

А вообще для того и придуманы средства Java для асинхронной работы, чтобы описанная вами проблема не возникла. Есть экспериментальные данные, что они в данным случае не срабатывают?

Написано более трёх лет назад
NikKotovski @NikKotovski Автор вопроса

Можно, но это опять же потребует синхронизации, потому что иначе опять же нет никаких гарантий, что флаг поднимется до того, как будут проинициализорованны все остальные поля. В этом случае опять же проще синхронизировать само создание в коде.

С экспериментальными данными тяжело, потому что на одной системе оно может сработать, а на другой нет. Даже банальный reordering довольно тяжело поймать. Хоть тут у нас получается гонка, её поймать попроще. Но опять же, если мы её увидим - всё будет сразу ясно, а вот если нет, то тут уже результат будет неоднозначный.
Тем не менее проблема описанная в 3м примере точно имеет место быть, про второй и третий пример в интернете же написаны десятки, если не сотни статей и заметок, например:
www.cs.umd.edu/~pugh/java/memoryModel/DoubleChecke...
https://en.wikipedia.org/wiki/Double-checked_locki...

Ну и мой вопрос немного о другом. Как я понимаю создание объекта в Java идёт в 2 этапа - сначала генерируется ссылка на объект и записывается в переменную, потом уже выполняется сам конструтор, и это считается двумя отдельными операциями, поэтому между ними может влезть другой поток. Меня же интересует так ли это и можно ли эту проблему обойти созданием метода или ключевым словом volatile, потому что пошагово объяснения механизма проблемы я нигде найти так и не смог. Т.е. проблема описано много где, но подробно почему она возникает почему-то не расписывает никто. Это кстати, ведёт к другой проблеме: т.к. механизм нигде не расписан (ну или по крайней мере не гуглится), то каждый начинает понимать проблемы синхронной инициализации по-своему, и появляется много статей и ответов на stackoverflow, которые противоречат друг другу и тем вещам, которые я смог расписать.

Написано более трёх лет назад
MaxLich @MaxLich

может ли конструктор вернуть ссылку на себя вовне

не может, потому что это не функциональное программирование, а ООП. Ссылки могут быть только на объекты. После выполнения тела конструктора в точке создания объекта возвращается ссылка на созданный объект.

Написано более трёх лет назад
NikKotovski @NikKotovski Автор вопроса

MaxLich, Боюсь, вы неправы. Java позволяет компилятору отдать вовне ссылку на созданный, но не инициализированный объект до того, как в нём выполнится код в конструкторе и блоках инициализации. Гарантированно до отдачи ссылки в нём будут инициализированы только поля с пометкой final.

Но ваш комментарий дважды неверный, потому что абзацом выше я описал, как можно отдать вручную ссылку вовне с помощью слова this. Вы же пишете, что отдача ссылки невозможна, пока конструктор не завершит работу. Ну как так-то?

Написано более трёх лет назад
MaxLich @MaxLich

NikKotovski, прочтите внимательно то что я написал. Или Вы ошиблись, и это было адресовано не мне???

Написано более трёх лет назад
NikKotovski @NikKotovski Автор вопроса

MaxLich, вы наверное не в курсе, но когда вы комментируете чью-то записть, то человеку автоматом на почту уходит копия ответа. Так что редактирование своего ответа не помогло вам ничего скрыть, скорее наоборот.

Ну и нет, я не ошибался с адресатом - сообщение было предназначено именно вам.

Написано более трёх лет назад
MaxLich @MaxLich

NikKotovski, Хорошо, и где у меня написано про инициализацию и конструктор?

Написано более трёх лет назад

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

3 комментария

NikKotovski @NikKotovski Автор вопроса

Подумайте сами, как может конструктор отработать на половину?

Мммммммм, никто и не говорил, что конструктор может отрбать наполовину. Речь о том, что он может передать ссылку на объект вовне до того, как пройдёт инициализация полей. Память под них конечно уже будет выделена, просто значения будут по-умолчанию. И конструктор также отработает полностью, никакой половинчатости, просто ссылка уже будет в наличии.
Такое поведение либо напрямую описанно во всех статьях об инициализации объектов, которые я встречал, либо следует из них. Например тут прямым текстом:
www.cs.umd.edu/~pugh/java/memoryModel/DoubleChecke...
https://stackoverflow.com/questions/39393522/synch...

Конечно с дуру можно и член сломать, но зачем Вам в конструкторе передавать указатель на себя еще куда-то?

Ну например если у меня есть статический список или map со всем экземплярами данного класса, объявленный внутри этого же класса. Но вопрос не об этом совершенно - о this в конструкторе я как раз написал, чтобы было понятно, что я не имею в виду описанную bad practice.

По Вашему примеру рождается вопрос, не идет ли речь про Singleton? Если да, то 2 из 4 способов реализации этого паттерна описанные в книге Джошуа Блоха потокобезопасные.

Да, по сути вопрос не сильно отличается от реализации Singleton. Но я как раз и пытаюсь понять, почему он реализован именно так, а не иначе. К тому же когда была написана эта книга, потому что:
Проблема в том, что большая часть из ответов старые и логика синхронный работы с тех пор менялась раз или два. Более того, среди более свежих заметок по этой теме мне уже встречались обе точки зрения - и я не могу понять, то ли те несколько заметок, которые говорят, что это безопасно, ошибочны, то ли ошибается большинство, которое по инерции считает, что инициализация потоково-небезопасна.

Суть volatile в том, что Вы говорите не кешировать это значение в процессоре, а всегда спускаться в память

Да, я знаю как работает volatile. Более того вы не правы насчёт атомарности. Volatile ГАРАНТИРУЕТ, что чтение и запись в переменную будут атомарными,
https://stackoverflow.com/a/3038233
А с версии 1.5 также ещё влияет на код вокруг. Например запись в volatile также гарантирует, что при чтении и записи в выражений, прописанных в блоке до неё, не будет меняться порядок.

Проблема в том, что JVM, как я понимаю, сначала создаёт ссылку на объект и помещает её в переменную, потом же выполняет код в конструкторе и блоках инициализации. Вопрос в том, считается ли это одной операцией или нет. Как мне кажется - нет, и volatile тут никак не поможет. Но я не могу быть уверен.

Написано более трёх лет назад
Андрей К @kuftachev
Более того вы не правы насчёт атомарности.

Спасибо за информацию, интересно!

Проблема в том, что JVM, как я понимаю, сначала создаёт ссылку на объект и помещает её в переменную, потом же выполняет код в конструкторе и блоках инициализации.

Вы имеете ввиду this? По идее, во внешний мир это вернется после конструктора.

Publishing internal state variables can compromise encapsulation and make it more difficult to preserve invariants; publishing objects before they are fully constructed can compromise thread safety.

A final mechanism by which an object or its internal state can be published is to publish an inner class instance, as shown in ThisEscape in Listing 3.7. When ThisEscape publishes the EventListener , it implicitly publishes the enclosing ThisEscape instance as well, because inner class instances contain a hidden reference to the enclosing instance.

public class ThisEscape { public ThisEscape(EventSource source) { source.registerListener( new EventListener() { public void onEvent(Event e) { doSomething(e); } }); } }

If you are tempted to register an event listener or start a thread from a constructor, you can avoid the improper construction by using a private constructor and a public factory method, as shown in SafeListener in Listing 3.8.

public class SafeListener { private final EventListener listener; private SafeListener() { listener = new EventListener() { public void onEvent(Event e) { doSomething(e); } }; } public static SafeListener newInstance(EventSource source) { SafeListener safe = new SafeListener(); source.registerListener(safe.listener); return safe; } }

Если это приблизительно то, что имелось ввиду, то нужно читать Java Concurency In Practice, там авторы и основные исполнители JMM, при этом, я так понимаю, что пока ничего особо не менялось c ее принятия.
Написано более трёх лет назад
NikKotovski @NikKotovski Автор вопроса

Вы имеете ввиду this? По идее, во внешний мир это вернется после конструктора.

Да, я говорю о возврате во внешний мир. Да, я тоже думал, что ссылка вернётся только после выполнения кода в конструкторе, но большая часть статей/гайдов говорит об обратном. Вот цитата из ссылки, которую я вам дал, например:
The most obvious reason it doesn't work it that the writes that initialize the Helper object and the write to the helper field can be done or perceived out of order. Thus, a thread which invokes getHelper() could see a non-null reference to a helper object, but see the default values for fields of the helper object, rather than the values set in the constructor.

helper - это название как раз внешней переменной в данном там примере.
Первые пару дней это тоже вызывало у меня когнитивный диссонанс, но сейчас как-то улеглось и хотелось бы разобраться в конкретных механизмах работы - например что будет, если сделать переменную volatile.

За название книги спасибо - попробую поискать там.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Android

+3 ещё

Средний
Как получить разрешение для автостарта (чтобы при старте оно загружалось) для приложения под Андройд (Android)?
- 1 подписчик
- вчера
- 58 просмотров
0

ответов
Java

Простой
Как сделать глобальный чат Chatty?
- 1 подписчик
- 20 апр.
- 69 просмотров
0

ответов
Java

+2 ещё

Простой
Selenide + Spring Boot. Как объявить страницу через метод open(), если класс страницы является bean?
- 1 подписчик
- 19 апр.
- 41 просмотр
0

ответов
Java

+1 ещё

Простой
Почему не видит WebSecurityConfigurerAdapter при попытке импортировать его в класс SecurityConfig?
- 1 подписчик
- 19 апр.
- 59 просмотров
1

ответ
Java

Простой
Почему происходит два пустых вывода при чтении с клавиатуры?
- 1 подписчик
- 19 апр.
- 48 просмотров
1

ответ
Java

+3 ещё

Средний
Пытаюсь подключиться к postgresql 16 через docker-compose, использую spring-boot 3.2.4, что не так?
- 1 подписчик
- 17 апр.
- 197 просмотров
3

ответа
Java

+1 ещё

Простой
Как правильно внедрять зависимости в классы, зависящие от не-бинов?
- 1 подписчик
- 16 апр.
- 71 просмотр
1

ответ
Python

+1 ещё

Простой
Возможно ли соединить работающий java код и так же работающий скрипт python?
- 1 подписчик
- 15 апр.
- 226 просмотров
3

ответа
Java

+2 ещё

Простой
Как заставить Tomcat работать c utf-8 и кириллицей?
- 1 подписчик
- 14 апр.
- 65 просмотров
0

ответов
Java

+2 ещё

Простой
Как правильно вывести подблок с данными на странице?
- 1 подписчик
- 14 апр.
- 30 просмотров
1

ответ
Показать ещё Загружается…

Lead Java

Bell Integrator • Ульяновск

До 400 000 ₽

Lead Java

Bell Integrator • Хабаровск

До 400 000 ₽

Java-разработчик

ДАЛЕЕ

от 200 000 ₽

Настроить перехват https-трафика для android-приложения

25 апр. 2024, в 01:02

10000 руб./за проект

Программа (скрипт) для автоматизации торговли Solana

25 апр. 2024, в 00:45

100 руб./в час

Телеграм-Бот для выдачи конфигов VPN (VLESS/Reality)

25 апр. 2024, в 00:32

10000 руб./за проект

Может, завести в MyClass переменную под флаг окончания инициализации, ставить туда true, когда объект готов. И проверять сначала сам объект на null, а потом этот флаг.

А вообще для того и придуманы средства Java для асинхронной работы, чтобы описанная вами проблема не возникла. Есть экспериментальные данные, что они в данным случае не срабатывают?
может ли конструктор вернуть ссылку на себя вовне

не может, потому что это не функциональное программирование, а ООП. Ссылки могут быть только на объекты. После выполнения тела конструктора в точке создания объекта возвращается ссылка на созданный объект.
MaxLich, Боюсь, вы неправы. Java позволяет компилятору отдать вовне ссылку на созданный, но не инициализированный объект до того, как в нём выполнится код в конструкторе и блоках инициализации. Гарантированно до отдачи ссылки в нём будут инициализированы только поля с пометкой final.

Но ваш комментарий дважды неверный, потому что абзацом выше я описал, как можно отдать вручную ссылку вовне с помощью слова this. Вы же пишете, что отдача ссылки невозможна, пока конструктор не завершит работу. Ну как так-то?
NikKotovski, прочтите внимательно то что я написал. Или Вы ошиблись, и это было адресовано не мне???
MaxLich, вы наверное не в курсе, но когда вы комментируете чью-то записть, то человеку автоматом на почту уходит копия ответа. Так что редактирование своего ответа не помогло вам ничего скрыть, скорее наоборот.

Ну и нет, я не ошибался с адресатом - сообщение было предназначено именно вам.
NikKotovski, Хорошо, и где у меня написано про инициализацию и конструктор?

Answer 1 · 2018-08-02 09:53:54

Почитав ещё какое-то время о вопросе и подробнее разобрав некоторые статьи, я разобрал вопрос, и могу дать на него ответ самостоятельно. Проще всего разобрать его на статье из Википедии:
https://en.wikipedia.org/wiki/Double-checked_locki...

Статья говорит, что

Due to the semantics of some programming languages, the code generated by the compiler is allowed to update the shared variable to point to a partially constructed object before A has finished performing the initialization. For example, in Java if a call to a constructor has been inlined then the shared variable may immediately be updated once the storage has been allocated but before the inlined constructor initializes the object.

То есть JVM и правда может отдать ссылку на объект вовне до того, как пройдёт инициализация его полей и будет выполнен код в блоках инициализации и конструкторе. Более того

One of the dangers of using double-checked locking in J2SE 1.4 (and earlier versions) is that it will often appear to work: it is not easy to distinguish between a correct implementation of the technique and one that has subtle problems. Depending on the compiler, the interleaving of threads by the scheduler and the nature of other concurrent system activity, failures resulting from an incorrect implementation of double-checked locking may only occur intermittently. Reproducing the failures can be difficult.

Т.о., как говорит статья, передача ссылки на созданный, но неинициализированный, объект хоть и возможна, но происходит не так уж и часто, и код, не учитывающий его, может работать очень долго без ошибок. Что делает проблему только опасней.

Теперь что касается volatile. Объявление переменной volatile и правда гарантирует, что другие потоки не получат доступа к недоинициализированной переменной во время создания объекта. Т.е. переменная будет просто заблокирована для других потоков пока объект не проинициализируется. Это значит, что при потоково-безопасной инициализации объекта таки можно в теории обойтись атомарной переменной вместо замка. Но это пока неточно. В ближайшее время я разберу этот момент и смогу дать уже стопроцентный ответ.

Что касается вопроса про метод, создающий объект, то нет, данный метод не может вернуть недоинициализированный объект. Т.е. в переменную может попасть ссылка на недоинициализированный объект, но пока не пройдёт инициализация код дальше в данном потоке выполняться не будет. Т.о. return вернёт уже ссылку на полностью готовый объект, потому что m локальная переменная и хранится строго внутри самого потока, и никто к ней не получит доступ, пока она не инициализируется полностью.

Ну и ещё одна вещь, которая следует из всего сказанного выше: если вам нужно гарантированное создание объекта, который точно будет доинициализирован, когда к нему обратится другой поток, но вы не хотите использовать синхронизаций или volatile и готовы пожертвовать частью сделанных в нём изменений, то можно просто сделать так:
if (m == null) {
MyClass n = new MyClass();
m = n;
}
В этом случае сначала класс инициализируется в локальной переменной, а потом уже спокойно будет передан общей переменной. Но, ещё раз, от создания нескольких объектов и потери изменений этот метод не убережёт.

Answer 2 · 2018-08-01 10:24:58

Подумайте сами, как может конструктор отработать на половину? Он же вернет ссылку на результат своей работы вызываемому коду когда исполнится весь. Конечно с дуру можно и член сломать, но зачем Вам в конструкторе передавать указатель на себя еще куда-то?
По Вашему примеру рождается вопрос, не идет ли речь про Singleton? Если да, то 2 из 4 способов реализации этого паттерна описанные в книге Джошуа Блоха потокобезопасные.

P.S. Суть volatile в том, что Вы говорите не кешировать это значение в процессоре, а всегда спускаться в память (кстати, тут я не знаю, если в системе один процессор Intel, у них в отличии от AMD кеш третьего уровня общий, будет ли использован он или все равно только память), чтобы работать со свежим значением. Без этого два ядра могут долго работать со своими значениями, но вот атомарность записи этого значения не гарантируется. То есть, например int будет атомарно меняться, а вот long уже нет. Поэтому, на счет ссылок не уверен, они вроде бы тоже 64 бита, по идее, они тоже должны быть не атомарны, но может там другая защита, а то создадим два объекта и получим ссылку непонятно куда.

Java, многопоточность, инициализация объектов и reordering — всегда ли нужно синхронизировать инициализацию?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт